СОВРЕМЕННЫЕ ЦИФРОВЫЕ ТЕХНОЛОГИИ ПОВЫШЕНИЕ КАЧЕСТВА ЗВУКОВОГО СИГНАЛА В КАНАЛАХ СВЯЗИ И НА ФОНОГРАММАХ Г.Зубов, С.Коваль «Центр речевых технологий», Санкт-Петербург zubov/[email protected] Записанный или передаваемый с помощью различных технических средств звуковой сигнал в той или иной степени отличается от исходного, оригинального. В этом мог убедиться каждый, кому приходилось заниматься видео- звукозаписью, пользоваться телефонной или радиосвязью. Такое отличие объясняется присутствием в записанном или передаваемом по каналам связи звуковом сигнале шумов и искажений, а также особенностями нашего слуха. Когда полезный сигнал оказывается в значительной степени искажен или замаскирован помехой и отличие исходного звукового сигнала от записанного или прослушиваемого становится недопустимым, возникает необходимость в проведении его специальной обработки, которую принято называть шумоочисткой. Высокая распространенность бытовых и специальных средств звукозаписи и связи, а также значительное количество старых архивных фонограмм обуславливает большой интерес к программным и аппаратным средствам шумоочистки. Не случайно сегодня практически во всех широко распространенных звуковых редакторах (CoolEdit, WaveLab, DartPro и им подобных) предусмотрен некий «джентльменский» набор не требующих тонкой настройки средств шумоочистки. Но их эффективность явно недостаточна для обработки реальных, а не специально подобранных для демонстрации сигналов. И даже значительная стоимость подобных инструментов шумоочистки не является гарантией их высоких характеристик. Конечно, на рынке есть и специализированные, профессиональные средства шумоочистки, позволяющие получить действительно высокие результаты на сигналах низкого качества, в том числе, в режиме реального времени. При этом устройства такого рода достаточно дороги и требуют профессиональных навыков и специальных знаний, не говоря уже о значительных трудозатратах. Поэтому как у любителей звукозаписи, так и у профессиональных реставраторов преобладает скепсис и неверие в возможности современных цифровых технологий обработки звука, возникающие в результате неумения и нежелания переходить на путь использования новых технологий. С сожалением нам пришлось убедиться в том, что в среде реставраторов зачастую используются недопустимый подход к оценке сигнала: нравится – не нравится; лучше – хуже, например, «звук после аналогового эквалайзера лучше, чем после цифрового». При том, что давно существую объективные способы оценки параметров звукового сигнала, уровня шумов и искажений. Доводилось слышать и такое – «я делаю звук (голос) на фонограмме максимально похожим на тот, что я слышал двадцать или тридцать лет назад на концерте этого исполнителя» или и т.п. Совершенно не учитывается тот факт, что свойства слуха, в особенности его чувствительность к различным частотам существенно меняется с годами, а в наших архивах работают далеко не молодые люди. Выход здесь один – использовать в работе аудиореставратора новейшие цифровые технологии обработки звука, опираясь при этом на объективные параметры сигнала, которые можно сегодня контролировать с большой точностью. Такие технологии существуют и их эффективность несопоставимо выше эффективности любого аналогового устройства. Например, кто-нибудь когда-нибудь видел аналоговый эквалайзер с 8 тысячами полос и глубиной регулирования 90 дБ, а цифровой – есть; или попробуйте найти аналоговое устройство, способное компенсировать нелинейные искажения или подавлять мощные амплитудные выбросы? Конечно же, к выбору цифровой системы нужно подходить весьма осторожно и предварительно убедиться в ее реальных возможностях. Усилиями специалистов Центра Речевых Технологий удалось перевести шумоочистку из области искусства и субъективных оценок в русло современных технологий, совместить в одном программном продукте интуитивную прозрачность, высокую эффективность для неопытного пользователя, и, в то же время, предоставить профессионалу возможность свободного построения собственных процедур обработки сигнала с детальной, тонкой настройкой параметров. «Центр Речевых Технологий» на протяжении последних 10 лет остается признанным российским лидером и одним из мировых лидеров в разработке, внедрении и практическом использовании профессиональных средств цифровой записи, анализа и обработки звуковых (речевых) сигналов. Продукция с маркой ЦРТ-STC (Speech Technology Center) сегодня используются в Аргентине, Бельгии, Венгрии, Германии, Испании, Италии, США, Финляндии, во всех государствах СНГ и Балтии, многих других странах. SoundCleaner - уникальный программный продукт нового поколения средств шумоочистки и повышения качества звучания «живого» или записанного звукового сигнала, который воплощает в себе самые современные достижения ученых и многолетний опыт специалистовпрактиков из области аудиореставрации, связи, оперативной звукозаписи, криминалистики. В 2000 году программа SoundCleaner официально зарегистрирована Российским агентством по патентам и товарным знакам. Области применения аудиореставрация низкокачественных фонограмм, записанных в сложных акустических условиях (в т.ч. архивных фонодокументов); улучшение качества сигнала в каналах радио и телефонной связи; текстовая расшифровка низкокачественных фонограмм речи. Рис.1 Главное окно программы В левой части – схема обработки, в правой – окна модулей. Каждому модулю соответствует пиктограмма в схеме обработки. Возможна как автоматическая так и «ручная» настройка параметров обработки. ОТЛИЧИТЕЛЬНЫЕ СВОЙСТВА SOUND CLEANER Универсальность Для пользователей любого уровня подготовки Возможность использования автоматического (самонастраивающегося на помеху) режима фильтрации или задание всех параметров обработки «вручную» с возможностью их сохранения для повторного использования. Для любых помех и искажений SoundCleaner реально помогает в борьбе c абсолютным большинством встречающихся в повседневной жизни шумов и искажений звука. Это подтверждается десятками квалифицированных пользователей (например, специалистов по обработке фонограмм, полицейских и судебных экспертов), для которых использование SoundCleaner стало обязательной ежедневной практикой с неизменно положительным результатом. Типы устраняемых шумов и искажений Стационарные и медленно меняющиеся аддитивные многокомпонентные узкополосные (полигармонические) и широкополосные шумы, медленно меняющиеся амплитудно-частотные искажения (неравномерность АЧХ канала звукозаписи/звукопередачи), ограничение сигнала, кратковременные импульсные помехи, сильная неравномерность уровня сигнала. Аддитивные шумы любого типа при наличии двухканального потока аудиоинформации. Пользовательская спецификация Типовые шумы и искажения каналов звукозаписи, проводной и радиосвязи, шумы помещений, улицы, работающих механизмов, транспортных средств, бытовой техники, удаленный голосовой коктейль, медленная музыка, электромагнитные наводки систем питания, компьютерной и другой техники. Снижает эффект реверберации, низкокачественных микрофонов и магнитофонов. При двухканальном съеме информации существенно снижает влияние шумов любого типа. Модульность Программа представляет собой набор автономных модулей работы со звуком, объединяемых простой и компактной основной оболочкой. Каждый модуль имеет свою панель управления и обрабатывает звук по собственному алгоритму, после чего передает его на следующий модуль. В момент каждого обращения к программе в ней может быть задействовано любое число модулей, последовательно соединенных в схему обработки. Количество модулей, используемых в схеме обработки (одновременно), ограничено только вычислительными возможностями ПК. Всего 19 модулей: ввод звука со звуковой карты адаптивный фильтр или из файла; широкополосного шума; цифровой магнитофон с адаптивный инверсный возможность воспроизведения фильтр; в «кольце»; адаптивный компенсатор цифровой осциллограф (моно помех; и стерео); модуль динамической воспроизведение (стерео, обработки; псевдостерео, поканальное); мю-преобразование; запись результатов обработки фильтр импульсных помех; в файл; тэмпокоррекция; параметрический 8192 адаптивный временной полосный эквалайзер со стереокомпенсатор помех; встроенным адаптивный частотный спектроанализатором, стереофильтр (режимы инверсным фильтром, компенсация помех, удаление фильтром гармоник и фоновых шумов, выделение средствами ограничения полезного сигнала); полосы пропускания и усилитель; темброкоррекции; разветвитель; текстовый редактор. Сама структура программного пакета позволяет легко наращивать количество имеющихся в наборе типов фильтров-модулей, что обеспечивает долгую рабочую жизнь данной программы и возможность оптимального и поэтапного вложения денег в покупку только нужных модулей и их постоянного обновления. Только за один год существования программы количество фильтров-модулей удвоилось. Работа пользователя может протекать в рамках использования одной из готовых схем обработки звука, настроенных разработчиками для обработки наиболее типичных зашумленных и искаженных аудио сигналов: стандартная; сетевая наводка; сильные частотные искажения в канале записи; помехи радиосвязи; контраст громкости; шум бытовой техники; наводки и шумы в автомобиле; медленная музыкальная помеха; импульсные помехи и широкополосные шумы; тональный сигнал АТС; сильное шипение; шум воды; произвольные шумы (для стереосигнала) Каждая схема поддается корректировке. Можно, руководствуясь базовыми принципами шумоочистки, создать собственную схему с «нуля» и сохранить её для повторного применения. Работа в масштабе реального времени Результат обработки сигнала программой SoundCleaner можно не только слышать. Сигнал (до и после обработки) непрерывно отображаются в виде осциллограммы и мгновенного спектра Управление процессом осуществляется в масштабе реального времени: изменять настройки каждого модуля можно в любой момент, не прерывая воспроизведение, что очень важно для оперативного выбора параметров шумоочистки «на слух». Автоматическая настройка на помехи - адаптивность Большинство используемых в SoundCleaner фильтров являются адаптивными, то есть самонастраивающимися на максимальное устранение помехи при заданном уровне сохранности полезного сигнала. Это и обеспечивает высочайшую эффективность работы программы и простоту его использования. Работа на стандартном ПК со стандартной звуковой картой SoundCleaner работает под управлением ОС Windows на стандартном PC (начиная с Pentium II, Celeron / 64 Мb RAM) со стандартной Windows-совместимой звуковой картой. Для получения гарантированного высокого качества входного и выходного сигнала возможна поставка профессиональной звуковой карты STC H189. Уникальные возможности и основные преимущества перед конкурентной продукцией SoundCleaner включает в себя ряд уникальных фильтров-модулей (отсутствующих в таком виде в других средствах шумоочистки), эффективность работы которых находится на мировом уровне или превышает его. Для абсолютного большинства известных разработчикам и доступных примеров шумоочистки сильнозашумленных фонограмм изделиями других фирм результаты работы SoundCleaner лучше, или, по крайней мере, не хуже. Вы можете легко это проверить, используя примеры, представленные в Интернете на сайтах фирм-производителей. Естественно, SoundCleaner далеко не первый и не единственный программный продукт «Центра речевых технологий», предназначенный для шумоочистки звуковых сигналов. Для аудиореставраторов может представлять интерес программный пакет SIS, обладающий широчайшим набором средств анализа звуковых сигналов. Использование SIS и разработанных ЦРТ методик позволит существенно расширить круг задач, решаемых в процессе аудиореставрации. Становится возможным решение таких вопросов, как идентификация личности исполнителя по его голосу, установление подлинности фонограмм (отсутствие следов копирования, электронного и цифрового монтажа). На демонстрационном диске вы можете прослушать фрагменты фонограмм, обработанные с помощью программных пакетов SoundCleaner и SIS. Демо-версия программы SoundCleaner находится на нашем сайте www.speechpro.com