Загрузил Денис «Brinever» Солнцев

2. Основные аудиоформаты

реклама
Популярные форматы аудиофайлов и их особенности
Любой имеющий отношение к музыке человек знает, что в цифровом виде аудиофайлы хранятся в
нескольких популярных форматах. Но в тонкостях их различий разбирается не каждый, хотя это
понимание важно для работы с некоторыми сервисами по созданию, обработке и хранению музыки
на разных носителях.
В этой статье детально разбираемся в том, что представляют собой характеристики цифрового
звука, и рассказываем об особенностях основных аудиоформатов.
Магия оцифровки звука
Прежде всего вкртаце рассмотрим процесс оцифровки звука. Для этого используется модуль
аналого-цифрового преобразователя (АЦП), который конвертирует звуковой сигнал в цифровой
формат, используя методику импульсного кодирования. АЦП позволяет измерять амплитуду
сигнала: все изменения фиксируются и записываются, в результате чего получается цифровая копия
аналогового звука. Сам процесс преобразования в профессиональных кругах обозначается
понятием «дискретизация» (от латинского слова discretus, что значит «прерывистый»). Возникает
вопрос: какая частота дискретизации позволяет получать наиболее точную цифровую копию
аналогового звука?
Под частотой понимается количество измерений входного сигнала за 1 секунду и измеряется в
герцах (Гц). Одно измерение соответствует частоте в 1 Гц, тысячу измерений в секунду — 1
килогерц (кГц).
Порог слышимости звука для человеческого уха оценивается в 20 кГц — при дискретизации
минимум 40 000 раз в секунду получается сигнал, который не отличается от аналогового.
Важные понятия: частотность дискретизации и битрейт
В музыкальной индустрии наиболее популярны две частоты:

44.1 кГц — это частотный стандарт аудио для CD и для большинства цифровых записей
вообще. Некоторые меломаны задаются вопросом: почему стандарт равен не 40 кГц, а 44.1
кГц? На это повлияла история создания и появления компакт-дисков. В начале 80-х годов
прошлого века в качестве основного цифрового носителя использовалась магнитная
видеопленка: при записи она вмещала 60 кадров в секунду, при этом в кадре содержались
24 строки с выборкой из трех базовых цветов. Дальше действует простая арифметика —
перемножаем 245 на 60 и на 3 — получаем 44100 выборок. Таким образом, для
максимальной совместимости аудиоформата с магнитной пленкой решили выбрать и
соответствующую частоту дискретизации.
Девушка показывает компакт-диск Sony, купленный в отделе новинок музыкального магазина в
1982 году

48 кГц — этот стандарт звукозаписи пришел из киноиндустрии, где пленки при записи
использовали 24 кадра в секунду, а при синхронизации видео со звуком получается 48 кГц.
Стандарты 88.2 кГц, 96 кГц и 192 кГц — это увеличенные в два и в четыре раза частоты
дискретизации, используемые музыкантами при записи исходников в наилучшем качестве.
Например, при издании музыки в Super Audio CD (SACD) — формате
неперезаписываемого оптического аудиодиска.
Важную роль в музыкальной индустрии играет и понятие битрейта, под которым понимается объем
данных, уходящих на кодирование одной секунды звука. Битрейт рассчитывается по следующей
1
формуле: частота дискретизации х разрядность х количество каналов, где под разрядностью
понимается количество бит, используемых при кодировании отдельного отрезка аудиосигнала.
Иными словами, разрядность показывает точность фиксации каждого изменения при записи.
Битрейт записанной на компакт-диск музыки равен 1411,2 кбит/с, но при сжатии он куда меньше. К
примеру, максимум сжатия файлов формата MP3 составляет 320 кбит\с. Таким образом, суть
процесса сжатия аудио состоит в том, чтобы получить меньший размер битрейта за счет потери
минимальной части информации исходного сигнала, но при сохранении хорошего качества
звукового сигнала.
Казалось бы, процесс сжатия музыкальных файлов неизбежно приводит к потере в качестве
слышимого звукового сигнала, но это не совсем так. Методики сжатия основываются на физических
законах, связанных с несовершенством человеческого звука. При сжатии из аудио удаляются те
части сигнала, которые ухом не воспринимаются.
Тем не менее в музыкальной индустрии принято разделять форматы аудио на 3 группы — аудио без
сжатия, аудио со сжатием без потери качества и аудио со сжатием с потерями. Рассмотрим их по
отдельности.
В мире чистого звука: WAV/WAVE и Aiff
К группе аудиофайлов без сжатия относятся...
WAV/WAVE
Цифровой формат, который появился в далеком 1991 году для записи на компакт-дисках с частотой
дискретизации в 44.1 кГц/16 бит. WAV/WAVE используется для записи аналогового звука без
изменений, поэтому музыкальные исходники (инструментальные партии, вокальное соло, мастертреки) часто записываются именно в таком формате.
С технической точки зрения минута аудиотрека формата WAV/WAVE занимает в памяти
накопителя одинаковый объем, примерно 4–5 Мб в зависимости от частотности дискретизации и
битности. Поэтому минута звука «оригинальной» тишины по весу равна минуте отжига от любимой
blackdeath-metal группы.
Aiff
Формат аудио от Apple, поддерживаемй всеми фирменными «яблочными» проигрывателями.
Впрочем, Aiff прекрасно воспроизводится и на «макинтошах», и на обычных ПК. Минута звука Aiff
(44.1 кГц, 16 бит) занимает в памяти 10 Мб.
Чистый Lossless: FLAC, ALAC и WMA
Процесс сжатия аналогового звука в цифру без потерь на английском языке обозначается
словосочетанием lossless data compression (или по-простому — lossless). Метод lossless-компрессии
позволяет сжимать данные без потерь: на выходе аудио содержат всю информацию с аналогового
исходника, но занимает в памяти значительно меньше места. Добиться этого получается за счет
более компактного метода сохранения избыточных данных. Например, последовательность данных
бита ABCABCABCABC записывается в упрощенном виде (ABC)×4, что и снижает размер файла.
Этот метод похож на архивирование информации, только работает в отношении аудио.
Среди популярных форматов lossless-сжатия выделяются следующие...
2
FLAC
Это наиболее популярный формат, который начал победное шествие в начале нулевых. В процессе
сжатия звук разрезается на несколько фреймов размером в несколько килобайт, при этом для
каждого алгоритм подбирает наиболее подходящий способ компрессии. Это упрощает сжатие —
размер музыкального исходника уменьшается в 1,5–3,5 раз.
На стандартный CD можно записать чистый звук с битрейтом от 400 до 1200 кбит\с. Это займет на
носителе объем в пределах от 20 до 50 Мб при записи пятиминутного трека. Максимально
возможная частота дискретизации FLAC — 192 кГц/24 бит.
ALAC
Фирменный формат сжатия Lossless от Apple. Позволяет записывать файлы с частотой до 384 кГц/32
бит. Треки в формате ALAC идеально воспроизводятся на любой «яблочной» технике, так как
декодируются с помощью встроенного музыкального процессора DSP.
В 2011 году компания Apple решила открыть исходный код формата ALAC, что позволило
разработать декодеры на носителях самых разных музыкальных производителей.
APE
Monkey’s Audio – довольно популярный формат для Windows, но при этом имеет несколько
неофициальных кодеков для других платформ. Формат поддерживает 8-, 16 и 24-разрядные
аудиофайлы, поэтому нашел широкое применение в профессиональной сфере.
Где можно найти музыку в форматах Lossless?
Прослушивание музыки в форматах без потерь – это настоящее наслаждение. Используя обычные
настольные колонки для компьютера или бюджетные наушники весь потенциал lossless-форматов
раскрыть
не
получится.
Для
этого
нужна
аудиоаппаратура
высокого
класса: проигрыватели, акустические
системы, усилители,
премиальные наушники и
даже
высококачественные кабели. При этом остается один вопрос — где брать музыку в этих форматах?
Среди стриминговых сервисов с поддержкой Lossless можно выделить следующие:



Deezer — огромный выбор музыки в качестве Lossless с битрейтом до 1411 Кбит/с.
Tidal — популярный сервис с огромной музыкальной коллекцией в высоком качестве.
Apple Music — известный во всем мире стриминг с поддержкой Hi-Res Lossless.
Сегодня многие сервисы онлайн-радио перешли на аудиоформаты с высоким качеством звука. Из
них можно выделить: Radio Paradise, AI Radio, Absolute Radio, Intense Radio, Frequence 3, Сектор.
Музыка в формате со сжатием: MP3, AAC, WMA и OGG VORBIS
Аудиофайлы со сжатым звуком получаются в процессе так называемой lossy compression. При
кодировании оригинального lossy-звука часть цифровых данных теряется: полученный файл
занимает на носителе меньше места. Правда, и качество звучания трека ухудшается — ухо
профессионального музыканта при воспроизведении на хорошей аппаратуре эти потери вполне
распознает.
При компрессии в различные lossy-форматы используются свои алгоритмы сжатия, но так или иначе
удаляются:
3


куски частотного спектра по краям с ультравысокими и ультранизкими частотами: звук
теряет в басах и в высоких частотах;
тихие звуки, идущие вслед за громкими; полная или частичная обрезка будут незаметны,
поскольку человеческое ухо не воспринимает такие звуки благодаря эффекту маскировки:
более громкие звуки всегда заглушают тихие.
К популярным форматам аудио со сжатием относятся следующие...
MP3
Самый известный lossy-формат, который появился в первой половине 90-х годов. Принцип сжатия
в MP3 схож с компрессией графических файлов с расширением .jpeg: звуковой файл разделяется на
отдельные части (фреймы), из которых удаляются фрагменты, которые человеческое ухо различить
неспособно. После «склеивания» фреймов воедино файл в кодированном виде становится легче (до
11 раз).
Кодировка MP3 производится в пределах от 32 до 320 кбит\с с частотой дискретизации до 48 кГц.
Особенность формата также и в том, что он позволяет записывать файлы с переменным битрейтом
(VBR): фреймы с менее насыщенным звуком кодируются с меньшим битрейтом — это позволяет
сэкономить место на носителе.
AAC
Альтернативный формат с более качественным звуком при меньшем весе аудио — этого удалось
достигнуть за счет усовершенствованных алгоритмов компрессии. На выходе файлы в AAC имеют
частоту дискретизации до 96 кГц (что в 3 раза больше, чем у MP3) с битрейтом в 128 кбит/с, 192
кбит/с и 256 кбит/с.
Музыкальный формат AAC очень популярен при воспроизведении на устройствах Apple, в
стриминговых сервисах и на YouTube. AAC-файлы обычно представлены в расширени .aac, но
могут содержаться и в контейнерах .mp4 или .3gp.
WMA
Версия lossy-формата от корпорации Microsoft. Формально WMA относят к типам файлов со
сжатием, хотя звук на выходе получается без клиппинга — то есть без искажений.
Файлы WMA записываются с частотой дискретизации до 96 кГц и разрядностью до 24 бит. Если
сравнивать с другими lossy-файлами, то у WMA более надежный механизм компрессии, и на выходе
они по объему занимают меньше места на носителе. Преимущество WMA также в возможности
кодирования объемного звука. Существенный недостаток в том, что формат заточен на
воспроизведение в Windows Media Player, и большинство девайсов его не считывают.
OGG VORBIS
Это не коммерческий формат, с отрытым доступом в опенсорс. Схема компрессии OGG VORBIS
схожа с той, что используются при сжатии в MP3, но улучшенная механика алгоритма обеспечивает
более эффективное сжатие, позволяя размещать звуковые сэмплы без смещения и потери данных.
Частота дискретизации у OGG VORBIS переменная — в пределах от 2 до 192 кГц с разрядностью
до 32 бит и переменным битрейтом от 1 до 1000 кбит\с. Если сравнить трек в MP3 и в OGG VORBIS
с одинаковым битрейтом, то файл расширения .ogg (или .oga) будет звучать значительно лучше,
занимая при этом меньше памяти. И хотя OGG VORBIS не может похвастаться такой же
4
популярностью, как MP3, именно этот формат предпочитают использовать многие геймерские
студии для сохранения музыки к играм.
Стриминговые сервисы, где можно послушать музыку в формате Lossy






Spotify — наиболее популярный в мире сервис, который превратился в своеобразную
социальную сеть, отличается быстродействием и наличием огромного количества
высококачественной музыки с высоким битрейтом.
Apple Music — более 30 миллионов музыкальных композиций, удобные плейлисты,
авторские подборки.
YouTube — универсальный сервис с большой коллекцией музыки, кураторские
плейлисты, простой доступ.
VK Музыка — сервис, работающий на базе соцсети ВКонтакте с большой музыкальной
коллекцией, возможностью скачивать треки и автоподбором музыки по предпочтениям
пользователя.
Яндекс Музыка — огромная библиотека композиций отечественных исполнителей и
автоподбор музыки.
SoundCloud — более 125 миллионов аудиозаписей с реальной возможностью
контактировать с исполнителями.
И всё же — зачем разбираться в форматах аудио?
Обычным людям, возможно, не так уж важны отличия форматов аудио при прослушивании
любимых треков, однако заядлые меломаны обязаны в этом разбираться. Хотя бы для того, чтобы
понять — потянет ли проигрыватель, сможет ли акустика воспроизвести чистый звук без потерь.
На каких устройствах лучше воспроизводить аудиоформаты? Здесь всё просто —
услышать богатство звучания лучших форматов аудио с большим битрейтом возможно на CDпроигрывателях, сетевых проигрывателях, современных системах домашних
кинотеатров. Вариантов множество. Главное – убедиться в том, что выбранное устройство
обеспечивает сетевые подключения и поддерживает соответствующие форматы.
Впрочем, как утверждают профессионалы, выбирать аппаратуру в соответствии с форматом
звуковых файлов каждому человеку все равно приходится, полагаясь на особенности собственного
слуха. А он, увы, идеальным не бывает…
5
Скачать