Популярные форматы аудиофайлов и их особенности Любой имеющий отношение к музыке человек знает, что в цифровом виде аудиофайлы хранятся в нескольких популярных форматах. Но в тонкостях их различий разбирается не каждый, хотя это понимание важно для работы с некоторыми сервисами по созданию, обработке и хранению музыки на разных носителях. В этой статье детально разбираемся в том, что представляют собой характеристики цифрового звука, и рассказываем об особенностях основных аудиоформатов. Магия оцифровки звука Прежде всего вкртаце рассмотрим процесс оцифровки звука. Для этого используется модуль аналого-цифрового преобразователя (АЦП), который конвертирует звуковой сигнал в цифровой формат, используя методику импульсного кодирования. АЦП позволяет измерять амплитуду сигнала: все изменения фиксируются и записываются, в результате чего получается цифровая копия аналогового звука. Сам процесс преобразования в профессиональных кругах обозначается понятием «дискретизация» (от латинского слова discretus, что значит «прерывистый»). Возникает вопрос: какая частота дискретизации позволяет получать наиболее точную цифровую копию аналогового звука? Под частотой понимается количество измерений входного сигнала за 1 секунду и измеряется в герцах (Гц). Одно измерение соответствует частоте в 1 Гц, тысячу измерений в секунду — 1 килогерц (кГц). Порог слышимости звука для человеческого уха оценивается в 20 кГц — при дискретизации минимум 40 000 раз в секунду получается сигнал, который не отличается от аналогового. Важные понятия: частотность дискретизации и битрейт В музыкальной индустрии наиболее популярны две частоты: 44.1 кГц — это частотный стандарт аудио для CD и для большинства цифровых записей вообще. Некоторые меломаны задаются вопросом: почему стандарт равен не 40 кГц, а 44.1 кГц? На это повлияла история создания и появления компакт-дисков. В начале 80-х годов прошлого века в качестве основного цифрового носителя использовалась магнитная видеопленка: при записи она вмещала 60 кадров в секунду, при этом в кадре содержались 24 строки с выборкой из трех базовых цветов. Дальше действует простая арифметика — перемножаем 245 на 60 и на 3 — получаем 44100 выборок. Таким образом, для максимальной совместимости аудиоформата с магнитной пленкой решили выбрать и соответствующую частоту дискретизации. Девушка показывает компакт-диск Sony, купленный в отделе новинок музыкального магазина в 1982 году 48 кГц — этот стандарт звукозаписи пришел из киноиндустрии, где пленки при записи использовали 24 кадра в секунду, а при синхронизации видео со звуком получается 48 кГц. Стандарты 88.2 кГц, 96 кГц и 192 кГц — это увеличенные в два и в четыре раза частоты дискретизации, используемые музыкантами при записи исходников в наилучшем качестве. Например, при издании музыки в Super Audio CD (SACD) — формате неперезаписываемого оптического аудиодиска. Важную роль в музыкальной индустрии играет и понятие битрейта, под которым понимается объем данных, уходящих на кодирование одной секунды звука. Битрейт рассчитывается по следующей 1 формуле: частота дискретизации х разрядность х количество каналов, где под разрядностью понимается количество бит, используемых при кодировании отдельного отрезка аудиосигнала. Иными словами, разрядность показывает точность фиксации каждого изменения при записи. Битрейт записанной на компакт-диск музыки равен 1411,2 кбит/с, но при сжатии он куда меньше. К примеру, максимум сжатия файлов формата MP3 составляет 320 кбит\с. Таким образом, суть процесса сжатия аудио состоит в том, чтобы получить меньший размер битрейта за счет потери минимальной части информации исходного сигнала, но при сохранении хорошего качества звукового сигнала. Казалось бы, процесс сжатия музыкальных файлов неизбежно приводит к потере в качестве слышимого звукового сигнала, но это не совсем так. Методики сжатия основываются на физических законах, связанных с несовершенством человеческого звука. При сжатии из аудио удаляются те части сигнала, которые ухом не воспринимаются. Тем не менее в музыкальной индустрии принято разделять форматы аудио на 3 группы — аудио без сжатия, аудио со сжатием без потери качества и аудио со сжатием с потерями. Рассмотрим их по отдельности. В мире чистого звука: WAV/WAVE и Aiff К группе аудиофайлов без сжатия относятся... WAV/WAVE Цифровой формат, который появился в далеком 1991 году для записи на компакт-дисках с частотой дискретизации в 44.1 кГц/16 бит. WAV/WAVE используется для записи аналогового звука без изменений, поэтому музыкальные исходники (инструментальные партии, вокальное соло, мастертреки) часто записываются именно в таком формате. С технической точки зрения минута аудиотрека формата WAV/WAVE занимает в памяти накопителя одинаковый объем, примерно 4–5 Мб в зависимости от частотности дискретизации и битности. Поэтому минута звука «оригинальной» тишины по весу равна минуте отжига от любимой blackdeath-metal группы. Aiff Формат аудио от Apple, поддерживаемй всеми фирменными «яблочными» проигрывателями. Впрочем, Aiff прекрасно воспроизводится и на «макинтошах», и на обычных ПК. Минута звука Aiff (44.1 кГц, 16 бит) занимает в памяти 10 Мб. Чистый Lossless: FLAC, ALAC и WMA Процесс сжатия аналогового звука в цифру без потерь на английском языке обозначается словосочетанием lossless data compression (или по-простому — lossless). Метод lossless-компрессии позволяет сжимать данные без потерь: на выходе аудио содержат всю информацию с аналогового исходника, но занимает в памяти значительно меньше места. Добиться этого получается за счет более компактного метода сохранения избыточных данных. Например, последовательность данных бита ABCABCABCABC записывается в упрощенном виде (ABC)×4, что и снижает размер файла. Этот метод похож на архивирование информации, только работает в отношении аудио. Среди популярных форматов lossless-сжатия выделяются следующие... 2 FLAC Это наиболее популярный формат, который начал победное шествие в начале нулевых. В процессе сжатия звук разрезается на несколько фреймов размером в несколько килобайт, при этом для каждого алгоритм подбирает наиболее подходящий способ компрессии. Это упрощает сжатие — размер музыкального исходника уменьшается в 1,5–3,5 раз. На стандартный CD можно записать чистый звук с битрейтом от 400 до 1200 кбит\с. Это займет на носителе объем в пределах от 20 до 50 Мб при записи пятиминутного трека. Максимально возможная частота дискретизации FLAC — 192 кГц/24 бит. ALAC Фирменный формат сжатия Lossless от Apple. Позволяет записывать файлы с частотой до 384 кГц/32 бит. Треки в формате ALAC идеально воспроизводятся на любой «яблочной» технике, так как декодируются с помощью встроенного музыкального процессора DSP. В 2011 году компания Apple решила открыть исходный код формата ALAC, что позволило разработать декодеры на носителях самых разных музыкальных производителей. APE Monkey’s Audio – довольно популярный формат для Windows, но при этом имеет несколько неофициальных кодеков для других платформ. Формат поддерживает 8-, 16 и 24-разрядные аудиофайлы, поэтому нашел широкое применение в профессиональной сфере. Где можно найти музыку в форматах Lossless? Прослушивание музыки в форматах без потерь – это настоящее наслаждение. Используя обычные настольные колонки для компьютера или бюджетные наушники весь потенциал lossless-форматов раскрыть не получится. Для этого нужна аудиоаппаратура высокого класса: проигрыватели, акустические системы, усилители, премиальные наушники и даже высококачественные кабели. При этом остается один вопрос — где брать музыку в этих форматах? Среди стриминговых сервисов с поддержкой Lossless можно выделить следующие: Deezer — огромный выбор музыки в качестве Lossless с битрейтом до 1411 Кбит/с. Tidal — популярный сервис с огромной музыкальной коллекцией в высоком качестве. Apple Music — известный во всем мире стриминг с поддержкой Hi-Res Lossless. Сегодня многие сервисы онлайн-радио перешли на аудиоформаты с высоким качеством звука. Из них можно выделить: Radio Paradise, AI Radio, Absolute Radio, Intense Radio, Frequence 3, Сектор. Музыка в формате со сжатием: MP3, AAC, WMA и OGG VORBIS Аудиофайлы со сжатым звуком получаются в процессе так называемой lossy compression. При кодировании оригинального lossy-звука часть цифровых данных теряется: полученный файл занимает на носителе меньше места. Правда, и качество звучания трека ухудшается — ухо профессионального музыканта при воспроизведении на хорошей аппаратуре эти потери вполне распознает. При компрессии в различные lossy-форматы используются свои алгоритмы сжатия, но так или иначе удаляются: 3 куски частотного спектра по краям с ультравысокими и ультранизкими частотами: звук теряет в басах и в высоких частотах; тихие звуки, идущие вслед за громкими; полная или частичная обрезка будут незаметны, поскольку человеческое ухо не воспринимает такие звуки благодаря эффекту маскировки: более громкие звуки всегда заглушают тихие. К популярным форматам аудио со сжатием относятся следующие... MP3 Самый известный lossy-формат, который появился в первой половине 90-х годов. Принцип сжатия в MP3 схож с компрессией графических файлов с расширением .jpeg: звуковой файл разделяется на отдельные части (фреймы), из которых удаляются фрагменты, которые человеческое ухо различить неспособно. После «склеивания» фреймов воедино файл в кодированном виде становится легче (до 11 раз). Кодировка MP3 производится в пределах от 32 до 320 кбит\с с частотой дискретизации до 48 кГц. Особенность формата также и в том, что он позволяет записывать файлы с переменным битрейтом (VBR): фреймы с менее насыщенным звуком кодируются с меньшим битрейтом — это позволяет сэкономить место на носителе. AAC Альтернативный формат с более качественным звуком при меньшем весе аудио — этого удалось достигнуть за счет усовершенствованных алгоритмов компрессии. На выходе файлы в AAC имеют частоту дискретизации до 96 кГц (что в 3 раза больше, чем у MP3) с битрейтом в 128 кбит/с, 192 кбит/с и 256 кбит/с. Музыкальный формат AAC очень популярен при воспроизведении на устройствах Apple, в стриминговых сервисах и на YouTube. AAC-файлы обычно представлены в расширени .aac, но могут содержаться и в контейнерах .mp4 или .3gp. WMA Версия lossy-формата от корпорации Microsoft. Формально WMA относят к типам файлов со сжатием, хотя звук на выходе получается без клиппинга — то есть без искажений. Файлы WMA записываются с частотой дискретизации до 96 кГц и разрядностью до 24 бит. Если сравнивать с другими lossy-файлами, то у WMA более надежный механизм компрессии, и на выходе они по объему занимают меньше места на носителе. Преимущество WMA также в возможности кодирования объемного звука. Существенный недостаток в том, что формат заточен на воспроизведение в Windows Media Player, и большинство девайсов его не считывают. OGG VORBIS Это не коммерческий формат, с отрытым доступом в опенсорс. Схема компрессии OGG VORBIS схожа с той, что используются при сжатии в MP3, но улучшенная механика алгоритма обеспечивает более эффективное сжатие, позволяя размещать звуковые сэмплы без смещения и потери данных. Частота дискретизации у OGG VORBIS переменная — в пределах от 2 до 192 кГц с разрядностью до 32 бит и переменным битрейтом от 1 до 1000 кбит\с. Если сравнить трек в MP3 и в OGG VORBIS с одинаковым битрейтом, то файл расширения .ogg (или .oga) будет звучать значительно лучше, занимая при этом меньше памяти. И хотя OGG VORBIS не может похвастаться такой же 4 популярностью, как MP3, именно этот формат предпочитают использовать многие геймерские студии для сохранения музыки к играм. Стриминговые сервисы, где можно послушать музыку в формате Lossy Spotify — наиболее популярный в мире сервис, который превратился в своеобразную социальную сеть, отличается быстродействием и наличием огромного количества высококачественной музыки с высоким битрейтом. Apple Music — более 30 миллионов музыкальных композиций, удобные плейлисты, авторские подборки. YouTube — универсальный сервис с большой коллекцией музыки, кураторские плейлисты, простой доступ. VK Музыка — сервис, работающий на базе соцсети ВКонтакте с большой музыкальной коллекцией, возможностью скачивать треки и автоподбором музыки по предпочтениям пользователя. Яндекс Музыка — огромная библиотека композиций отечественных исполнителей и автоподбор музыки. SoundCloud — более 125 миллионов аудиозаписей с реальной возможностью контактировать с исполнителями. И всё же — зачем разбираться в форматах аудио? Обычным людям, возможно, не так уж важны отличия форматов аудио при прослушивании любимых треков, однако заядлые меломаны обязаны в этом разбираться. Хотя бы для того, чтобы понять — потянет ли проигрыватель, сможет ли акустика воспроизвести чистый звук без потерь. На каких устройствах лучше воспроизводить аудиоформаты? Здесь всё просто — услышать богатство звучания лучших форматов аудио с большим битрейтом возможно на CDпроигрывателях, сетевых проигрывателях, современных системах домашних кинотеатров. Вариантов множество. Главное – убедиться в том, что выбранное устройство обеспечивает сетевые подключения и поддерживает соответствующие форматы. Впрочем, как утверждают профессионалы, выбирать аппаратуру в соответствии с форматом звуковых файлов каждому человеку все равно приходится, полагаясь на особенности собственного слуха. А он, увы, идеальным не бывает… 5