Двоичное кодирование звука.

advertisement
Двоичное кодирование звука.
С начала 9О-х годов персональные компьютеры получили возможность работать со
звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и
колонки, может записывать, сохранять и воспроизводить звуковую информацию.
С помощью специальных программных средств (редакторов звукозаписей) открываются
широкие возможности по созданию, редактированию и прослушиванию звуковых
файлов. Создаются программы распознавания речи и, в результате, появляется
возможность управления компьютером при
помощи голоса.
А что же такое звук?
Упругие волны в воздухе с частотой от 16 до
20000 Гц вызывают у человека звуковые
ощущения. Волны с частотой меньше 16 Гц
называют инфразвуковыми, а с частотой
больше 20000 Гц - ультразвуковыми.
Человеческое ухо воспринимает звук с
частотой от 20 колебаний в секунду (низкий
звук) до 20 000 колебаний в секунду
(высокий звук).
Человек может воспринимать звук в
огромном диапазоне амплитуд, в котором
максимальная
амплитуда
больше
14
минимальной в 10
раз (в сто тысяч
миллиардов раз).
Для измерения громкости звука применяется
специальная единица децибел (дБ).
Звук представляет собой
распространяющуюся в воздухе, воде или
другой среде волну (колебания воздуха или
другой среды) с непрерывно меняющейся
амплитудой и частотой.
Человек воспринимает звуковые волны с
помощью слуха в форме звука различной
громкости и тона.
Чем больше амплитуда звуковой волны, тем громче звук, чем больше частота колебаний,
тем выше тон звука
Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал
должен быть превращен в последовательность электрических импульсов (двоичных
нулей и единиц).
Непрерывная звуковая волна разбивается на отдельные маленькие временные участки,
причем для каждого такого участка устанавливается определенная величина амплитуды.
Таким образом, непрерывная зависимость амплитуды сигнала от времени А(t) заменяется
на дискретную последовательность уровней громкости. На графике это выглядит как
замена гладкой кривой на последовательность “ступенек”.
Каждой “ступеньке” присваивается значение уровня громкости звука, его код (1, 2, 3 и
т.д.). Уровни громкости звука можно рассматривать как набор возможных состояний,
соответственно, чем большее количество уровней громкости будет выделено в процессе
кодирования, тем большее количество информации будет нести значение каждого уровня
и тем более качественным будет звучание.
Современные звуковые карты обеспечивают 16-битную глубину кодирование звука.
Количество различных уровней сигнала или состояний при данном кодировании можно
рассчитать по формуле: N = 2i = 216 = 65536.
Таким образом, современные звуковые карты могут обеспечить кодирование 65536
уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16битный код. Уровни громкости звука можно рассматривать как набор N возможных
состояний, для кодирования которых необходимо определенное количество информации
i, которое называется глубиной кодирования звука.
При двоичном кодировании непрерывного звукового сигнала он заменяется
последовательностью дискретных уровней сигнала. Качество кодирования зависит от
количества измерений уровня сигнала в единицу времени, т.е. частоты дискретизации.
Чем большее количество измерений производится за 1 секунду (чем больше частота
дискретизации), тем точнее процедура двоичного кодирования.
Качество звукового сигнала определяется глубиной кодирования звука и частотой
дискретизации.
Количество изменений в секунду может лежать в диапазоне от 8000 до 48000, т.е.
частота дискретизации аналогово звукового сигнала может принимать значения от 8 до
48 кГц.
Можно оценить информационный объем стереоаудиофайла длительностью 1 секунда
при высоком качестве звука 16 бит, 48 кГц. Для этого количество бит на одну выборку
необходимо умножить на количество выборок в 1 с и умножить на 2.
16 бит*48000 Гц*2=1536000 бит=192000 байт=187,5 Кбайт.
Download