Устройства мультимедиа - Камышинский технологический

advertisement
М. И. Заставной
МИНОБРНАУКИ РОССИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
КАМЫШИНСКИЙ ТЕХНОЛОГИЧЕСКИЙ ИНСТИТУТ (ФИЛИАЛ)
ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО БЮДЖЕТНОГО ОБРАЗОВАТЕЛЬНОГО
УЧРЕЖДЕНИЯ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
М. И. Заставной
Организация ЭВМ и систем.
Устройства мультимедиа
Учебное пособие
Волгоград
2011
1
УДК 004(075.8)
З-36
Рецензенты: д. ф.-м. н., профессор Саратовского государственного
технического университета В. Б. Байбурин; коллектив кафедры «Системотехника» Саратовского государственного технического университета
Заставной, М. И. ОРГАНИЗАЦИЯ ЭВМ И СИСТЕМ. УСТРОЙСТВА
учеб. пособие / М. И. Заставной. – Волгоград: ИУНЛ
ВолгГТУ, 2011. – 84 с.
МУЛЬТИМЕДИА:
ISBN 978-5-9948-0680-7
Приведены общие понятия, относящиеся к мультимедиа, рассмотрена классификация устройств. Описаны виды и принципы организации
оптических носителей информации (CD, DVD, HD DVD и Blu-Ray). Рассматриваются особенности организации звуковых систем, устройства обработки видеоинформации (платы видеозахвата, TV-тюнеры, платы нелинейного монтажа) и различные средства виртуальной реальности.
Рекомендовано студентам, обучающимся по направлению 230100
«Информатика и вычислительная техника».
Ил. 71.
Библиогр.: 14 назв.
Печатается по решению редакционно-издательского совета
Волгоградского государственного технического университета
Михаил Иванович Заставной
ОРГАНИЗАЦИЯ ЭВМ И СИСТЕМ. УСТРОЙСТВА МУЛЬТИМЕДИА
Учебное пособие
Редактор Пчелинцева М. А.
Компьютерная верстка Сарафанова Н. М.
Темплан 2011 г., поз. № 14К
Подписано в печать 08.09.2011 г. Формат 60×84 1/16.
Бумага листовая. Печать офсетная.
Усл. печ. л. 4,9. Уч.-изд. л. 4,6. Тираж 100 экз. Заказ №
Волгоградский государственный технический университет
400131, г. Волгоград, пр. Ленина, 28, корп. 1.
Отпечатано в КТИ 403874, г. Камышин, ул. Ленина, 5, каб. 4.5
ISBN

978-5-9948-0680-7
2
Волгоградский
государственный
технический
университет, 2011
СПИСОК АББРЕВИАТУР
АС – акустическая система
АЦП – аналого-цифровой преобразователь
ИК – инфракрасный
ИКМ – импульсно-кодовая модуляция
КД (СD) – компакт-диск
ОС – операционная система
ПК – персональный компьютер
ПО – программное обеспечение
ТОС – таблица содержания
ФС – файловая структура
ЦАП – цифроаналоговый преобразователь
3
1. ВВЕДЕНИЕ
1.1. Основные понятия
В середине 90-х годов произошел скачок на рынке персональных компьютеров. С приходом процессоров Pentium MMX (1997
год), увеличением объема памяти персональных компьютеров
(ПК), появлением 3D- и видеоускорителей, средств воспроизведения и записи больших объемов информации (CD-ROM, звуковых
карт), а также переходом к операционным системам (ОС) с графическим интерфейсом появилась возможность использовать в быту
большие интерактивные энциклопедии, создавать обучающие программы и многое другое. Практически ко всем из них стала прибавляться приставка «мультимедиа». Что же это значит?
Мультимедиа – область компьютерной технологии, связанная
с использованием информации, имеющей различное физическое
представление (текст, графика, рисунок, звук, анимация, видео и
т. п.) и/или существующей на различных носителях (магнитные и
оптические диски, аудио- и видеоленты и т. д.).
Термин мультимедиа используется для характеристики компьютерных систем, графической, звуковой, видео- и иной информации.
Мультимедиатехнологии – возможность представления
информации пользователю во взаимодействии различных форм
(текст, графика, анимация, звук, видео) в интерактивном режиме.
Достоинством и особенностью технологии являются следующие возможности мультимедиа, которые активно используются в
представлении информации:
1) хранение большого объема самой разной информации на
одном носителе;
2) сравнение изображения и обработка его разнообразными
программными средствами с научно-исследовательскими или познавательными целями;
3) выделение в сопровождающем изображение текстовом
или другом визуальном материале "горячих слов (областей)", по
которым осуществляется немедленное получение справочной или
любой другой пояснительной (в том числе визуальной) информации (технологии гипертекста и гипермедиа);
4) осуществление непрерывного музыкального или любого
другого аудиосопровождения, соответствующего статичному или
динамичному визуальному ряду;
4
5) использование видеофрагментов из фильмов, видеозаписей и т. д., функции "стоп-кадра", покадрового "пролистывания"
видеозаписи;
6) включение в содержание диска баз данных, методик обработки образов, анимации (к примеру, сопровождение рассказа о
композиции картины графической анимационной демонстрацией
геометрических построений ее композиции) и т. д.;
7) подключение к глобальной сети Интернет;
8) работа с различными приложениями (текстовыми, графическими и звуковыми редакторами);
9) создание собственных "галерей" (выборок) из представляемой в продукте информации (режим "карман" или "мои пометки");
10) "запоминание пройденного пути" и создание "закладок" на
заинтересовавшей экранной "странице";
11) автоматический просмотр всего содержания продукта
("слайд-шоу") или создание анимированного и озвученного "путеводителя-гида" по продукту ("говорящей и показывающей инструкции пользователя"), включение в состав продукта игровых
компонентов с информационными составляющими.
Благодаря современным техническим средствам одновременная обработка подобной информации может выполняться практически в реальном времени без каких-либо задержек.
Мультимедиасредства – это комплекс аппаратных и программных средств, позволяющих человеку общаться с компьютером, используя самые разные, естественные для себя среды: звук,
видео, графику, тексты, анимацию.
Мультимедийный компьютер – это такой компьютер, на котором мультимедийные приложения могут в полной мере реализовать все свои возможности: отображать на экране монитора графическую и видеоинформацию, анимацию, воспроизводить с
высоким качеством различное звуковое сопровождение, музыку и
многое другое.
Обычно такие компьютеры имеют аббревиатуру HTPC (Home
Theatre Personal Computer) – персональный компьютер для домашнего кинотеатра – и содержат в своем составе различные средства
мультимедиа. Основное их назначение – воспроизведение мультимедийной информации.
5
1.2. Аппаратные средства мультимедиа
Аппаратные средства мультимедиа позволяют существенно
ускорить процесс обработки мультимедиаинформации.
Для построения мультимедиасистемы необходима дополнительная аппаратная поддержка:
1) аналого-цифровые и цифроаналоговые преобразователи
(АЦП и ЦАП) для перевода аналоговых аудио- и видеосигналов
в цифровой эквивалент и обратно;
2) видеопроцессоры для преобразования обычных телевизионных сигналов к виду, воспроизводимому дисплеями;
3) декодеры для взаимного преобразования телевизионных
стандартов;
4) специальные интегральные схемы для сжатия данных в
файлы допустимых размеров.
К аппаратным средства мультимедиа относятся:
1) носители информации (CD, DVD, HD DVD, Blu-Ray);
2) звуковые системы (звуковые карты, усилители, акустика);
3) видеоускорители, видеобластеры (платы видеозахвата, ввода/вывода, TV-тюнеры);
4) средства виртуальной реальности.
1.3. Программные средства мультимедиа
Мультимедийное программное обеспечение условно можно
разделить на прикладную часть (мультимедиаэнциклопедии, компьютерные игры, аудио- и видеоплееры и т. п.) и специализированную, к которой можно отнести программы, предназначенные
для создания мультимедийного программного обеспечения.
Существует множество программных средств для разработки
мультимедийных приложений, которые можно разделить на несколько категорий:
1) средства создания и обработки изображения;
2) средства создания и обработки анимации, 2D-, 3D-графики;
3) средства создания и обработки видеоизображения (видеомонтаж, 3D-титры, изображения);
4) средства создания и обработки звука;
5) средства создания презентаций.
К программным средствам мультимедиа также можно отнести
и операционную систему, которая должна управлять работой
мультимедийного компьютера.
6
В настоящее время в самих операционных системах уже могут
иметься дополнительные функциональные возможности для работы с мультимедиа (воспроизведение видео- и аудиоинформации),
например специализированная версия ОС Microsoft Windows XP
Media Center, в которой изначально имеется программная оболочка Windows Media Center, обеспечивающая просмотр фотографий
и фильмов, прослушивание музыки.
Программные средства позволяют в полной мере реализовать
возможности мультимедиа и эффективно использовать аппаратные
средства мультимедиа.
7
2. НОСИТЕЛИ ИНФОРМАЦИИ МУЛЬТИМЕДИА
К основным средствам распространения мультимедийной информации относятся различные оптические носители информации,
а для работы с ними используются устройства считывания и записи (приводы).
Одними из первых появились компакт-диски (1979 год), которые позднее стали активно использоваться в ПК как средство хранения больших объемов информации. Постепенное развитие
средств вычислительной техники, развитие мультимедийных технологий привело к необходимости увеличения объема носителей
информации. В итоге появились новые стандарты дисков – DVD
(1996 год) – и устройства для работы с новыми видами носителей.
В последнее время в качестве среды распространения различного рода информации (в том числе и мультимедийной) используется сеть Интернет, что несколько уменьшает роль оптических
дисков, однако на смену пришли диски "повышенной" емкости,
способные хранить данные в несколько десятков гигабайт – HDDVD (2006 год, поддержка прекращена в 2008 году) и Blu-Ray
диски (2006 год).
2.1. Компакт-диски
Компакт-диски (КД, CD, Compact Disc) – это носители информации, предназначенные для хранения информации в цифровой форме (в виде набора чисел).
Рис. 1. Вид компакт-диска
Семейство компакт-дисков включает в себя носители различных типов, оптимизированных для хранения и использования специфичных видов информации. Несмотря на разнообразие типов
КД, всем им присущи общие черты.
8
Все члены семейства КД представляют собой трехслойный
диск диаметром 120 мм и толщиной – 1,2 мм, имеющий в центре
отверстие диаметром 15 мм (рис. 2).
Рис. 2. Структура компакт-диска
Подложка, которая изготавливается методом литья под давлением, состоит из оптически прозрачного материала (поликарбонат). При изготовлении подложки на одной из ее поверхностей
формируется информационный рисунок, состоящий из ямок (питы) и промежутков между ямками (лэнды). На информационный
рисунок напыляется тонкий отражающий слой, поверх которого
наносится слой лака, защищающий диск от повреждений. Как правило, на защитный лак наносится различного рода сопровождающая информация.
На рис. 3 отображена схема считывания информации с оптического диска.
Для чтения информации с КД используется луч лазера (laser)
инфракрасного диапазона (ИК) с длиной волны 780 нанометров
(нм). Луч c помощью системы линз (lens) и призмы (prism) подается на вращающийся диск (disc) со стороны подложки, отражается от отражающего слоя и возвращается на специальный фотоприемник (photo-electrical cell). При попадании луча на питы и лэнды
интенсивность отраженного луча меняется. В итоге на выходе фотоприемника формируется электрический сигнал, повторяющий по
форме информационный рисунок на поверхности компакт-диска.
Возможность использования лазера с ИК-диапазоном позволила создавать не только прозрачные поликарбонатные подложки, но
и цветные, вплоть до темных, причём материал оставался светоне9
проницаемым только в видимой части спектра. При этом качество
считывания информации зависит от состояния поверхности КД.
Рис. 3. Устройство лазерного механизма
2.1.1. Форматы дисков
2.1.1.1. Базовый формат – CD Audio. Исторически первым в
семействе КД появился Compact Disc Digital Audio (CD DA). На
подобных дисках присутствует логотип, изображенный на рис. 4.
Рис. 4. Маркировка дисков CD Audio
Формат CD DA является базовым форматом семейства КД.
Все остальные форматы фактически являются надстройкой над
этим форматом. Поэтому практически всё, что будет сказано о
структуре CD Audio, может быть отнесено и к остальным форматам.
10
Требования к характеристикам, структуре и параметрам CD
Audio описаны в стандарте Philips/Sony, который называется Red
Book (Красная Книга).
Информация на CD Audio (в дальнейшем – КД) закодирована
в виде последовательности питов и лэндов. Питы и лэнды разной
длины, чередуясь, составляют информационную дорожку в виде
спирали, которая начинается от внутреннего радиуса КД. Расстояние между витками спирали составляет 1,6 мкм (рис. 5).
Рис. 5. Расположение питов и лэндов на компакт-диске
При проигрывании КД читающая система следит за дорожкой,
при этом скорость вращения диска поддерживается такой, чтобы
скорость перемещения дорожки относительно читающей системы
оставалась постоянной. Этот параметр называется Скорость Сканирования (Scanning Velocity), и он должен быть в пределах 1,2–
1,4 м/с. Именно такое значение скорости проигрывания (чтения)
принято называть однократной скоростью – 1х. Такой режим проигрывания называется CLV (Constant Linear Velocity) – Постоянная Линейная Скорость. Для поддержания постоянной линейной скорости проигрыватель вынужден постоянно менять скорость
вращения диска.
Примечание. С появлением дисков CD-ROM возникла необходимость повышения скорости чтения информации. Появились устройства с 2х, 4х и большими
значениями скоростей чтения. На определенном уровне скорости (~ 8х–10х) выплыли проблемы со скоростью доступа к информации на CD-ROM, связанные
именно с режимом CLV. При чтении информации из произвольных участков CDROM привод вынужден был постоянно уменьшать или увеличивать скорость
11
вращения диска. Чем тяжелее был диск и чем выше была скорость чтения, тем
больше было время доступа к определенному участку диска.
Решением этой проблемы стало введение режима CAV (Constant Angle
Velocity) – Постоянная Угловая Скорость. В этом режиме скорость вращения
диска остается постоянной, а скорость чтения информации меняется (растет
от центра диска к краю). При этом производители устройств считывания (приводов) обычно указывают максимальную скорость считывания, т. е. скорость
на краю диска (например, 40x). Режим CAV предъявляет повышенные требования к качеству КД и состоянию его поверхности (особенно на краю диска).
Таким образом, для чтения информации с КД могут применяться два режима: CLV и CAV .
Организация информации на КД. Информационная дорожка
разбита на три зоны: вводная дорожка (Lead-In), программная зона
(Program Area) и выводная дорожка (Lead-Out) (рис. 6).
Lead-in
Program Area
Lead-Out
Рис. 6. Информационная дорожка компакт-диска
Программная зона содержит треки (от 1 до 99) (рис. 7). Минимальная длина трека может составлять 4 сек.
Трек 1
Трек 2
…
Трек 98
Трек 99
Рис. 7. Расположение треков компакт-диска
Трек, в свою очередь, может быть размечен на участки, пронумерованные так называемыми индексами (от 1 до 99) (рис. 8).
Как минимум, трек содержит один участок с индексом номер 1.
Индекс 0
(пауза)
Индекс 1
Индекс 2
...
Индекс 99
Рис. 8. Расположение индексов компакт-диска
В начале каждого трека может содержаться особый участок
(пауза), помеченный индексом 0. Обычно длина паузы составляет
2 сек. Пауза – это такой же участок трека, как и все остальные. В
ней может содержаться как тишина, так и фонограмма (например,
аплодисменты живого концерта). Исключение составляет пауза
первого трека – ее длина должна быть не менее двух секунд, она
всегда содержит тишину и никогда не проигрывается.
Особенность паузы состоит в том, что отсчет времени в ней
идет в обратном направлении, от длины паузы до нуля (2, 1, 0).
Вторая особенность – при переходе к треку, содержащему паузу,
проигрывание начнется не с начала паузы, а с начала участка с индексом 1.
12
Пауза длиной не менее 2 сек. обязательна для первого трека
диска (обычно ровно 2 сек.).
Доступ к произвольному фрагменту диска (адресация).
Информационная дорожка компакт-дисков состоит из небольших
блоков, называемых кадрами (frame). В случае дисков CD-ROM
эти блоки еще называют секторами (по аналогии с секторами дискет и винчестеров). Кадр – это минимально адресуемый участок
КД. Обычно говорят, что доступ к произвольному участку КД
осуществляется с точностью до кадра. Полный адрес участка КД
имеет следующий вид:
M:S:F, где M – минуты, S – секунды, F – кадры.
Секунда звучания КД содержит в себе 75 кадров. Минута – 60
секунд.
Диск длиной 74 мин. содержит 74 × 60 × 75 = 333000 кадров.
Диск длиной 80 мин. содержит 80 × 60 × 75 = 360000 кадров.
Примечание. С учетом того, что первые две секунды отводятся под паузу
первого трека, реально на 74-минутном диске уместится фонограмма длиной 73
мин. 58 сек. То же касается и 80-минутного диска. Для него максимальная длина
фонограммы – 79 мин. 58 сек.
Внутри кадра находится набор чисел, представляющих закодированный звук.
На компакт-диске размещаются два звуковых канала (стереозвук). Выборка звуковых отсчетов производится с частотой 44100
Гц (44,1 кГц) и разрядностью 16 бит (2 байта) на каждый канал.
Поскольку в одной секунде КД содержится 75 кадров, один кадр
содержит в себе 44100/75 = 588 отсчетов звукового сигнала. Размер кадра определяется следующим образом:
588 отсчетов × 2 канала × 2 байта = 2352 байта.
Кадры информационной дорожки (главный канал). На рис. 9
приведен пример расположения кадров со звуковыми отсчетами.
2352
2352
2352
2352
2352
Рис. 9. Расположение кадров на компакт-диске
В кадре нет информации о его адресе (MSF – минуты, секунды, кадры). До этого момента шло рассмотрение той части информационной дорожки, которая хранит информацию для главного
канала проигрывания, отвечающего за воспроизведение звука.
Информация об адресе кадра и ряд служебных параметров при
проигрывании выдаются в так называемый канал субкода. Физически информация для обоих каналов размещена на информаци13
онной дорожке, но при воспроизведении диска информация для
основного канала и для канала субкода разделяется на два отдельных потока – поток звуковых отсчетов и поток данных субкода.
Для размещения информации из этих каналов на одной информационной дорожке при формировании структуры диска выполняется следующая операция: каждый кадр длиной 2352 байта
разделяется на 98 маленьких кадров по 24 байта в каждом (EFMкадры) (рис. 10).
24
Кадр (1/75 сек.) = 2352 байта
24
24
24
…
24
24
24
Рис. 10. Разделение кадра на "мини-кадры"
Одновременно формируется группа из 98 байтов, которые содержат информацию для канала субкода: тип трека, номер трека,
номер индекса и адрес данного кадра (два адреса – от начала диска
и от начала трека).
Байты для канала субкода (S). Биты каждого байта для канала субкода обозначены символами английского алфавита – P, Q,
R, …, W (рис. 11).
N байта
S1
S2
P
Q
R
S
T
U
V
W
…
S97
S98
Рис. 11. Биты для каждого байта канала субкода
Бит P используется для распознавания пауз треков (участков
трека с индексом 0). В области паузы значение этого бита равно 1.
В остальных областях трека P = 0. В области выводной дорожки
значение бита P начинает меняться (1,0,1,0,1,0,1,…) с частотой 2
Гц, обозначая конец музыкальной программы.
Биты Q всех 98 байт составляют 98-битное Q-слово (CUEкод), которое и содержит в себе тип трека, номер трека, номер индекса и адрес данного кадра. Также применим термин PQ-код.
Биты R...W каждого из 98 байт формируют 6-битовые слова,
которые в настоящее время используются для размещения CD
Text’а.
14
Перед тем, как сформированные 98 байт субкода добавить к
98 24-байтовым кадрам, производится еще один этап кодирования,
повышающий устойчивость чтения информации диска: к каждому
из девяноста восьми 24-байтовых кадров добавляется восемь байт
избыточной информации, сформированной с помощью специального математического алгоритма (код Рида-Соломона). Таким образом, 25 % информации на КД избыточно (24/(24 + 8) = 0,25). Избыточность необходима для коррекции ошибок чтения. За счет избыточности становится возможным воспроизводить звук достоверно
даже при наличии на диске серьезных повреждений (царапины длиной до 2 мм).
После добавления байтов субкода образуется цепочка из 98
блоков, представленная на рис. 12, где Звук (24) – это 24 байта
звуковых отсчетов, RC (8) – 8 байтов с помехозащищающими кодами Рида-Соломона и S (1) – байт субкода.
Блок 1
Звук RC (8) S (1)
(24)
Блок 2
Звук RC (8) S (1)
(24)
…
Блок 98
Звук RC (8) S (1)
(24)
Рис. 12. Цепочка блоков
Образовавшиеся 33-байтовые блоки нескольких последовательно расположенных кадров перемешиваются между собой по
определенному алгоритму, что также повышает устойчивость КД к
повреждениям.
Последним этапом кодирования информации является преобразование всех байтов в 14-битные слова (Eight-To-Fourteen
Modulation, модуляция 8 × 14). Получившаяся последовательность
единиц и нулей размещается на информационной дорожке компакт-диска в виде питов и лэндов.
Примечание: полезная информация закодирована в длине питов и лэндов, а
также в переходах между питом и лэндом.
При проигрывании КД выполняется обратный процесс – процесс декодирования. Коррекция ошибок осуществляется с помощью кода Рида-Соломона. Если повреждения диска значительны и
код Рида-Соломона с ними не справляется, проигрыватель использует алгоритмы интерполяции звука, вычисляя примерное значение «выпавшего» звукового отсчета. Чем выше класс проигрывателя, тем лучше в нем реализованы алгоритмы интерполяции звука.
2.1.1.2. Диск CD-ROM. В 1984 году компании «Philips» и
«Sony» совместно опубликовали новый стандарт дисков, который
15
был назван Yellow Book (Желтая книга). В нем было указано, что
цифровой компакт-диск может содержать различные цифровые
данные (не только аудиоданные), предназначенные для компьютера.
Диск CD-ROM (Compact Disc Read Only the Memory) унаследовал все черты своего родителя (CD DA) и приобрел новые черты, необходимые для выполнения своих специфичных функций.
Кадр диска CD-ROM. Основное отличие диска CD-ROM от
CD DA – структура кадра. Если для аудиодиска кадр размером
2352 байта полностью занят звуковыми отсчетами, то на CD-ROM
для компьютерных данных из 2352 байт отведено только 2048 байт
(User Data). Остальное – служебная информация (рис. 13).
Sync (12)
Header (4)
User Data (2048)
EDC (4)
Blank (8)
ECC (276)
Рис. 13. Структура кадра диска CD-ROM
Особенности:
1. Для CD-ROM необходим точный доступ к кадру. Для этого
в кадр введены разделы Synchro (Sync) и Header. Synchro необходим для распознавания начала кадра (сектора) CD-ROM, Header
содержит в себе точный адрес сектора в формате MSF.
2. Основная задача аудиопроигрывателя – непрерывное воспроизведение фонограммы. Если при воспроизведении возникают
ошибки, проигрыватель пытается исправить их с помощью механизмов избыточности, заложенных при создании диска (код РидаСоломона). Если механизма избыточности недостаточно для восстановления поврежденной информации, проигрыватель начинает
интерполировать звук. При этом, естественно, возникают искажения (слышимые или неслышимые), но воспроизведение продолжается. Для CD-ROM интерполяция информации неприемлема. Информация должна быть или прочитана точно, или не прочитана
вообще. Поэтому для CD-ROM предусмотрены дополнительная
избыточность и средства детектирования ошибки. Это EDC (Error
Detection Code) и ECC (Error Correction Code), которые принято
называть третьим слоем восстановления ошибок. Работая в паре,
EDC и ECC позволяют обнаружить и исправить ошибки, которые
для аудиодиска были бы фатальными.
Для того чтобы читающее устройство могло определить, какие
треки находятся на диске – аудио или компьютерные, было введено такое понятие, как тип трека. В стандартах семейства компакт16
дисков определены два типа трека: Audio-трек и Data-трек. Тип
трека указывается в таблице содержания (TOC, Table of Contents) для каждого трека. Также тип трека указывается в субкоде
каждого кадра.
Емкость диска CD-ROM. Полезная информация (User Data)
занимает в кадре 2048 байт (2к). Тогда получим:
ёмкость диска 74 мин: 333000 – 150 (пауза трека 1) = 332850
секторов × 2к = 665700к = 650,09 Мбайт;
ёмкость диска 80 мин: 360000 – 150 = 359850 секторов × 2к =
719700к = 702,8 Мбайт.
Принципы доступа к информации. Для аудиодиска объектом выбора обычно является трек. Для того чтобы выбрать любой
трек, достаточно информации, записанной в таблице содержания.
Для CD-ROM, как и для любого компьютерного носителя,
объектом выбора являются файлы и папки (директории). Папки
тоже являются файлами особого назначения. Поэтому записей в
TOC недостаточно для доступа к объектам CD-ROM.
Для доступа к файлам на дисках CD-ROM формируется файловая структура (ФС). ФС – это набор служебных записей, описывающих местоположение и атрибуты файлов и папок. Файловые
структуры бывают разные, и любая из них может быть размещена
на CD-ROM. Так, например, на дисках для компьютеров Macintosh
может быть сформирована файловая система HFS (Hierarchical
File System), которая используется на жестких дисках компьютеров Macintosh. Такие диски читаются только на Macintosh`ах.
Для обеспечения универсальности дисков CD-ROM была разработана файловая система ISO 9660. Диски с этой файловой системой совместимы с операционными системами ПК Windows,
MacOS и Unix. Базовый вариант этой файловой системы накладывает ограничение на длину имени файла и символы, которые можно было использовать в названии файла (схема «8 + 3», до 8 символов в имени файла и до 3 символов в расширении). В имени
файла можно использовать только символы английского алфавита,
цифры и знак подчеркивания. Метка диска не должна быть длиннее 11 символов и не должна содержать пробелы.
Примечание. Метка диска (Volume Label) идентифицирует диск при его загрузке в привод CD-ROM. В проводнике Windows метка диска отображается
справа от значка привода CD-ROM.
17
В 1995 году было введено дополнение к ISO 9660 (Joliet
Specification), позволяющее использовать в именах файлов длинные имена, символы национальных алфавитов и пробелы (система
кодирования Unicode).
Файловая система Joliet формируется на КД в дополнение к
ФС ISO 9660. Фактически на диске присутствуют две файловые
системы. Те компьютеры, которые не поддерживают Joliet, показывают имена файлов из ФС ISO 9660. При формировании файловой структуры ISO 9660 длинные имена урезаются и в конце добавляются знак «~» и цифра.
Есть еще один вариант формирования длинных имен, реализованный в некоторых программах записи. Он называется Extended
ISO 9660. Позволяет размещать на диске только одну ФС (ISO
9660), но при этом разрешена длина имени файла до 128 символов.
Разрешаются только символы английского алфавита, цифры и знак
подчеркивания.
Точно определить размер данных, которые может хранить КД,
достаточно трудно.
В ISO 9660 минимально адресуемый фрагмент информации
называется логическим блоком. По умолчанию он равен размеру
полезной информации в кадре (сектору) – 2048 байт. Если, к примеру, файл имеет размер 100 байт, то в блоке (а значит и кадре)
остальное место останется незанятым. Если на диске размещается
1000 файлов размером 100 байт, то на диске реально будет занято
1000 × 2048 = 2048000 байт, а не 100000 байт.
Таким образом, чем больше будет на диске маленьких файлов,
тем больше будет размер незанятого пространства.
2.1.1.3. Mixed Mode CD. Mixed Mode CD – это диск со смешанными режимами (CD DA и CD-ROM).
На таком диске первый трек всегда имеет тип Data и содержит
файловую структуру с компьютерными данными. За Data-треком
располагаются аудиотреки. Особенность использования такого
диска – аудиотреки начинаются со второго трека. «Умные» проигрыватели не позволят запустить на проигрывание первый трек. Но
остается риск того, что простые проигрыватели позволят проигрывать первый трек, а это чревато выходом из строя акустических
систем. Этот формат используется в основном при создании игровых дисков, для размещения игровых программ с музыкальным
сопровождением. Для музыкальных дисков с небольшим добавле18
нием компьютерной информации используется другое решение, о
котором будет сказано чуть позже.
При подготовке диска Mixed Mode всегда должно выполняться одно жесткое правило – в конце Data-трека должно быть добавлено 150 пустых кадров (2 сек.), так называемый Postgap, а в начале второго трека обязательно должна быть пауза длиной не менее
2 сек. (а иначе диск на мастеринге не считается – устройство по
созданию алюминиевых CD-дисков). Для дисков CD-ROM паузу
принято называть Pregap.
2.1.1.4. CD-ROM XA (eXtended Architecture). Этот формат
является потомком формата CD-ROM. Его появление было вызвано необходимостью обозначать тип цифровой информации, хранящейся в конкретном кадре диска. Связано это было с появлением специализированных проигрывателей мультимедийной информации, способных проигрывать видео со звуком и отображать неподвижные изображения (в частности, проигрыватели Video CD).
Кадры на диске CD-ROM XA имеют более сложную структуру, чем кадр CD-ROM. Есть два вида кадров (или две формы):
Form 1 и Form 2. Кадр Form 1 похож на кадр CD-ROM.
Структура кадра CD-ROM XA Form 1. Структура подобного
кадра отображена на рис. 14.
Sync (12)
Header (4)
SubHeader (8)
User Data (2048)
EDC (4)
ECC (276)
Рис. 14. Структура кадра CD-ROM XA Form 1
Отличие от кадра CD-ROM состоит в том, что появился
SubHeader (8 байтов), его назначение – указывать проигрывателю,
в какой форме хранится информация (Form 1 или Form 2), какой
тип информации находится в данном кадре (Data, Audio или Video)
и должна ли информация из кадра выдаваться на внешнее устройство в конкретный момент времени (Real Time Sector). Связано это
с тем, что в цифровых форматах хранения видеофильмов звук и
видео чередуются в определенном порядке. При этом они должны
выдаваться на воспроизводящие устройства в строго определенные моменты времени, иначе нормального воспроизведения не получится. Кадры Form 1 используются для хранения системной информации, для хранения видео и звука используются кадры Form 2.
Структура кадра CD-ROM XA Form 2. Структура кадра
Form 2 представлена на рис. 15.
19
Sync (12)
Header (4)
SubHeader (8)
User Data (2324)
EDC (4)
Рис. 15. Структура кадра CD-ROM XA Form 2
Кадр Form 2 отличается увеличенным размером зоны пользовательских данных (звук, видео), но реализовано это за счет отказа
от кодов коррекции ошибок. В итоге кадры Form 2 более чувствительны к ошибкам считывания и в этом плане похожи на кадры
аудиодиска. Сходство усиливает и алгоритм их воспроизведения.
Поскольку кадры Form 2 являются обычно кадрами реального
времени (Real Time), для проигрывателя главная задача – вовремя
выдать видео и звук на устройства отображения. Если кадр оказывается поврежденным, он пропускается (изображение на экране
может «застыть»).
Применение формата CD-ROM XA обязательно при создании
диска Video CD. Требования к формату дисков Video CD оговорены в стандарте White Book (Белая Книга). Видео и звук на таком
диске закодированы в соответствии со стандартом MPEG 1. Качество изображения видео в формате MPEG 1 примерно соответствует качеству формата VHS (видеокассеты). Достоинство формата – стереозвук. Диски могут быть проиграны на специализированных проигрывателях VCD, на DVD-проигрывателях, а также на
некоторых игровых приставках.
Развитием формата Video CD стал формат Super Video CD.
Отличие в том, что для SVCD видеоряд кодируется в соответствии
со стандартом MPEG 2, что позволяет улучшить его качество
практически до качества DVD. Но при этом уменьшается максимальное время проигрывания (около 20–30 мин.). Формат SVCD
хорошо подходит для издания сборников видеоклипов. Современные DVD-проигрыватели поддерживают формат SVCD.
С появлением формата CD-ROM XA было введено понятие
«тип диска». Для того чтобы проигрывающие устройства могли
отличать диски CD-ROM XA от дисков остальных типов, в таблице содержания компакт-диска указывается тип диска, который
может принимать три значения:
1) 00h (010) – ROM/Audio (для дисков CD DA, CD-ROM, Mixed
Mode CD);
2) 10h (1610) – CD-Interactive;
3) 20h (3210) – CD-ROM XA.
20
Формат CD-Interactive применялся на дисках LG Karaoke и является закрытым форматом компании «LG».
Встречаются также диски, которые получили название «неправильный XA». У такого диска тип диска установлен как CDROM XA, сектор имеет Form 1, но при этом SubHeader не содержит никакой информации. Согласно стандарту на диски CD-ROM
XA, пустой SubHeader может быть только в тех областях диска,
где нет полезной информации (Postgap). Поэтому привод CD-ROM
не обязан читать информацию из кадров с таким SubHeader. И хотя современные приводы читают такие диски, нет 100 %-й гарантии, что все модели приводов будут читать такие диски.
2.1.1.5. Multisession CD. Формат CD-ROM XA используется
также при создании дисков Multisession.
Термин «сессия» (дословно – сеанс) появился вместе с форматом CD-Recordable (Записываемый Компакт-Диск). Под сессией
понимается сеанс записи компакт-диска, то есть запись на диске
Lead-In, программной зоны (Program Area, PA) и Lead-Out
(рис. 16).
Lead-In
Сессия 1
PA
LeadOut
Lead-In
Сессия 2
PA
LeadOut
Lead-In
Сессия 3
PA
LeadOut
Рис. 16. Организация Multisession CD
Стандартом на записываемые КД разрешается размещение на
КД нескольких сессий (до 99). Lead-In каждой сессии содержит
свою собственную TOC, которая включает список треков, входящих в эту и предыдущие сессии. Также в TOC каждой сессии указан тип этой сессии.
Формат Multisession разрешает производить запись на диск,
который уже имеет сессию (сессии). Запись возможна при условии, что в TOC последней сессии имеется специальная метка, разрешающая запись еще одной сессии. При записи новой сессии в
ней формируется новая файловая система, которая указывает местоположение вновь записываемых файлов и, кроме этого, как
правило, определяет местоположение файлов из предыдущих сессий (хотя может этого и не делать). Также в новой сессии могут
быть записаны новые версии файлов, уже имеющихся в предыдущих сессиях (при этом в новой файловой системе указывается местоположение новой версии файла, а ссылка на старый файл не
21
формируется – “псевдостирание”). Для операционной системы
компьютера и для пользователя этот процесс выглядит как добавление или замена файлов.
Есть и "недостатки" подобной организации. При записи первой сессии будущего диска Multisession в TOC первой сессии делается специальная метка, говорящая о том, что на диске может
быть еще одна сессия (диск “не финализирован”). Привод CDROM, читающий такой диск, обнаружив эту метку, начитает читать ту область КД, где должен находиться Lead-In следующей
сессии. Если Lead-In есть, делается попытка прочитать TOC следующей сессии. Если чтение этой области не удается, привод делает вывод, что следующей сессии нет, и работает с TOC первой
сессии, показывая её файловую структуру. Если же чтение удается
и во второй сессии тоже есть метка, цикл повторяется до тех пор,
пока не будет обнаружена последняя сессия.
В случае если Lead-In какой-либо из сессий будет записан некачественно или в области размещения Lead-In будут повреждения, привод CD-ROM может принять ложное решение об отсутствии следующей сессии и показать файловую систему текущей
сессии. При наличии дефектов в области Lead-In второй и следующих сессий пользователь диска может получить старый набор
информации с неоткорректированными файлами либо неполный
набор информации.
Формат Multisession используется для дисков формата CD Plus
(они же Enhanced CD, CD Extra).
Структура таких дисков оговорена стандартом Blue Book (Голубая Книга).
В первой сессии такого диска, имеющей тип ROM/Audio, размещаются аудиотреки, во второй сессии, имеющей тип CD-ROM
XA, размещаются компьютерные данные (например, видеоклип).
Преимущества – аудиопроигрыватели видят только первую
сессию, проигрывание начинается с трека 1. Привод CD-ROM всегда обращается к последней сессии, т. е. ко второй и отображает
компьютерные данные.
При подготовке такого диска следует учитывать, что Lead-Out
первой сессии и Lead-In второй сессии в сумме занимают 2,5 мин.
дискового пространства. Для дисков, заполняемых «под завязку»,
это критично.
22
Также есть еще диски с другой организацией данных, например:
Playstation, Sega DreamCast, LG Karaoke. Исследование структуры
этих дисков показало, что она отвечает стандартам Philips/Sony. Но
формально эти диски не являются членами семейства КД и их
структуру описывают соответствующие внутрифирменные стандарты закрытого типа.
2.1.2. Виды дисков
Изначально КД существовали только в одном варианте – с
диаметром диска 120 мм. Стремление к использованию КД в мобильной технике привело к выпуску компакт-дисков меньшего
диаметра – 80 мм (mini CD), при этом время проигрывания аудиоинформации составило 24 мин., а максимальная емкость дисков не
превысила 211 Мбайт.
2.1.3. Принципы записи КД. Форматы записи КД
Общими для устройств записи компакт-дисков являются следующие принципы:
1) изменения оптических свойств носителя информации под
воздействием лазерного излучения;
2) наличие на «чистом» диске специальной направляющей дорожки (groove).
Существует два вида дисков, позволяющих запись информации. Это CD-Recordable (CD-R, однократно записываемые КД) и
CD-Rewritable (CD-RW, многократно перезаписываемые КД).
В системе CD-Recordable между подложкой и отражающим
слоем находится светочувствительное вещество (органический
краситель). Изначально это вещество прозрачно. Под воздействием луча лазера определенной мощности вещество теряет прозрачность. Так формируется последовательность «псевдопитов» и
«псевдолэндов». Считывание производится с помощью луча лазера меньшей мощности.
Структура записываемого компакт-диска представлена на рис. 17.
Этикетка
Защитный лак
Отражающий слой (серебро, золото)
Светочувствительный слой (DYE)
Подложка
Рис. 17. Структура записываемого КД
23
Для того чтобы сформировать в процессе записи диска спиральную информационную дорожку, соответствующую всем требованиям стандарта, на чистом диске изначально присутствует
специальная направляющая дорожка – Pregroove. В процессе записи следящая система рекордера ведет записывающую головку
точно по этой направляющей дорожке, создавая спиральную информационную дорожку.
Кроме областей, предназначенных для записи сессий, на диске
CD-R присутствуют специальные служебные зоны: PCA (Program
Calibration Area) – зона, используемая для подбора оптимальной
мощности лазера перед началом записи, и PMA (Program Memory
Area) – зона, используемая для временного хранения информации
о структуре создаваемого диска (требуется при использовании некоторых режимов записи).
В системе CD-Rewritable светочувствительный слой может
находиться в одном из двух устойчивых состояний – кристаллическом или аморфном, соответственно пропуская луч лазера до отражающего слоя и обратно или же рассеивая свет.
Если вещество находится в первом (кристаллическом состоянии), то считывающий луч лазера беспрепятственно проходит
сквозь рабочий слой, отражается от отражающего слоя и в итоге
попадает на фотоприемник, что соответствует логической "1". Если же вещество находится в аморфном состоянии, луч рассеивается, не попадая в итоге на фотоприемник, что соответствует логическому "0". Для перевода вещества из одного состояния в другое
используются специальные режимы нагрева и охлаждения лазерным лучом. Вначале вещество нагревается до высшей температуры T1, при этом оно теряет свою структуру, локально в точке фокусировки луча лазера становясь аморфным; если затем полностью
выключить лазер, т. е. произвести резкое охлаждение T1 >> T
комн., то вещество, остывая, так и останется в аморфном состоянии. Если же лазер не выключить, а только уменьшить его мощность и полностью выключить только через какое-то время, то за
счет двухступенчатого охлаждения T1 >> T2 >> T комн., вещество
рабочего слоя успевает кристаллизоваться.
Режимы записи. Существует несколько режимов записи CDR и CD-RW дисков:
1. Track-At-Once (TAO) – трек за один проход: рекордер записывает первый трек, после чего производится запись информа24
ции об этом треке в служебную область диска (PCA), затем производится запись следующего трека и т. д. В завершение производится запись вводной и выводной дорожек. При использовании
этого метода возможна запись отдельных треков в разное время и
на разных рекордерах. Трек при этом оформляется в виде пакета,
который начинается пятью блоками «вбегания» (Run-In Blocks) и
завершается двумя блоками «выбегания» (Run-Out Blocks). Между пакетами вставляются связующие блоки (Link Blocks), в которых отсутствуют питы и лэнды.
2. Disc-At-Once (DAO) – диск за один проход: рекордер последовательно записывает вводную дорожку, область программы и
выводную дорожку. При этом выключения лазера не происходит.
3. Session-At-Once (SAO) – сессия за один проход: развитие
предыдущего режима записи. Абсолютно ему аналогичен за исключением того, что в TOC добавляется информация, разрешающая запись следующей сессии.
4. Incremental Packet Writing – пакетная запись с приращением: похожа на режим TAO, только в пакет заключается не трек,
а отдельный файл. Позволяет добавлять на диск по одному файлу
за один сеанс записи.
2.2. Стандарт DVD
Диски данного стандарта появились в 1996 году. Первоначально аббревиатура DVD расшифровывалась как Digital Video
Disc (цифровой видеодиск), это оптические диски с большой емкостью. Эти диски используются для хранения компьютерных программ и приложений, а также полнометражных фильмов и высококачественного звука. Потом появилась расшифровка аббревиатуры
DVD как Digital Versatile Disc (универсальный цифровой диск).
Рис. 18. DVD-диск
25
Появление DVD-дисков связано с "невысокой" емкостью CDдисков и постепенным ростом объемов мультимедийных библиотек, игр, программного обеспечения, переходом к распространению фильмов в более высоком качестве.
Снаружи диски DVD выглядят как обычные диски CD-ROM
(120 или 80 мм). Но есть существенные отличия: диски DVD могут
хранить в 26 раз больше данных по сравнению с обычным CDROM. Это обусловлено различными методами "уплотнения" информации на диске.
Для того чтобы считать DVD-диск, необходимо новое устройство – DVD-ROM (которое позволяет считывать и CD-ROMдиски).
2.2.1. Основы устройства DVD. Как и CD-ROM, диски DVD
хранят данные за счет расположенных насечек вдоль спиральных
треков на отражающей металлической поверхности, покрытой
пластиком. Используемый в устройствах чтения DVD-дисков лазер скользит вдоль треков по насечкам, а отраженный луч интерпретируется приемным устройством в виде единиц или нулей.
Основное требование при разработке DVD было простым:
увеличить емкость хранимых данных за счет расположения как
можно большего числа насечек вдоль треков на диске, при этом
технология изготовления должна быть дешевой.
Результатом исследований стала разработка более высокочастотного полупроводникового лазера с меньшей длиной волны,
вследствие чего стало возможным использовать насечки более маленького размера (рис. 19).
Рис. 19. Структура CD- и DVD-дисков
В то время, как лазер в обычном устройстве CD-ROM имеет
длину волны 780 нм, устройства DVD используют лазер с длиной
26
волны 650 нм или 635 нм, что позволяет покрывать лучом в два
раза больше насечек на одном треке и в два раза больше треков,
расположенных на одной записанной поверхности.
Другие нововведения – это новый формат секторов, более
надежный код коррекции ошибок и улучшенная модуляция каналов.
Вместе эти улучшения дополнительно увеличивают плотность
записи данных в полтора раза. Жесткие производственные требования и незначительно большая поверхность записи стали последним препятствием при разработке DVD, из-за чего емкость данных, размещаемых на диске, ограничена 4,7 Гбайт.
Для записи видео и звука на DVD применяется очень сложная
технология компрессии данных, носящая имя MPEG-2. MPEG-2
представляет из себя следующее поколение стандарта на сжатие
(компрессию) видео- и звуковых данных, обеспечивающего возможность разместить большие объемы информации в меньшем
пространстве.
2.2.2. Типы DVD-дисков. Большинство DVD-дисков с диаметром 120 мм имеют емкость 4,7 Гбайт. Применение схем удвоения плотности и их комбинирования позволяет создавать диски
большей емкости.
Простейшим способом удвоения емкости является использование двухсторонних дисков. Производители могут изготавливать
диски DVD толщиной 0,6 мм, что в половину меньше толщины
стандартного диска CD. Это дает возможность соединить два диска обратными сторонами и получить удвоенную емкость.
По другой технологии создается второй слой для размещения
данных, это позволяет увеличить емкость одной стороны диска.
Первый слой делается полупрозрачным, таким образом лазерный
луч может проходить через него и отражаться уже от второго слоя.
Но это предъявляет определенные требования к полупрозрачному
слою.
Выделяют следующие структурные типы DVD:
1. DVD-5 (Single Side/Single Layer, односторонний/однослойный) – это самая простая структура DVD-диска. На таком диске
можно разместить до 4,7 Гбайт данных. Такой DVD-диск состоит
из 0,6 мм пленки, покрытой алюминием и наклеенной на чистую
27
подложку. Алюминиевая пленка имеет толщину 55 нм, как и для
CD-дисков. Структура диска отображена на рис. 20.
Рис. 20. Структура диска DVD-5
2. DVD-9 (Single Side/Dual Layer, односторонний/двухслойный) – этот тип дисков имеет два слоя данных, один из которых
полупрозрачный. Оба слоя считываются с одной стороны и на таком диске можно разместить 8,5 Гбайт данных. Структура диска
отображена на рис. 21.
28
Рис. 21. Структура диска DVD-9
Полупрозрачный слой отражает 18–30 % лазерного излучения.
Этого достаточно, чтобы можно было считывать информацию с
верхнего слоя. И в то же время полупрозрачный слой будет пропускать достаточно излучения, чтобы сигнал от нижнего уровня с
высокой отражательной способностью тоже читался. Информационные уровни разделяет высокооднородный клей (толщина клеевой
прослойки составляет 40–70 мкм), используемый для соединения
двух половин диска. Это расстояние необходимо, чтобы различить
сигнал, отраженный от одного и другого уровней.
3. DVD-10 (Double Side/Single Layer, двусторонний/однослойный) – на таком диске помещается 9,4 Гбайт данных (по 4,7 Гбайт
на каждой стороне). Емкость такого диска вдвое больше одностороннего/однослойного DVD-диска. Между тем из-за того, что данные располагаются с двух сторон, придется переворачивать диск
или использовать устройство, которое может прочитать данные с
обеих сторон диска самостоятельно (рис. 22).
Рис. 22. Структура диска DVD-10
4. DVD-18 (Double Side/Double Layer, двусторонний/двухслойный) – структура этого диска обеспечивает возможность раз29
местить на нем до 17 Гбайт данных (по 8,5 Гбайт на каждой стороне) (рис. 23).
Рис. 23. Структура диска DVD-18
В портативной технике (видеокамеры) применяются DVDдиски диаметром 80 мм с емкостью 1,46 Гбайт (односторонний/однослойный), 2,66 Гбайт (односторонний/двухслойный), а
также могут быть использованы двусторонние диски.
Примечание. Все приведенные цифры соответствуют емкости, указанной
в миллионах байтов. Если округлять по другой методике, принимая за основу,
что 1 Кб = 1024 байта, а не 1000 байт, то получается "информационная" емкость 120 мм дисков: 4,38 Гбайт, 7,95 Гбайт, 8,75 Гбайт и 15,9 Гбайт соответственно.
2.2.3. Форматы DVD. Количество форматов дисков не так велико, как для КД. В качестве файловой системы может быть использован стандарт ISO 9660 (Joilet) или более подходящая для
DVD файловая структура UDF (Universal Disk Format) – универсальный дисковый формат для хранения файлов на оптических носителях. В итоге были предложены следующие типы организации:
1. DVD-Video – такой тип говорит о том, что диск содержит
видеоданные, при этом файлы на диске должны быть структурированы определенным образом.
Зона DVD-Video содержит все файлы, необходимые для воспроизведения DVD-Video, которые должны находиться в каталоге
VIDEO_TS. Эта зона построена из одного видеоменеджера (VMG,
Video Manager) и нескольких наборов видеозаголовков (VTS,
Video Title Sets). VMG состоит из информации видеоменеджера
(VMGI, Video Manager Information), набора видеообъектов для
30
меню VMG (VMGM_VOBS, Video Object Set for VMG Menu) и
резервной VMGI (BUP) (рис. 24).
Рис. 24. Файловая структура диска DVD-Video
VMGI содержит управляющую информацию для всей зоны
DVD-Video и состоит из одного файла с именем VIDEO_TS.IFO.
В VMGM_VOBS, состоящем из одного файла с именем
VIDEO_TS.VOB, находится содержимое меню выбора заголовка.
VMGI(BUP) представляет собой полную копию VMGI и состоит из одного файла с именем VIDEO_TS.BUP.
VMGM_VOB может отсутствовать, но наличие двух остальных типов информации обязательно.
В соответствии со спецификацией потока программы MPEG-2
видео, звук и данные элементов субграфики из презентационных данных мультиплексируются с частью навигационных данных. Структура блока и пакета соответствует этой спецификации,
каждый блок содержит 2048 байт. Скорость мультиплексирования
(mux_rate) составляет 10,08 Мбит/с.
Видеоданные существуют в виде одного потока данных, сжатого в соответствии с требованиями видеоформата MPEG-2. Для
обеспечения высокого качества изображения поток поддерживает
переменную скорость передачи данных с максимальным значением 9,8 Мбит/с.
31
Формат DVD-Video совместим со стандартами NTSC и PAL и
поддерживает форматное соотношение 4:3 и 16:9 (разрешение видео 720 × 480 и 720 × 576 соответственно).
На диске DVD-Video могут использоваться следующие форматы звука: линейная импульсно-кодовая модуляция (ИКМ,
PCM – Pulse Code Modulation), Dolby Digital (AC3), DTS и
MPEG audio. Каждая видеопрограмма может иметь до восьми
аудиопотоков, которые характеризуются различными атрибутами,
например, языком. Каждый поток состоит из нескольких каналов.
При использовании линейной ИКМ или DTS звуковое сопровождение DVD может иметь частоту дискретизации до 96 кГц с
разрешением до 24 бит. Для Dolby Digital и MPEG audio частота
дискретизации составляет 48 кГц.
Особенностью DVD является использование элементов
субграфики, что позволяет задать какие-либо данные (например,
субтитры, меню, тексты караоке), которые затем будут демонстрироваться в виде растровой картинки поверх основного видеосюжета. Эти данные сжаты с использованием кодирования длины повторения. Для каждой видеопрограммы может быть до 32 потоков
элементов субграфики.
Такая организация позволяет размещать на одном диске DVDVideo несколько видеофрагментов, которые могут быть связаны
общим меню и иметь поясняющий материал, реализованный в виде субграфики.
2. DVD-Audio – тип DVD-диска, обеспечивающий хранение
аудиоинформации. По своей структуре напоминает DVD-Video с
несколькими отличиями.
Имеется зона DVD-Audio (каталог AUDIO_TS), содержащая
следующие элементы:
а) простой аудиоменеджер (Simple Audio Manager, SAMG),
состоящий из файла AUDIO_PP.IFO, который является эквивалентом таблицы содержания компакт-диска;
б) аудиоменеджер (Audio Manager, AMG) – описывает структуру диска для воспроизведения. Содержит файл AUDIO_TS.IFO,
дополнительно файл видео с меню AUDIO_TS.VOB и резервный
файл AUDIO_TS.BUP;
в) данные видеоряда (Audio Still Video Set, ASVS) – опциональная часть, содержащая статические изображения, отображаю32
щиеся при воспроизведении аудиоданных, сохраняются в формате
AUDIO_SV.*;
г) аудиообъект (Audio Objects, AOBs) – непосредственно
аудиоданные, сохраненные в соответствующем звуковом формате:
PCM, Dolby Digital, DTS или MPEG Audio.
На диске DVD-Audio также может содержаться несколько
звуковых дорожек.
DVD-Audio может иметь аудиоданные с более высокой частотой дискретизации – 176,4 или 192 кГц c разрешением 24 бита, но
тогда на диске может быть не более двух звуковых каналов (форматы PCM, DTS).
3. DVD-Data – может содержать любые данные, которые соответствуют используемой файловой системе и "не пересекаются"
с первыми двумя форматами.
4. Cмешанный тип – в этом случае на одном диске может
быть размещена аудио-, видеоинформация и данные пользователя.
2.2.4. Информационная защита дисков. Благодаря возможности DVD создавать качественные цифровые копии фильмов, кинокомпании подготовили комплекс мер по защите авторских прав.
Основная их часть – это кодирование (шифрование) видеоданных,
размещаемых на DVD, которые должны расшифровываться перед
выводом изображения на экран, что приводит к увеличению
нагрузки на процессор для выполнения операции по дешифрованию.
Наибольшее распространение получил такой способ защиты,
как запись DVD-диска для специальной зоны. Весь мир поделили
на 6 зон, и если используется проигрыватель для первой зоны, то
невозможно будет посмотреть на нем фильм, записанный для второй зоны. Список зон:
1. Северная Америка.
2. Япония, Европа, Средний Восток, Южная Африка.
3. Юго-Восточная Азия (включая Гон-Конг).
4. Австралия, Новая Зеландия, Центральная и Южная Америка.
5. Северо-Западная Азия (Россия), Северная Африка.
6. Китай.
Однако производители аппаратуры выпускают "мультизонные" устройства, которые могут многократно изменять "свою" зо33
ну (определенное количество раз или бесконечное) и поддерживать воспроизведение DVD-диска из "другой" зоны.
2.2.5. Запись информации на DVD-диски. Так же, как и для
CD-дисков существуют однократно (DVD-R, DVD+R) и многократно (DVD-RAM, DVD-RW, DVD+RW) записываемые DVDдиски. Принципы организации таких дисков схожи с соответствующими типами КД, однако есть и особенности реализации:
1. DVD-RAM – перезаписываемый DVD-диск, предложенный
организацией «DVD Forum» в 1998 году. Для перезаписи используется технология изменения фазы (phase change technology) (как в
жестких дисках), благодаря чему диски имеют повышенное количество циклов перезаписи – до 100 000 раз. Необходимость "увеличения" ресурса за счет уменьшения воздействия внешней среды
на поверхность дисков (царапины и т. п.) привела к выпуску дисков в защищенных картриджах, что потребовало использования
специальных устройств считывания/записи, которые также обеспечивали считывание типовых CD и DVD-дисков. Емкость первых
таких дисков составляла 2,6 Гбайт (односторонний диск, 1998 год)
и 4,7 Гбайт (односторонний диск, 1999 год).
2. DVD-R, DVD-RW – спецификации также были разработаны
организацией «DVD Forum» и касаются в основном способа записи информации. Количество циклов перезаписи – до 1000 раз.
Для записи DVD привод обычно получает от диска три типа
данных:
а) данные для трекинга (отслеживания дорожек), которые позволяют приводу записывать питы точно на дорожку;
б) данные адресации, которые позволяют приводу записывать информацию в отведенные места на диске;
в) данные о скорости вращения диска.
В DVD-R/RW-дисках информация трекинга и скорости заключена в «дрожании» (wobble) дорожек, а адресация и другая служебная информация содержится в предзаписанных питах между
канавками (land pre-pits, LPP) (рис. 25).
34
Рис. 25. Запись на DVD-R/RW-диски
Наличие LPP определяют по скачкам амплитуды специального
сигнала «дрожания». Указанные скачки происходят при нахождении головки рядом с предзаписанным питом. Частота дрожания
(wobble frequency) для DVD-R/W-дисков составляет 140,6 кГц.
3. DVD+R, DVD+RW – разработаны организацией «DVD-RW
Alliance», в которую вошли несколько известных компаний
(например «Sony», «Philips» и другие). Спецификации указанных
дисков появились в 2001 (RW) и 2002 (R) годах. Количество циклов перезаписи – до 1000 раз.
В дисках DVD+R/RW используется более высокая частота дрожания – 817,4 кГц, а служебная информация содержится в изменении
фазы сигнала дрожания, т. е. хранится в самой дорожке (рис. 26). Такой метод записи служебной информации называется «адресация в
преднанесенных канавках» (ADress In Pre-groove, ADIP).
Рис. 26. Запись на DVD+R/RW-диски
Таким образом запись на диск может осуществляться с более
высокой скоростью и в целом качество записи будет также выше
по сравнению с записью на DVD-R/RW диски.
35
Сами форматы "DVD-R/RW" и "DVD+R/RW" между собой не
совместимы, однако возможно считывание информации с них на
современных оптических устройствах.
Если говорить о применении, то первоначально DVD-R/RW
ориентировались на использование в бытовых устройствах, т. к.
читались большинством подобных устройств, а DVD+R/RW – на
рынок персональных компьютеров, т. к. стандарт появился позднее и старые DVD-устройства не могли считывать информацию,
записанную на подобных носителях.
Практически все современные устройства работы с DVD,
осуществляющие запись DVD-дисков, поддерживают все форматы
дисков – DVD-R/RW и DVD+R/RW.
2.3. Стандарты HD DVD и Blu-Ray
Очередной виток развития киноиндустрии в попытке предложить пользователю видео максимального качества заставил искать
способы увеличения емкости оптических носителей информации.
В итоге два консорциума предложили 2 стандарта дисков нового
поколения для хранения больших объемов информации.
2.3.1. HD DVD (High-Definition/Density DVD) – DVD высокой
четкости/емкости – технология записи оптических дисков, разработанная компаниями «Toshiba», «NEC», «Sanyo» в 2006 году.
В основу HD DVD легли диски типовых размеров (80 и 120 мм в
диаметре) и сине-фиолетовый лазер с длиной волны 405 нм (рис. 27).
36
Рис. 27. Структура диска HD DVD
Использование такого лазера позволило еще больше "уплотнить" размещение питов и лэндов на диске за счет уменьшения их
размеров.
Емкость 120 мм дисков составила: однослойный диск HD DVD
– 15 Гбайт, двухслойный – 30 Гбайт и трехслойный диск – 45 Гбайт.
Емкость 80 мм: однослойные – 9,4 Гбайт, двухслойные – 18,8
Гбайт.
При этом диски могли быть однократно (HD DVD-R) и многократно (HD DVD-RW, HD DVD-RAM) записываемыми. Для DVDRAM емкость диска составляла 20 Гбайт за счет использования
метода с произвольным доступом.
Структура данных. HD-DVD использует те же самые структуры данных, что и стандартные DVD, где основным понятием являлся сектор, с тем исключением, что блок коррекции ошибок был
увеличен в 2 раза по сравнению с DVD.
Как и на DVD, слой данных HD DVD располагается в 0,6 мм
от поверхности диска и таким образом защищен от механических
повреждений.
В HD DVD может использоваться несколько разных файловых
систем, например ISO 9660 (Joilet) или UDF.
37
HD DVD поддерживает множество разрешений: от низкокачественных CIF (352 × 288 при 29,97 кадрах/сек) и телевизионного
разрешения (Standart Definition TV), всех разрешений DVD-Video
до видео высокой четкости (High Definition TV) 720p, 1080i и
1080p. Кодирование видео может осуществляться в "старом" формате MPEG2 и более новых: VC-1 и AVC.
Стандарт HD DVD поддерживает 2 канала звука 24-бит/192
КГц или до 8 24-бит/96 КГц, с форматом звука PCM, Dolby Digital
EX, DTS, Dolby Digital Plus и Dolby TrueHD, а также опциальных DTS-HD High Resolution Audio и DTS-HD Master Audio. Последние 3 поддерживают вывод звука на 7.1 звуковые системы.
2.3.2. Стандарт Blu-Ray. Стандарт предложен консорциумом
«BDA» (Blu-Ray Disc Association), специально созданным с целью
разработки нового формата оптического носителя повышенной
плотности для хранения цифровых данных. Название blue ray (синий луч) обусловлено тем, что для считывания информации используется "синий" лазер с длиной волны 405 нм, а Blu-Ray – это торговая марка. Разработка стандарта велась с 2000 года, однако окончательный вариант спецификации был опубликован в 2006 году.
По сравнению с DVD была изменена структуры диска при
неизменном диаметре (рис. 28) – уменьшена толщина защитного
слоя до 0,1 мм (вместо 0,6 мм), что предоставило возможность более качественно проводить операции чтения/записи.
Это позволило записывать информацию в меньшие точки на
диске (рис. 29), а значит хранить больше информации в физической области диска, а также увеличить скорость считывания до
432 Мбит/сек.
38
Рис. 28. Структура диска Blu-Ray
Рис. 29. Диаметры лазерных пучков на поверхности диска
В итоге, после “уменьшения” толщины защитного слоя, диски
стали более чувствительны к царапинам и это требовало использование картриджей, однако в 2004 году компания «TDK» разработала новое полимерное покрытие Durabis, устойчивое к царапинам, за счет этого надобность в использовании картриджей отпала.
Емкость дисков составила:
диски с диаметром 120 мм: однослойные – 25 Гбайт, двухслойные – 50 Гбайт;
диски с диаметром 80 мм (mini Blu-Ray): однослойные – 7,8
Гбайт, двухслойные – 15,6 Гбайт.
Согласно спецификации диски Blu-Ray могут быть многослойными (подобно дискам DVD).
Было предложено три типа дисков:
1) BD-ROM – диски только для чтения, обеспечивающие хранение HD-фильмов, игр, программного обеспечения и т. п.;
39
2) BD-Recordable (BD-R) – однократно записываемые диски
для записи видео и данных пользователя;
3) BD-ReWritable – многократно перезаписываемые диски
для записи видео и данных пользователя.
Дальнейшее развитие дисков – повышение количества слоев
на одном диске. В 2010 году разработан формат дисков BDXL,
имеющих емкость до 128 Гбайт (4 слоя), однако их использование
возможно только на «новых» устройствах, поддерживающих работу с многослойными дисками.
Структура данных. На дисках Blu-Ray может использоваться
файловая система UDF версии 2.5 или 2.6. Пользовательские данные могут быть сохранены в любом месте, а различные видео- и
аудиоданные должны быть структурированы определенным образом:
1. Каталог BDAV – используется хранение аудио- и видеоданных (рис. 30).
40
Рис. 30. Структура хранения BDAV
Файлы, хранящиеся в «корневом» каталоге BDAV, содержат
управляющую информацию и плей-листы диска, меню, ссылки на
основную информацию. Каталог PLAYLIST содержит реальные и
виртуальные плей-листы, CLIPINF – информационные файлы,
STREAM – потоковые файлы видео/аудио, BDAV 1, 2, 3 – содержат копии файлов управляющей информации и подкаталогов. Каталоги AACS и AACS_av хранят ключи защиты и определяют
возможность считывания/записи информации.
2. Каталог BDMV – предназначен для создания фильмов с интерактивными возможностями за счет использования технологии
JAVA (рис. 31).
Рис. 31. Структура хранения BDMV
Структура расширена по сравнению с организацией BDAV.
Рассмотрим, что было добавлено: AUXDATA – каталог с файлами
41
интерактивного сопровождения, META – хранятся файлы поиска
для библиотеки метаданных и заголовки сцен, BDJO – содержит
объекты BD-J, JAR – архивные файлы Java BD-J, BACKUP – в
нем хранятся копии основных файлов, CERTIFICATE – содержит
файлы сертификатов BD-J, BDSVM – файлы расширений BD+ для
реализации дополнительной защиты.
Поддерживаемые форматы видео и аудио. Видеоинформация на Blu-Ray дисках может иметь разрешение от стандартного
DVD (720  480) до 1920  1080 (FullHD) с частотой 59,94 кадра/сек.
и кодироваться алгоритмами MPEG-2, H.264/MPEG-4 AVC, VC-1.
Стандарт Blu-Ray поддерживает воспроизведение аудиоинформации, которая может быть представлена в форматах линейный
PCM (LPCM) (битрейт до 27,648 Мбит/сек., до 8 каналов при 96 кГц
или до 6 каналов при 192 кГц), Dolby Digital (битрейт 640 кбит/сек.,
количество каналов – 5.1, дискретизация – 48 кГц), Dolby Digital
Plus (4,736 Мбит/сек., каналы – 7.1, дискретизация 48 кГц), Dolby
TrueHD (до 18,64 Мбит/сек., до 8 каналов при 96 кГц или до 6 каналов при 192 кГц), DTS (битрейт до 1,524 Мбит/сек., количество
каналов – 5.1, частота дискретизации – 48 кГц), DTS-HD Master
Audio (до 24,5 Мбит/сек., до 8 каналов при 96 кГц или до 6 каналов при 192 кГц).
Профили Blu-Ray. Профили определяют тип диска Blu-Ray,
по которому проигрыватели определяют возможность ими воспроизведения данных дисков и требования к их аппаратной части.
Диски BD-Video имеют 4 профиля: Profile 1.0 – базовый формат
видеодиска, поддерживаемый всеми устройствами воспроизведения (они должны иметь буфер размером 64 кбайта), Profile 1.1
(Bonus View) – на устройстве воспроизведения должно быть 256
Мбайт локальной памяти для реализации вспомогательных функций (реализация функции “картинка-в-картинке”, виртуальной
файловой системы), BD-Live (Profile 2.0) – объем памяти 1 Гбайт
для загрузки данных из сети Интернет, Blu-Ray 3D (Profile 5.0) –
те же требования, что и для Profile 2.0.
Профиль BD-Audio (Profile 3.0) не содержит требований к
устройству при воспроизведении аудиоинформации.
Интерактивные диски Blu-Ray. Использование технологий
JAVA и BD-Live позволяет создавать на дисках интерактивное меню и выполнять различные действия. BD-Live предоставляет поль42
зователю доступ к сети Интернет и различным развлечениям. С
помощью нее может осуществлять загрузку дополнительных материалов, которых нет на диске с фильмом, или скачать какуюлибо информацию.
Спецификация Blu-Ray 3D. Официально она появилась в
2009 году. Эта спецификация определяет представление отдельного кадра для каждого глаза (стереоскопическое видение), используя специальный кодек MVC (Multiview Video Coding), являющийся расширением кодека AVC, который поддерживают обычные 2D-плееры Blu-Ray. Разница заключается в том, что кодек
MVC определяет два потока информации: один является базовым,
а второй – зависимым от него. Базовый поток кодируется стандартным кодеком 2D H.264, но зависимый поток не является полноценным. Он ссылается на информацию в базовом потоке для
экономии пропускной способности, при этом он описывает отличия, касающиеся отдельной перспективы для второго глаза.
Информационная защита дисков. Так же как и DVD-диски,
Blu-Ray предназначены для воспроизведения в различных зонах:
1. Зона 1 или A – Америка, Восточная и Юго-Восточная Азия
(исключая Китай), Океания.
2. Зона 2 или B – Европа, Австралия, Новая Зеландия, Африка, Ближний Восток, Гренландия.
3. Зона 3 или С – Центральная и Южная Азия, Монголия,
Россия, страны СНГ, Китай.
Дополнительно для защиты авторской информации применяется элемент защиты BD+, который позволяет динамически изменять схему шифрования, т. е. если система была взломана, то всепоследующие копии информации кодируются по другой схеме.
43
3. СРЕДСТВА ДЛЯ РАБОТЫ СО ЗВУКОМ
Звуковая речь является одним из основных видов общения
людей между собой, поэтому при создании различных мультимедийных приложений, обучающих систем может активно применяться звуковое сопровождение. Для работы со звуковой информацией можно выделить следующие технические средства:
1 Акустические системы – обеспечивают вывод звука в аналоговой форме.
2. Звуковые карты – отвечают за ввод, обработку, вывод звуковой информации на акустическую систему.
3. Системы пространственного звучания – сюда можно отнести специализированные звуковые карты и платы, многоканальные ресиверы (усилители), использующие различные технологии
вывода многоканального звука.
3.1. Акустические системы
Основным компонентом любой аудиосистемы является акустическая система (АС). Если проводить аналогии, то АС – это
примерно то же самое, что и монитор, только для восприятия звуковой, а не графической информации. Компьютерные АС, как правило, уступают специализированным Hi-Fi-системам. Зачастую
под АС подразумеваются колонки или наушники, которые обеспечивают вывод звуковой информации.
Колонки подразделяются на:
Пассивные – они не содержат встроенного усилителя и могут
подключаться к звуковым платам, имеющим собственный усилитель (обычно до 4 Вт) и регулятор громкости. Если выходная мощность колонок превышает мощность встроенного усилителя звуковой карты, тогда их необходимо подключать с внешним усилителем.
Активные – подобные колонки оборудованы усилителем и
могут подключаться как к линейному выходу звуковой платы, так
и к выходу ее усилителя. Источником питания для встроенного в
колонки усилителя может являться внутренний аккумулятор или
блок питания, который, в свою очередь, может быть и внутренним,
и внешним. Кроме регулятора громкости, активные колонки могут
иметь и эквалайзер.
Конструктивно акустические системы могут состоять из одного или нескольких динамиков. В последнем случае каждый динамик может быть рассчитан на воспроизведение определенного
44
диапазона частот: низкие, средние и высокие. И тогда говорят о
двух-, трехполосных АС.
Также АС можно разделить по количеству поддерживаемых
каналов. Наиболее распространёнными являются конфигурации
каналов 2.0 (две колонки), 2.1 (две колонки и сабвуфер – выводит
только низкий диапазон частот), 5.1 (пять колонок и сабвуфер) и в
последнее время появились АС формата 6.1 и 7.1. Наушники подразделяются на стерео (2.0) и объемного звучания (5.1).
Примеры АС представлены на рис. 32–34.
Рис. 32. Пассивные колонки
формата 2.0
Рис. 33. Активные колонки
формата 5.1
Рис. 34. Наушники формата 5.1
3.2. Звуковые карты
Звуковые карты используются для создания, записи и воспроизведения различных звуковых сигналов: музыки, речи, шумовых
эффектов.
3.2.1. Устройство звуковых карт. Основным управляющим
элементом звуковой карты является центральный звуковой процессор, непосредственно связанный с основным интерфейсом карты (PCI, PCI-E) (рис. 35).
45
Рис. 35. Структурная схема звуковой карты
По интерфейсу карта получает команды и звуковые данные
для воспроизведения, по нему же она выдает подтверждения и записанные звуковые данные. Непосредственно с центральным
процессором, отвечающим за обработку "цифрового" звука, соединены и цифровые входы и выходы.
Аналоговые входы и выходы соединены с центральным
процессором карты через микшер – устройство выбора источников сигнала, регулировки их уровней и смешивания сигналов между собой.
АЦП – аналогово-цифровой преобразователь (ADC, Analog
Digital Converter).
ЦАП – цифроаналоговый преобразователь (DAC, Digital Analog Converter).
С помощью АЦП и ЦАП обеспечивается возможность моноили стереофонической записи и воспроизведения аудиофайлов.
Разрядность АЦП и ЦАП, как правило, составляет 16 бит или 24
бит, частота дискретизации – от 5 до 192 кГц, возможна компрессия звука (например, по методу ADPCM), позволяющая уменьшать
объем создаваемых звуковых файлов. Звуковые карты, подключаемые к слотам расширения материнской платы, используют также
8- и/или 16-битный канал прямого доступа к памяти (Direct
Memory Access, DMA), прерывание и порты ввода-вывода. При
46
использовании двух каналов DMA возможны одновременная запись и воспроизведение аудиосигналов, что реализуется только в
полнодуплексных картах (Full-Duplex). Возможность двунаправленной работы многих звуковых карт сейчас активно используется
для общения через Internet, когда одновременно обеспечиваются и
прием, и передача звуковой информации.
Как правило, микшер и преобразователи в недорогих звуковых
картах выполнены в корпусе одной микросхемы.
Микшер карты, по сути, представляет собой набор управляемых усилителей, коэффициенты усиления которых регулируются
под управлением центрального процессора карты. При необходимости смешивания сигналов от разных источников (например CD
и линейного входа) может оказаться, что линейный вход сильно
зашумлен и даже в отсутствие полезного сигнала на нем эти шумы
будут присутствовать в выходном сигнале карты. Для их подавления придется заглушить неиспользуемые в данный момент источники сигнала в программе управления микшером карты.
Карта может иметь либо только линейный (слабосигнальный)
выход, либо только усиленный выход для наушников, либо оба
выхода одновременно. Некоторые карты могут иметь перемычки,
которые выбирают, куда будет подключено единственное гнездо
выхода – непосредственно к микшеру или к оконечному усилителю. На упрощенных вариантах карт предусмотренный схемой выходной усилитель может отсутствовать, а перемычки впаиваются в
положение «линейный выход». Поэтому подключать любую
внешнюю аппаратуру, а также активные колонки следует только к
линейному выходу карты.
3.2.2. Особенности звуковых карт. АЦП и ЦАП. Как уже
отмечалось, звуковая карта (аудиоадаптер) имеет аналоговоцифровой преобразователь (АЦП), периодически определяющий
уровень звукового сигнала и превращающий этот отсчет в цифровой код. Он и записывается на внешний носитель уже как цифровой сигнал.
Цифровые выборки реального звукового сигнала хранятся в
памяти компьютера (например, в виде WAV-файлов). Считанный с
диска цифровой сигнал подается на цифроаналоговый преобразователь (ЦАП), который преобразует цифровые сигналы в аналоговые. После фильтрации их можно усилить и подать на акустические колонки для воспроизведения. Важными параметрами аудио47
адаптера являются частота квантования звуковых сигналов
(дискретизация) и разрядность квантования.
Частоты квантования (дискретизация) показывают, сколько
раз в секунду берутся выборки сигнала для преобразования в цифровой код. Обычно они лежат в пределах от 4–5 КГц до 45–48 КГц
в современных звуковых картах. Разрядность квантования характеризует число ступеней квантования и изменяется степенью
числа 2. Так, 8-разрядные звуковые карты имеют 28 = 256 степеней, что явно недостаточно для высококачественного кодирования
звуковых сигналов. Поэтому применяются в основном 16, 20, 24,
32-разрядные звуковые карты.
3.2.3. Обработка звука. Также звуковые карты могут обрабатывать звук. Под обработкой звука следует понимать различные
преобразования звуковой информации с целью изменения какихто характеристик звучания. К обработке звука относятся способы
создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и
т. д. Перечислим основным типы обработки:
1) амплитудные преобразования – выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала;
2) частотные преобразования – выполняются над частотными составляющими звука: сигнал представляется в виде спектра
частот через определенные промежутки времени, производится
обработка необходимых частотных составляющих, например, фильтрация, и обратное «сворачивание» сигнала из спектра в волну;
3) фазовые преобразования – сдвиг фазы сигнала тем или
иным способом; например, такие преобразования стереосигнала
позволяют реализовать эффект вращения или «объёмности» звука;
4) временные преобразования – реализуются путем наложения, растягивания и/или сжатия сигналов; позволяют создать,
например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.
Приведем несколько практических примеров использования
указанных видов преобразований при создании реальных звуковых
эффектов:
1. Echo (эхо). Реализуется с помощью временных преобразований. Фактически для получения эха необходимо на оригинальный входной сигнал наложить его задержанную во времени ко48
пию. Для того чтобы человеческое ухо воспринимало вторую копию сигнала как повторение, а не как отзвук основного сигнала,
необходимо время задержки установить равным примерно 50 мс.
На основной сигнал можно наложить не одну его копию, а несколько, что позволит на выходе получить эффект многократного
повторения звука (многоголосного эха). Чтобы эхо казалось затухающим, необходимо на исходный сигнал накладывать не просто
задержанные копии сигнала, а приглушенные по амплитуде.
2. Reverberation (повторение, отражение). Эффект заключается в придании звучанию объемности, характерной для большого
зала, где каждый звук порождает соответствующий, медленно угасающий отзвук. Практически с помощью реверберации можно
«оживить», например, фонограмму, сделанную в заглушенном помещении. От эффекта «эхо» реверберация отличается тем, что на
входной сигнал накладывается задержанный во времени выходной
сигнал, а не задержанная копия входного. Иными словами, блок
реверберации упрощенно представляет собой петлю, где выход
блока подключен к его входу, таким образом уже обработанный
сигнал каждый цикл снова подается на вход, смешиваясь с оригинальным сигналом.
3. Chorus (хор). В результате его применения звучание сигнала превращается как бы в звучание хора или в одновременное звучание нескольких инструментов. Схема получения такого эффекта
аналогична схеме создания эффекта эха с той лишь разницей, что
задержанные копии входного сигнала подвергаются слабой частотной модуляции (в среднем от 0,1 до 5 Гц) перед смешиванием
со входным сигналом. Увеличение количества голосов в хоре достигается путем добавления копий сигнала с различными временами задержки.
3.2.4. Синтез звука. Другой способ воспроизведения звука заключается в его синтезе. При поступлении на синтезатор некоторой управляющей информации по ней формируется соответствующий выходной сигнал. Управляющие команды для синтеза звука
могут поступать на звуковую карту не только от компьютера, но и
от другого, например, MIDI-устройства.
MIDI (Music Instrument Device Interface) – стандарт на язык и
аппаратуру представления звуков различных инструментов. Команды MIDI сообщают аппаратуре, у какого инструмента на какой
октаве и какая нота должна звучать. Поэтому запись мелодии в
49
MIDI-командах очень компактна. Существует много разновидностей этого стандарта: General MIDI, Roland MT-20 и т. д. MIDI
определяет протокол передачи команд по стандартному интерфейсу. MIDI-сообщение содержит ссылки на ноты, а не запись музыки
как таковой. В частности, когда звуковая карта получает подобное
сообщение, оно расшифровывается (какие ноты каких инструментов должны звучать) и отрабатывается на синтезаторе. В свою
очередь компьютер может через MIDI управлять различными “интеллектуальными” музыкальными инструментами с соответствующим интерфейсом.
Синтезатор обеспечивает имитацию звучания музыкальных
инструментов и воспроизведение различных звуков при выполнении команд MIDI.
Синтезатор может быть выполнен как на основе FM-синтеза,
так и на основе таблицы волн.
FM Music Synthesizer – синтезатор MIDI с частотной модуляцией (Frequency Modulated) имеет несколько каналов (голосов).
Каждый канал содержит два и более синусоидальных генератора
(оператора), управляющих параметрами (частота, амплитуда) друг
друга. Качество звука при чистом синтезе среднее даже при двадцатиголосом синтезаторе, так как все звуки инструментов создаются искусственно.
WT Music Synthesizer – синтезаторы с табличным синтезом
(Wave Table), хранящие в своей постоянной памяти образцы (волновые таблицы – цифровые последовательности выборок) сигналов настоящих "живых" инструментов для нескольких нот диапазона по каждому инструменту. Как правило, минимальный объем
таблицы – 1 Мбайт. На некоторых звуковых картах возможна
установка дополнительной памяти для загружаемых таблиц, которые могут быть созданы самим пользователем. Качество волнового синтеза высокое, но при более высокой цене.
При FM-синтезе возможно одновременное звучание до 20 инструментов, а с использованием таблицы волн – до 512 и более. В
первых звуковых картах, использующих синтез по таблице волн
(например, Sound Blaster 32 или Sound Blaster AWE64), последние
цифры означали максимальное количество одновременно звучащих инструментов. Звуковые карты на PCI, как правило, не имеют
встроенной таблицы волн. Для уменьшения их стоимости таблица
(таблицы) загружается в обычную память компьютера, что позво50
ляет даже с самыми недорогими аудиокартами использовать волновые таблицы большого объема и, соответственно, с большим
количеством инструментов (до 512) и более высоким качеством
звучания.
3.2.5. Цифровой интерфейс. В последнее время на звуковых
картах (в том числе и на встроенных в материнскую плату) стали
использоваться цифровые выходы интерфейсом S/PDIF (Sony/Philips
Digital Interface) – цифровой интерфейс от компаний «Sony» и
«Philips». Фактически это стандарт интерфейса связи компьютерного оборудования с бытовой аудиоаппаратурой и электронными
музыкальными инструментами. Такой интерфейс, в частности,
служит для подключения выхода аппаратного DVD-декодера к
аудиоаппаратуре. Для обмена данными в S/PDIF может использоваться обычный экранированный аудиокабель. Это позволяет
устранить возможные потери качества звучания на выходе ЦАП.
Звуковые карты PCI имеют 32-разрядную шину для обмена
данными, но процедуры цифровой обработки звука и приема/передачи результатов обработки могут быть с разрядностью 64
и более.
Большинство звуковых карт с цифровым интерфейсом поддерживают вывод звука для систем пространственного звучания в
форматах AC3 (Dolby Digital), DTS (об этом будет сказано чуть
ниже).
3.2.6. Разъемы звуковых карт. Звуковая карта имеет набор
разъемов для подключения внешних аналоговых и цифровых сигналов:
1. Входные – микрофон, линейный вход, CD-ROM аналоговый (разъем для его подключения обычно размещен на самой карте для присоединения аудиовыхода CD-ROM-привода), CD-ROM
цифровой вход (на некоторых новых PCI-картах).
2. Выходные – линейный выход, выход на колонки или
наушники. Встроенный усилитель имеет мощность до 4 Вт на канал, большинство звуковых карт с 1999 года имеют усилитель с
выходной мощностью, достаточной только для наушников.
Для создания мелодий с помощью синтезатора на звуковой
карте существуют специальные MIDI-клавиатуры типа рояльной,
простейшие фиксируют и передают только факты нажатия/отпускания клавиш (рис. 36).
51
Рис. 36. MIDI-клавиатура
Более сложные MIDI-клавиатуры имеют динамические датчики, реагирующие на силу и скорость нажатия (в сочетании с хорошим wavetable – синтезатором возможна достаточно полная имитация различных инструментов). MIDI-интерфейс имеют многие профессиональные и полупрофессиональные клавишные синтезаторы.
3.2.7 Спецификация AC`97. В 1997 году подразделением Intel
Architecture Labs был предложен стандарт AC`97 (Audio Codec `97)
для использования в системных платах, модемах и звуковых картах.
На рис. 37 представлен самый полный вариант стандарта
AC'97: аналоговый чип выполняет функции как аудио, так и модемного кодека - AMC'97. Что касается цифрового контроллера
AC'97, то в спецификации AMR (Audio Modem Riser) он уже соответственно и называется AMR-контроллер, а под AC'97 подразумевается только чип кодека.
Рис. 37. Функциональная схема стандарта AC`97
52
Функционально AC'97 состоит из двух физически разнесенных частей: для улучшения соотношения сигнал/шум аналоговый
и цифровой блоки разделены по разным чипам, в результате чего
это самое соотношение получается больше 90 Дб. AC'97 Analog –
блок кодеков аналог/цифра и обратных преобразований (упрощенно блок ЦАП, АЦП). Второй частью является другой чип – Digital
AC'97 Controller, который и выполняет операции над цифровым
звуком – микширование, изменение частоты выборки и т. д. Спецификация определяет и интерфейс для их общения – пятипроводный двунаправленный цифровой AC-link.
Некоторые возможности кодека могут быть реализованы программно, на уровне драйверов AC'97-звука. Например, некоторые
кодеки, которые умеют обрабатывать данные только с определенной частотой дискретизации, нуждаются в преобразовании на стороне системы.
Стандарт AC`97 активно применялся на системных платах,
чтобы обеспечить вывод звука для пользователей, не желающих
покупать дорогостоящие звуковые карты. При этом для удешевления производства, как уже было отмечено, часть функций звуковой карты, связанных с обработкой звука, возлагалась на центральный процессор (программная обработка).
Спецификация AC`97 предполагает работу со звуком формата
2.0 (стерео) максимальным потоком данных до 11,5 Мбит/сек. при
частоте дискретизации 96 кГц и разрядности 20 бит. В системе
может быть одно звуковое устройство и имеется ограниченная
привязка входов и выходов к соответствующим разъемам звукового кодека.
3.2.8. Спецификация HD-Audio. Необходимость обработки
более качественного звука и распространение многоканальных систем (системы пространственного звучания, см. ниже) привели к
расширению спецификации AC`97. В 2004 году была предложена
новая спецификация HD-Audio (High Definition Audio) – звук высокой четкости.
Основные отличительные особенности HD-Audio:
1) поддерживаемая частота дискретизации от 5 до 192 кГц;
2) разрядность 8, 16, 20, 24, 32 бита;
3) до 16 каналов на 1 поток;
4) полоса пропускания до 24 Мбит/сек на ввод и до 48
Мбит/сек. на вывод;
53
5) поддержка форматов звука 5.1, 6.1 и 7.1 (Dolby Digital, Dolby Digital Surround-EX, DTS, DTS-ES);
6) полное автоматическое переопределение выходов/входов
звукового кодека (например в гнездо, маркированное как «наушник», можно подключить «микрофон», и драйвер звукового кодека
автоматически переназначит входы и выходы).
На сегодняшний день это основная спецификация звукового
кодека, реализуемого на современных материнских платах. При
этом звуковые кодеки (Realtek, VIA, Intel, ADI) могут различаться
между собой аппаратной частью, однако совместимы между собой
благодаря спецификации HD-Audio.
3.3. Системы пространственного звучания
В последнее время системы пространственного или объемного
звучания становятся все более и более популярными.
При звуковом оформлении помещений для достижения эффекта присутствия используется специализированное оборудование, которое позволяет выводить звук на большое количество колонок, при этом должны использоваться технические средства по
созданию соответствующего звукового сопровождения.
Для создания систем пространственного звучания используется специальное оборудование – многоканальные усилители (ресиверы), которые позволяют работать с многоканальным звуком.
Также звуковые карты с появлением спецификации HD-Audio стали поддерживать вывод многоканального звука через аналоговые
и цифровые выходы.
Для работы c многоканальным звуком (и его хранения) применяются различные форматы.
3.3.1. Dolby Digital. Стандарт предложен фирмой «Dolby Laboratories» и в него входят несколько форматов.
Dolby Surround AC-3 (Dolby Digital). Система Dolby Surround
AC-3 была определена фирмой «Dolby Laboratories» как звуковая
система для домашнего театра. В связи с тем, что реально эта система для конечного пользователя мало чем отличается от просто
Dolby Digital (предназначенной для профессионального применения), было принято решение об объединении обеих технологий под
общим названием Dolby Digital. Dolby Digital является дальнейшим
улучшением ранее разработанных фирмой «Dolby» технологий
Dolby Surround и Dolby Pro Logic. Изменения коснулись как технологии записи/воспроизведения звука, так и способов его переда54
чи. Информация в технологии Dolby Digital передается только в
цифровой форме и за счет оптимальных способов кодирования занимает небольшой объем (меньше, чем обычный аудиосигнал).
Dolby Surround – одна из первых систем объемного звучания, разработанных инженерами фирмы «Dolby Laboratories». Запись и воспроизведение звука выполняются для четырех каналов:
левого и правого фронтальных каналов, а также левого и правого
тыловых каналов. Сигнал для тыловых каналов кодируется вместе
с сигналами для фронтальных каналов. При воспроизведении стереосигнал требует декодирования для извлечения информации тыловых каналов.
Dolby Pro Logic – система объемного звучания, разработанного инженерами фирмы «Dolby Laboratories». Запись и воспроизведение звука выполняются для пяти каналов: левого, центрального
и правого фронтальных каналов, а также левого и правого тыловых каналов. Отличается от системы Dolby Surround большим разделением фронтальных и тыловых каналов.
Основная задача, которую ставили перед собой разработчики
систем кодирования звука, максимально простыми и недорогими
способами дать возможность пользователю "видеть" источники
звука и четко представлять, где находится источник любого звука.
Естественно, первоначально эти системы задумывались только для
киноиндустрии, так как в кино объединение высококачественного
изображения и объемной звуковой картины дает наиболее сильный и заметный даже для неискушенного слушателя эффект.
Dolby Digital не является форматом 3D-звука и не может использоваться в играх для поддержки самой игровой среды. Звук,
записанный по стандарту Dolby Digital, ничем не отличается от
обычного аудио и не может быть получен "искуственным" путем,
а только соответствующей записью реального, "живого" звука и
не может быть изменен после записи. Поэтому звук Dolby Digital
может сопровождать фильм, концертную запись и т. п. и будет записан на обычной звуковой дорожке к фильму.
После появления DVD-видеодисков стало возможным записывать звуковую дорожку к фильмам на них в формате Dolby Digital.
Одновременно интерес к технологиям от Dolby возник и у производителей звуковых карт, так как совершенно очевидно, что желание, наряду с превосходной картинкой с DVD-диска иметь объемный звук, появилось у владельцев компьютеров достаточно быстро.
55
Требования для прослушивания звука, записанного по технологии Dolby Digital:
1) собственно источник сигнала с Dolby Digital (DVDвидеодиск, аудиодиск);
2) декодер сигнала Dolby Digital. Как правило в звуковых картах есть поддержка декодирования Dolby Digital и 6 выходов для
подключения акустики или многоканальный ресивер (усилитель) с
поддержкой функции декодирования Dolby Digital;
3) акустическая система с числом колонок минимально от 4 до
5 и сабвуфером (он же LFE). Примерный эскиз расположения динамиков, рекомендуемый инженерами Dolby Laboratories, приведен на рис. 38.
Рис. 38. Схема подключения акустической системы 5.1
Блок LFE – Low Frequence Effects Channel – канал для низкочастотных эффектов. Это не сабвуфер, так как низкочастотные динамики могут входить в состав фронтальных акустических систем
и собственно низкочастотные звуки будут воспроизводиться
именно ими. Сюда могут быть направлены звуки мощных низкочастотных источников – взрывы, землетрясения и т. п. Если отсутствует LFE, то эти звуки будут направлены на фронтальные системы и они должны иметь возможность воспроизвести подобные
звуки без искажений.
Примечание. При построении домашних акустических систем 5.1 под блоком LFE подразумевается сабвуфер, т. к. в основном остальные колонки являются одно-, двухполосными.
Под усилителем с декодером подразумевается любой источник декодированного звука Dolby Digital.
Под правым и левым Surround понимаются акустические системы для левого и правого боковых каналов объемного звука. Их
56
не называют просто тыловыми, так как в кинотеатрах в зависимости от длины зала левые и правые Surround системы могут состоять из десятков динамиков как по левой, так и по правой стороне
зрительного зала.
На DVD-дисках обычно есть специальная маркировка, указывающая тип формата записи звука (рис. 39).
а) Моно
б) Стерео
в) Dolby Surround
г) Дискретный
Surround
д) Квадрафонический звук
е) Dolby Digital 5.1
Рис. 39. Маркировка на DVD-диске, указывающая тип записи звука
Любой диск, на котором есть хотя бы один звуковой фрагмент, записанный в формате Dolby Digital, должен иметь специальную маркировку (рис. 40).
Рис. 40. Маркировка диска с форматом Dolby Digital
Особенностью стандарта Dolby Digital является использование
сжатия звука Dolby AC-3 с максимальной скоростью потока 448
кбит/сек. для дисков DVD и до 640 кбит/сек. для дисков Blu-Ray.
DOLBY Surround-EX. Стандарт DOLBY Digital корпорации
«Dolby Digital» предоставляет высококачественный цифровой стереозвук. Начиная с 1992 года в кинотеатрах применялся стандарт
5.1, который определяет 5 отдельных основных каналов звука: левый, центральный, правый, левый окружающий (surround), правый
surround и канал LFE для низкочастотных аудиоэффектов.
Новый стандарт звука DOLBY Surround-EX был разработан в
1999 году и отличается от предыдущих добавлением ещё одного
surround-канала – заднего (рис. 41).
Рис. 41. Логотип стандарта Dolby Digital Surround-EX
57
Формула этого стандарта – "6.1". Таким образом, общее число
каналов составляет 7, из них три обычных, три окружающих
(surround) и один канал аудиоэффектов. Каждый канал может быть
представлен двумя – тремя колонками, а эффекты обычно воспроизводятся через две колонки.
Примерная схема расстановки динамиков по стандарту
DOLBY Surround-EX представлена на рис. 42.
Рис. 42. Расположение акустической системы
по стандарту Dolby Digital Surround-EX
Dolby Pro Logic IIx. Dolby Laboratories представила новый
стандарт объемного звучания – Dolby Pro Logic IIx (рис. 43).
Рис. 43. Логотип стандарта Dolby Pro Logic IIx
В нем использованы элементы Dolby Pro Logic II и Dolby
Digital Surround-EX, предназначен для воспроизведения на 7- или
8-канальных системах традиционных стереозаписей и записей
формата 5.1 без искажений. Новая технология обеспечивает лучшие пространственные эффекты, лучшее позиционирование и
лучший звуковой фон с низкими частотами.
Dolby Digital Plus. Стандарт представлен компаниями «MIPS
Technologies» и «Dolby Laboratories» (рис. 44).
58
Рис. 44. Логотип стандарта Dolby Digital Plus
Это новая технология построения звука для устройств, поддерживающих воспроизведение видео и аудио высокой четкости, например HD
DVD и Blu-Ray-проигрыватели. Позволяет воспроизводить звук в формате до 7.1 с полосой пропускания до 6 Мбит/сек, при этом обратно совместим со стандартом Dolby Digital (старые устройства смогут использовать
только формат звука 5.1).
Dolby TrueHD. Предыдущие форматы оперировали со сжатым звуком, при котором имелись некоторые потери. Новый стандарт Dolby
TrueHD предполагает использование алгоритма сжатия без потерь (lossless) – Meridian Lossless Packing (MLP) для более качественного звучания
(рис. 45).
Рис. 45. Логотип стандарта Dolby TrueHD
Цифровой поток может вмещать до 14 отдельных звуковых каналов
(однако самые распространенные 5.1 и 7.1). Стандарт поддерживает разрядность 24 бит при 192 кГц (полоса пропускания до 63 Мбит/сек.) – для
дисков Blu-Ray доступно 8 каналов с разрядностью 24 бита при 96 кГц
(полоса пропускания до 18 Мбит/сек.).
Для вывода такого формата звука должен использоваться интерфейс
HDMI версии 1.3 и выше.
Примечание. High-Definition Multimedia Interface (HDMI) – интерфейс для мультимедиа высокой четкости, обеспечивающий передачу аудио- и видеоинформации. Существуют несколько версий интерфейса, отличающихся поддержкой различных форматов
передачи данных и полосой пропускания: v1.0 – пропускная способность интерфейса 4,9
Гбит/сек, макс. разрешение видео 1920  1080 с глубиной цвета 8 бит на каждый цвет, количество аудиоканалов 8 (до 192 кГц/24 бит); v1.3 – полоса пропускания до 10,2 Гбит/сек,
глубина цвета видео 10, 12, 16 бит на каждый цвет, поддержка форматов звука Dolby
TrueHD и DTS-HD; v1.4 – увеличено разрешение видео до 3840  2160 при 24/25/30 Гц, возможность создания Fast Ethernet соединения (100 Мбит/сек.), реализована поддержка 3D;
v1.4a – улучшена поддержка 3D (введены обязательные 3D-форматы для игр, фильмов и
телевидения).
3.3.2. DTS. Изначально стандарт разрабатывался для кинотеат59
ров, но в дальнейшем стал использоваться для домашних кинотеатров.
DTS Digital Surround. Стандарт звука DTS (Digital Theatre
System) (цифровые системы для кинотеатров) был разработан в
1993 году компанией «DTS», совладельцами которой являются
Стивен Спилберг и компания «Universal» (рис. 46).
Рис. 46. Логотип стандарта DTS
Первое своё применение он нашёл в фильме "Парк Юрского
периода" и отличается тем, что на киноплёнке нет отдельной цифровой аудиодорожки, а присутствует только тайм-код для синхронизации картинки и звука. Сам же звук записывается на CD-ROM.
Таким образом, для воспроизведения звуков в этом формате в кинотеатр, кроме рулонов киноплёнки, привозят ещё и компактдиски для декодера. В DTS так же применяется сжатие звуковых
данных, как и в Dolby Digital Surround-EX, однако благодаря
меньшему сжатию и более совершенному алгоритму качество звука, закодированного в DTS, выше, чем у Dolby Digital (при сохранении частоты дискретизации 48 кГц и разрядности сигнала 16
бит, скорость потока выше – 1411 кБит/сек. у DTS против максимального 448 кБит/сек. у Dolby Digital). Высокое качество звука
DTS послужило причиной его выбора для издания музыкальных
компакт-дисков DVD-Audio, смикшированных для многоканального прослушивания, а также для распространения фильмов в
формате DVD-Video.
Схема конфигурации акустической системы 5.1 такая же, как
и для стандарта Dolby Digital (рис. 38).
DTS Extended Surround. Он дополняет стандарт DTS и в него
введен центральный тыловой канал (рис. 47).
Рис. 47. Логотип стандарта DTS Extended Surround (DTS ES)
Этот центральный канал может быть отдельным – DTS ES
Discrete 6.1 или получаться за счет использования матричного ме60
тода – DTS ES Matrix 6.1. В последнем случае центральный тыловой канал кодируется по специальному алгоритму в два тыловых канала и восстанавливается при воспроизведении.
Возможно использование акустической системы формата 7.1
за счет того, что 2 тыловых колонки выводят один и тот же канал.
Схема размещения такой системы представлена на рис. 48.
Рис. 48. Схема размещения акустической системы 7.1
для стандартов DTS-ES и Dolby Surround-EX
DTS Neo:6. За счет использования матричного метода предполагается выделение из стереосигнала центрального и тыловых каналов, таким образом получается звук 5.1 или 6.1 (рис. 49).
Рис. 49. Логотип стандарта DTS Neo:6
DTS 96/24. Разработан для "поддержки" более качественного
многоканального звука на носителях DVD (DVD-Video и DVDAudio) (рис. 50).
61
Рис. 50. Логотип стандарта DTS 96/24
Обеспечивает формат звучания 5.1 с частотой дискретизации
96 кГц с разрядностью 24 бита.
DTS Connect. Система кодирования звука со всех приложений, запущенных на компьютере, в один многоканальный поток
формата DTS Digital Surround и вывод его через S/PDIF (рис. 51).
Рис. 51. Логотип стандарта DTS Connect
В DTS Connect входят: DTS Neo:PC и DTS Interactive. DTS
Neo:PC обеспечивает создание из стереоисточников за счет матричного метода звук в формате до 7.1. DTS Interactive предназначена для кодирования различных источников аудиосигнала в формат DTS Digital Surround в реальном времени и вывод его через
цифровой выход S/PDIF.
DTS-HD High Resolution Audio. Стандарт стал дальнейшим
развитием DTS Digital Surround (рис. 52)
Рис. 52. Логотип стандарта DTS-HD High Resolution Audio
Он обеспечивает хранение звука формата 7.1 с частотой дискретизации 96 кГц с разрядностью 24 бита и полосой пропускания
до 6 Мбит/сек. Данные организованы таким образом, что если
оборудование не обеспечивает воспроизведение "нового" стандарта, то внутри содержится ядро DTS 5.1 (DTS core) с максимальным
потоком 1,5 Мбит/сек. и на таком оборудовании звук будет воспроизводиться согласно стандарту DTS Digital Surround.
Для передачи такого формата должен использоваться цифровой интерфейс HDMI версии 1.3.
DTS-HD Master Audio. Аналогично Dolby TrueHD в нем используется сжатие без потерь (рис. 53).
62
Рис. 53. Логотип стандарта DTS-HD Master Audio
Пропускная способность в новом стандарте увеличена до 24,5
Мбит/сек. Так же содержит ядро DTS 5.1 для совместимости со
старым оборудованием.
3.3.3. Environmental Audio eXtensions (EAX). Environmental
Audio eXtensions – расширения аудиосреды. Эта система трехмерного звука была разработана фирмой «Creative Technologies» как
одна из составляющих ее проекта по звуковой карте Sound Blaster
Live!. Основная цель – слушатель (в основном любитель игр) должен получать информацию о местонахождении источника каждого
звука и тем самым постоянно быть в трехмерном звуковом окружении.
Если Dolby Digital и DTS предназначены для передачи "живого" звука, то EAX необходима для генерации объемного звука по
алгоритмам, заложенным при разработке игровой или иной программы или обработке уже имеющегося "живого" звука под соответствующую среду. Звук в соответствии с EAX может быть
сформирован из обычного (например, с аудио компакт-диска) с
указанием звуковому процессору параметров среды, которую желательно имитировать при воспроизведении этого звука. В качестве звуковой среды может быть концертный зал, стадион и т. п.
Таким же образом может быть сформирован звук для любой программы (игры), и в программное обеспечение к SB Live! входят
десятки готовых настроек под различные игры. Но как следствие
создания виртуального пространства – обработанный с EAX "живой" звук, как правило, теряет часть своей естественности.
EAX выполнен как расширение DirectSound3D и основан на
моделировании реверберации звука в зависимости от окружающей
среды. В EAX звуковая среда моделируется по координатам X, Y,
Z с учетом отражений и "содержимого" среды, так как действие
может происходить в лесу, в квартире, под водой и т. д. Недостатком EAX является то, что нет вычислений звуковой картины под
каждую конкретную ситуацию, а используются готовые предопределенные установки для каждого типа окружающей среды. Такой
подход также облегчает жизнь и разработчикам игр, от которых
требуется только указать тип среды и размер комнаты (пещеры,
63
туннеля и т. п.). Этот способ позволяет также иметь звук с EAX и
для тех игр, в которых поддержка EAX не заложена разработчиками. Достаточно просто знать среду, в которой происходит в основном действие игры, и поддержка как бы объемного звука легко появляется.
Одним из самых главных преимуществ EAX для разработчиков игр является то, что стандарт является открытым и включен в
DirectX. Поэтому любая фирма-разработчик звуковых карт может
включить поддержку EAX в свое изделие, поддерживая EAX аппаратно и/или программно.
Для прослушивания звука с EAX рекомендуется иметь следующие компоненты:
1) звуковую карту с поддержкой EAX (рекомендуется продукция компании «Creative Technologies»);
2) либо две пары обычных активных колонок, либо акустические системы с 4-мя и более колонками;
3) программу, поддерживающую вывод звука в формате EAX.
Последняя версия стандарта EAX 5.0 (2005 год) поддерживает
до 128 индивидуальных каналов с наложением 4 эффектов на каждый канал, позволяет обрабатывать входящий сигнал с микрофона
(EAX Voice), обеспечивает более точное позиционирование виртуальных источников звука (EAX PurePath) и создает реалистичные
эффекты позиционирования на близком расстоянии (EAX MacroFX).
3.3.4. Aureal 3D (A3D). Система пространственного звучания,
аналогичная по своим областям применения (но не по принципам
проектирования) EAX, была предложена фирмой «Aureal Semiconductor» для поддержки объемного звучания в прикладных программах. Основная идея подобной системы – получить трехмерный звук с минимальными затратами (стереоколонки и простая
звуковая карта).
Один из путей подобной реализации можно увидеть на рис. 54.
Эта модель справедлива для высоких частот. Низкочастотные
звуки воспринимаются по-другому, так как они легко проходят через препятствия и воспринимаются всем телом человека, достигая
и его ушей. Поэтому определить направление и место источника
низкочастотного звука достаточно сложно и такие звуки обычно
не используются для позиционирования источника звука.
Расчет формирования звука делается на основе модели HRTF
(Head-Related Transfer Functions). HRTF – функции передачи
64
звука, зависящие от головы человека – концепция передачи звука,
основанная на специфических особенностях восприятия звуков
человеком. Человеческое ухо имеет нелинейную амплитудночастотную характеристику, причем с уменьшением уровня громкости звука нелинейность возрастает.
Рис. 54. Принципы работы технологии A3D
Обычная модель HRTF состоит из двух звуковых фильтров
(по одному для каждого уха). Функционирование фильтров зависит от трассировки звука до уха слушателя. Именно правильной
реализацией механизма HRTF и объясняет фирма «Aureal» высокое качество своей системы объемного звучания. Так как, в отличие от EAX, ее звуковая модель учитывает специфические особенности человеческих ушей. Звук на головных наушниках при этом
наиболее правдоподобен, так как звук поступает персонально на
каждое ухо. При прослушивании через акустические системы
возникает взаимовлияние одного канала на другой и эффект объемного звучания становится менее заметным.
В версии A3D 2.0 основное внимание было уделено математическому алгоритму трассировки звука в зависимости от геометрии и
материала среды распространения звука, названному Wavetracing.
Алгоритм и соответствующее API разрабатывались «Aureal» в кооперации с такими известными компаниями и организациями, как
«NASA», «Matsushita» и «Disney». При расчете звучания анализи65
руются не только отражения звука от различных объектов, но и
перемещение звуковых волн через открытую в комнате дверь, распахнутое окно и т. п.
3.3.5. OpenAL. Это кроссплатформенная библиотека API (application program interface, интерфейс прикладного программирования) для работы с аудиоданными (OpenAL, Open Audio Library), предложенная компанией «Creative Labs» в 2000 году –
версия OpenAL 1.0. В 2010 появилась версия Open AL 2.1. Поддержка стандарта со стороны производителей звуковых карт (в
первую очередь компании «Creative Labs») позволила разработчикам ПО создавать объемный звук под любыми операционными системами.
Основные функции библиотеки OpenAL – исходные объекты,
аудиобуферы и единственный слушатель. Исходные объекты
включают в себя указатель на буфер, скорость, позицию, направление и интенсивность звука. Слушатель содержит скорость, позицию, направление и общее усиление звука в целом. Буферы содержат аудиоданные в формате PCM в 8- или 16- битном варианте,
а также в моно или стерео. Функция рендеринга звука производит
необходимые вычисления, такие как определение расстояния, эффекта Доплера и так далее. Таким образом достигается "естественное" звучание при перемещении персонажей в трехмерном мире, а
программисту достаточно воспользоваться функциями, предлагаемыми библиотекой.
Спецификация OpenAL содержит два API: ядро, включающее
в себя вызовы функций OpenAL, и ALC (Audio Library Context) –
API, используемый для управления контекстом рендеринга, контролем использования ресурсов и задействования блокировок в
мультипоточных вычислениях. Также существует ALUTбиблиотека, предоставляющая функции высокого уровня для
упрощения написания программы.
66
4. СРЕДСТВА ДЛЯ РАБОТЫ С ВИДЕОИНФОРМАЦИЕЙ
В персональных компьютерах видеокарты являются неотъемлемым элементом для вывода графической информации на экран
монитора, при этом до недавнего времени за обработку данных отвечал центральный процессор. Постепенно изменялись требования
к персональному компьютеру, нацеленные на создание игровых и
мультимедийных систем для работы с видеоданными.
Необходимость повышения производительности за счет снижения нагрузки на центральный процессор компьютера потребовала
иных подходов к ускорению обработки 3D и видеоинформации.
Для этих целей стали применяться специальные технические
средства, которые условно можно разбить на несколько категорий:
1. Видеобластеры (платы видеозахвата) и TV-тюнеры –
обеспечивают ввод аналоговой видеоинформации, в том числе и с
телевизионных источников сигнала.
2. Платы нелинейного монтажа (платы ввода/вывода) –
профессиональные платы, позволяют в процессе ввода/вывода информации обеспечивать обработку (наложение эффектов) в реальном времени.
3. Видеоадаптеры (видеоакселераторы) – отвечают за обработку и вывод видеоинформации.
4.1. Видеобластеры (платы видеозахвата)
Развитие цифровых аппаратных средств позволило обрабатывать видеоизображения на компьютере. Плюсы цифровой обработки заключаются в широких возможностях обработки, которые
не могут дать аналоговые способы монтажа. Для работы с видеоинформацией на компьютере необходимо ее "оцифровать", т. е.
перевести ее из аналогового вида в цифровой. Эту задачу и призваны решить видеобластеры (платы видеозахвата) (рис. 55).
Рис. 55. Плата расширения – видеобластер
67
Видеоинформация, передаваемая в компьютер, может быть
двух видов:
1. Несжатый поток – происходит только оцифровка аналогового сигнала в цифровой вид и передача его в компьютер для
дальнейшей обработки и сжатия.
2. Сжатый поток – помимо оцифровки, этот поток «сжимается» с использованием одного из стандартов сжатия непосредственно
на плате или уже центральным процессором (программное сжатие).
С учетом этого отличается конструкция и самих плат (рис. 56
и 57).
Рис. 56. Структурная схема платы с аппаратным сжатием
Как можно увидеть из рис. 56 и 57, платы видеозахвата могут
обеспечить ввод и звуковой информации.
К простейшим устройствам захвата видео относятся видеокарты с ТВ-входом. Они позволяют просматривать изображение, полученное с видеокамеры, магнитофона, тюнера или другого бытового видеоустройства, на экране монитора, сохранять отдельные
68
кадры или даже видеопоследовательность на диск – здесь главным
образом нужна только соответствующая программная поддержка.
Рис. 57. Структурная схема плат с программным сжатием
Сжатие данных. Необходимость сжатия обуславливается тем,
что передача несжатого потока цифровых видеоданных предъявляет более жесткие требования к аппаратной части ПК, такие как
объем оперативной памяти для хранения данных, большой объем
дискового пространства и высокая скорость передачи данных.
Приведем пример ввода видеоданных c разрешением 720 × 576,
частотой кадров 30 кадров/сек., и цветностью 24 бита. Для передачи 1 секунды видео потребуется пропускная способность (в Мбитах/сек. = 106 бит) 720 × 576 × 24 × 30 / 106 = 298,5984 Мбит/сек.,
т. е. около 37,3 Мбайт/сек., также дополнительная нагрузка ложится при передаче звука.
Современные жесткие диски имеют более высокие показатели
скорости считывания/записи, однако для хранения 1 часа (3600
сек.) видео потребуется достаточно большой объем – 37,3
Мбайт/сек. × 3600 сек. = 134280 Мбайт, это около 131 Гбайта.
Все это обусловило использование различных алгоритмов
сжатия видеоинформации с различной степенью потери качества.
MJPEG. Одним из первых стандартов сжатия был MJPEG
(Motion JPEG), который основывается на отдельном кодировании
69
каждого кадра и объединении полученной последовательности в
файл (формат AVI). Компрессия кадров осуществляется по JPEGалгоритму (Joint Photographers Expert Group), когда каждая картинка разбивается на блоки размером по 88 пикселей и представляется в векторной форме путем дискретного косинусного преобразования и высокочастотной фильтрации полученного спектра. В
результате на границах блоков нарушается гладкость изображения, поэтому характерным признаком JPEG является блочная
структура. По сути AVI-файл представляет собой последовательность независимых JPEG-рисунков (отсюда и название MJPEG, то
есть Motion JPEG). Преимуществами является: покадровое редактирование ролика, настраиваемый уровень сжатия, невысокие вычислительные затраты на кодирование и декодирование. К недостаткам относится невозможность создания AVI-файлов размером
более 4 Гбайт из-за ограничений структуры файла. Для преодоления этого ограничения применяются различные ухищрения. Их реализация может существенно различаться, но в конце концов она
сводится к созданию нескольких взаимосвязанных файлов.
Стандарт MPEG. Стандарт сжатия MPEG разработан Экспертной группой кинематографии (Moving Picture Experts
Group – MPEG). Основным принципом работы алгоритма является устранение временной избыточности, которой в той или иной
степени обладает тот или иной видеопоток. Дело в том, что смежные кадры чаще всего содержат одни и те же объекты сцены, что
позволяет ограничиться только передачей межкадровых различий.
При тех же скоростях передачи данных MPEG обеспечивает
значительно лучшее качество изображения по сравнению с
MJPEG. Сначала путем все тех же JPEG-преобразований уменьшается избыточность внутри кадра, а затем алгоритмы MPEG, анализируя происходящие в различных кадрах изменения, осуществляют дальнейшее сжатие, уже практически без потери качества. Избыточность устраняется с помощью метода компенсации движения (motion compesation), то есть основным носителем
видеоданных является какой-то один ключевой кадр, а некоторое
количество других смежных кадров восстанавливается из него путем применения специального алгоритма.
MPEG определяет три типа кадров: ключевые (Intra frames,
I-кадры), зависимые (Predicted frames, P-кадры) и двусторонние (Bi-directional, B-кадры). Ключевые кадры, как уже говори70
лось, являются основой MPEG-файла. Они записываются с высоким разрешением и обеспечивают произвольный доступ к информации. Каждый зависимый кадр описывается как ссылка на предшествующий ему ключевой и другой зависимый кадр и имеет
среднюю степень сжатия. Двусторонние же кадры имеют
наибольшую степень сжатия и двунаправленную ориентацию,
ссылаясь как на предыдущие, так и на последующие кадры.
Как и MJPEG, MPEG тоже позволяет записывать звуковое сопровождение. Звук также подвергается компрессии, которая
устраняет из звукового потока неслышимые или плохо слышимые
составляющие аналогично алгоритму MP3. Благодаря таким преобразованиям удается уменьшить размер данных больше чем в 100
раз при не очень значительной потере качества, хотя она и заметна
(особенно это касается звука). Недостатком стандарта является его
асимметричность, то есть для кодирования нужны значительные
объемы сложных вычислений, в то время как восстановление (декодирование) может быть выполнено на сравнительно маломощных аппаратных средствах. Наибольшее распространение алгоритм получил в области бытовой записи фильмов, так как там
необходимо обеспечивать большой коэффициент сжатия при приемлемом качестве. MPEG первоначально стал широко применяться в Video CD. MPEG-2 активно используется в спутниковых телевизионных системах и является базовым для DVD-Video. MPEG-4
обладает более высокой степенью сжатия, что позволило использовать его для передачи данных через сеть Интернет и в некоторых
спутниковых телевизионных системах.
MPEG-4 состоит из нескольких частей (parts), которые определяют различные спецификации для работы с видео. Наиболее
известные: MPEG-4 part 2 (Xvid), MPEG-4 part 10 (x264, H.264).
H.264 является базовым для формата записи на безленточные носители видео с высоким разрешением (High Definition).
Другие характеристики видеобластеров. Кроме стандарта
сжатия, который используют устройства захвата видеоизображения, есть также еще ряд параметров, влияющих на их качество,
возможности и в конечном счете на цену:
1. Представление видеосигнала. Телевизионный низкочастотный аналоговый сигнал является композитным, то есть представляет собой результат сложения яркостного сигнала Y, двух
71
цветовых поднесущих, модулированных цветоразностными сигналами U и V, которые образуют сигнал цветности C (Chronoinance),
а также синхроимпульсов. Для обеспечения совместимости цветного и черно-белого телевидения сигналы цветности передаются в
полосе частот сигнала яркости. Поэтому необходимо разделение
этих сигналов на принимающей стороне с помощью различных
фильтров. Эффективное разделение сигналов цветности и яркости
возможно с помощью специальных гребенчатых фильтров, однако
они весьма сложны и дороги, поэтому обычно применяются только в достаточно дорогой профессиональной или полупрофессиональной аппаратуре.
В бытовых устройствах, рассчитанных на массового пользователя, чаще ограничиваются простыми и дешевыми полосовыми
фильтрами, заметно снижающими четкость изображения. В первых видеомагнитофонах и камерах использовались форматы VHS
(Video Home System, 1980 год) и Video-8, которые работают только с композитными сигналами, при этом разрешение составляет не
более 240–280 твл (телевизионных линий).
Более эффективным оказывается использование не единого
композитного сигнала, а двух Y/C, где Y – сигнал яркости с синхроимпульсами, а C – сигнал цветности. Такой сигнал называют SVideo, он применяется в форматах S-VHS и Hi-8. Такую технику
обычно относят к полупрофессиональной, она обеспечивает разрешение около 400 твл, что уже несколько лучше, чем традиционный телевизионный эфир.
Следующим шагом повышения качества стал переход к полностью компонентному сигналу YUV, составляющие которого передаются раздельно. Он используется в профессиональной аппаратуре формата Betacam и обеспечивает разрешение до 500 твл.
Современные системы поддерживают работу с RGB-представлением, при котором отсутствует какое-либо кодирование и модуляция, обеспечивается простая и точная передача цвета.
2. Частота оцифровки сигнала. Независимо от формата сигнала и видеостандарта большое значение на качество получаемого
в конечном итоге результата оказывает частота оцифровки видеосигнала. Она определяет получаемое разрешение по горизонтали.
В теории цифровых стандартов кодирования за базовую частоту
принимается 3,375 МГц, а частоты оцифровки составляющих
72
определяются умножением базовой частоты на соответствующую
цифру в обозначении стандарта. Например, запись 4:1:1 означает,
что результирующая частота оцифровки сигнала яркости составляет 3,375 × 4 = 13,5 МГц, а сигналов цветности – в четыре раза ниже. При этом сам декодер, осуществляющий разложение входного
электрического сигнала на составляющие YUV уже после оцифровки, должен производить выборку в два раза чаще, то есть с частотой 27 МГц. Но тогда элемент изображения получится неквадратным. Дело в том, что в телевидении в качестве стандарта принято отношение ширины изображения к его высоте как 4:3 (в современных 16:9). Чтобы сохранить это соотношение и предотвратить появление геометрических искажений, необходимо выделить
в каждой строке соответствующее количество элементов. Например, при 576 телевизионных строках нужно в каждой строке выделить 768 элементов (768:576 = 4:3). При частоте дискретизации
13,5 МГц будет получено всего 702 элемента, а для 768 частота
должна быть увеличена примерно до 14,77 МГц.
3. Глубина цвета. Наряду с частотой оцифровки очень важное
значение также имеет ее глубина, задаваемая числом битов на отсчет. Для получения полноцветного изображания необходимо
обеспечить 16,7 млн. оттенков (режим True Color), что требует по
8 бит на каждый элемент изображения для каждой составляющей
видеосигнала. Оцифрованная видеоинформация может храниться
в его памяти как в YUV-, так и в RGB-представлении. При YUVкодировке для хранения одного элемента изображения достаточно
16 бит (при оцифровке 4:2:2 отводится один байт для сигнала яркости и по 4 бита на кодирование сигналов цветности). В большинстве устройств используется RGB-представление, при котором
для обеспечения полноцветного изображения необходимо уже 24
бита на элемент. Обычно такую кодировку обозначают RGB 8:8:8.
Все это влияет на объем буферной памяти, в которой должны
храниться поступающие кадры. В дорогих видеобластерах она
может быть локальной, в простых выделяться в оперативной памяти компьютера.
4.2. ТV-тюнеры
ТV-тюнеры – одна из "разновидностей" плат захвата. Они позволяют ввести видеоизображение в компьютер и содержат блок
73
приема телевизионных сигналов, с помощью которого на мониторе могут выводиться телепередачи.
Основные виды ТV-тюнеров изображены на рис. 58.
а) внешний автономный
ТV-тюнер
б) внешний ТV-тюнер,
подключаемый к ПК
в) внутренний ТV-тюнер
Рис. 58. Типы ТV-тюнеров
Внешние автономные ТV-тюнеры обеспечивают простейшую обработку, такую как подавление помех, масштабирование
изображения под разрешение монитора и т. п.
Внешние ТV-тюнеры (как правило "мобильные") подключаются к внешней шине ПК (обычно USB) и имеют аналоговые входы, а также контроллер обмена по шине. В них вся обработка видео- и аудиоинформации ложится на центральный процессор ПК.
Во внутренних ТV-тюнерах, как правило, имеется специализированный процессор, отвечающий за обработку и дальнейшую
передачу данных на внутреннюю шину ПК (PCI, PCI-E).
Возможности ТV-тюнеров:
1. Прием FM-радиостанций (FM-тюнер содержит большинство
внутренних ТV-тюнеров).
2. Режим Time-Shift (пауза) – когда можно приостановить
трансляцию (в этом случае она будет сохраняться в специальный
буфер) и затем продолжить просмотр.
3. Запись видео и захват кадров.
4. Отображение телетекста.
В настоящее время появились гибридные ТV-тюнеры, содержащие, помимо аналогового блока приема телевизионного сигнала, еще и блок поддержки цифрового телевидения (Digital Video
Broadcasting, DVB) различных стандартов.
74
4.3. Платы нелинейного монтажа
Для профессиональной оцифровки аналоговой видеоинформации, последующего монтажа и вывода используются платы нелинейного монтажа.
Как правило, они содержат несколько входов для ввода информации. Обеспечивают оцифровку сигнала и его отображение в
реальном времени, аппаратное сжатие (при необходимости) отдельных кадров видеопоследовательности и сохранение их в файлы на диске. Дополнительно имеются функции работы со звуком –
наложение, синхронизация и т. п.
Рис. 59. Плата нелинейного видеомонтажа
Для удобства работы с платами используется специализированное ПО.
Помимо сохранения в файлы, за счет наличия видеовыходов
результат обработки может выводиться на внешние аналоговые
устройства (телевизор, видеомагнитофон).
Современные платы позволяют работать через цифровые входы с различными источниками цифрового видео, тем самым отпадает необходимость использования АЦП.
4.4. Видеоадаптеры (видеоакселераторы)
В последнее время функции ускорения видеообработки возлагаются и на видеоадаптеры, содержащие в своем составе графиче75
ские процессоры (GPU, Graphic Processor Unit). Помимо 3Dобработки, они берут на себя декодирование сжатых видеоформатов и последующий вывод на монитор, телевизор или проектор,
таким образом разгружая центральный процессор от "лишних" задач. Единственное требование – используемое программное обеспечение должно поддерживать работу с GPU.
Различные производители GPU («AMD», «Nvidia») реализовали собственные технологии ускорения, а последние версии видеокарт с новыми GPU "научились" выводить звук через цифровые интерфейсы (HDMI и DisplayPort).
У GPU AMD за это отвечает блок UVD (Unified Video Decoder,
унифицированный видеодекодер), а у Nvidia применяется технология PureVideo HD.
Все они поддерживают декодирование в реальном времени
популярных форматов, применяемых при кодировании видеоинформации: MPEG-2, MPEG-4, H.264, VC-1 (последний используется при кодировании фильмов на дисках HD DVD и Blu-Ray).
Осуществляют масштабирование разрешения со "стандартного" до HD (1280 × 720 или 1920 × 1080).
76
5. СРЕДСТВА ВИРТУАЛЬНОЙ РЕАЛЬНОСТИ
Виртуальная реальность (Virtual Reality, VR) – это технология человеко-компьютерного взаимодействия, обеспечивающая
"погружение" пользователя в трехмерную интерактивную среду
изучаемого явления или процесса. Дополнительно предоставляется возможность естественного взаимодействия с объектами (искусственными и/или реальными) в виртуальной среде. Данная технология обеспечивает принципиально новое качество восприятия
информации, кардинально повышая наглядность и интерактивность материалов.
Основное применение систем виртуальной реальности:
1) обучение – например, обучение пилотов управлению самолетами;
2) история – создание виртуальных миров;
3) развлекательная индустрия – игры, 3D-фильмы и т. п.
Воздействие может происходить на различные органы чувств
человека:
1) глаза (зрение);
2) уши (слух);
3) нос (обоняние);
4) кожа (осязание).
Причем воздействие возможно как на отдельные органы, так и
на несколько одновременно. В соответствии с этим используются
различные технические средства (и программное обеспечение).
5.1. Очки виртуальной реальности
Первоначально для достижения 3D-эффекта в играх, просмотре изображений, телевидении использовались самые простые 3Dочки – анаглифные (красно/сине-зеленые, зелено/красно-синие и
т. п.) (рис. 60).
Рис. 60. Анаглифные (слева) и поляризационные (справа) 3D-очки
77
Анаглиф – это метод получения стереоэффекта для стереопары обычных изображений при помощи цветового кодирования
изображений, предназначенных для левого и правого глаза.
К недостаткам анаглифных очков можно отнести плохую цветопередачу, т. к. используются цветовые фильтры.
Позднее появились поляризационные очки (для разделения
изображения применяется поляризационный фильтр). В отличие
от анаглифных очков для работы требуют специального монитора.
Для каждого вида таких очков требовалось создание отдельного контента.
C появлением технологии LCD (Liquid Crystal Display, жидкокристаллические дисплеи) стали применяться LCD-очки (виртуальные бинокли), которые выводили отдельное изображение для
каждого глаза.
Рис. 61. LCD 3D-очки
Недостатком данных очков стала невысокая разрешающая
способность выводимого изображения (типичное разрешение составляло 640 × 480) и более высокие требования к аппаратуре вывода изображения, т. к. для каждого глаза нужно было обеспечить
частоту обновления не менее 60 Гц.
В настоящее время активно применяются LCD 3D-очки затворного типа (рис. 62).
Рис. 62. Затворные 3D-очки
В очках затворного типа на экран монитора в каждый момент
времени выводится изображение для одного глаза в тот момент,
когда очки затемняют другой. Такой подход также предъявляет
высокие требования к устройству вывода изображений – частота
обновления должна быть не ниже 120 Гц (по 60 Гц на каждый глаз).
78
5.2. Шлем виртуальной реальности (VR-шлем)
Рис. 63. VR-шлем
Принцип действия VR-шлема (Head-Mounted-Display, HMD)
такой же, как и у виртуальных биноклей: фиксирование изображения для каждого глаза. Одни из первых VR-шлемов имели
разрешение до 789 × 230 пикселей, разрядность цвета 16 бит и
обеспечивали отслеживание поворотов головы на 45 градусов по
вертикали и 360 по горизонтали. В современных увеличено разрешение, цветность 24 бит и обеспечивается отслеживание угла
поворота головы по вертикали до 120 градусов, также они могут
иметь микрофон и наушники.
5.3. 3D-дисплеи и панели
Эти устройства можно сравнить с VR-очками, но с тем отличием, что они "одеваются" на монитор или сама панель содержит
средства формирования 3D-изображения.
К ним относят:
1. Cтереоскопические 3D-дисплеи – в таких дисплеях разделение объема воспроизведения происходит на две части условной
вертикальной плоскостью, перпендикулярной плоскости экрана и
проходящей через его центр (рис. 64). К недостаткам можно отнести то, что они имеют ограниченную зону стереоэффекта.
Рис. 64. Принцип работы стереоскопического 3D-дисплея
79
2. Многоракурсные (multiview) 3D-дисплеи – используют
линзовый растр (разделение объема воспроизведения несколькими
условными вертикальными плоскостями). Также имеют невысокие
углы обзора и технически сложны при увеличении количества ракурсов.
Рис. 65. Принцип работы многоракурсного 3D-дисплея
3. Голографические 3D-дисплеи – воспроизводят непрерывное световое поле, соответствующее световому полю реальной 3Dсцены (рис. 66). Можно отметить высокую техническую сложность таких дисплеев.
Рис. 66. Пример изображения с голографического 3D-дисплея
4. Волюметрические (volumetric) 3D-дисплеи – воспроизведение объемного изображения в виде вокселов или векторов, реально разнесенных в рабочем объеме дисплея (объеме воспроизведения), четко ограниченном его конструкцией.
Такие подходы не требуют специальных очков для просмотра
3D-контента и тем самым позволяют устраивать демонстрации
аудитории.
80
Рис. 67. Принцип работы волюметрического 3D-дисплея
5.4. 3D-звук
Использование 3D-звука является одним из ключевых элементов, позволяющих человеку ощутить эффект присутствия. Как уже
было сказано ранее, для воспроизведения используются специальные акустические системы и форматы звука Dolby Digital, DTS.
5.5. VR-перчатки и датчики
Перчатки виртуальной реальности (VR-перчатки) – это сложная система эластичных световодов и пара десятков датчиков,
позволяющая отслеживать движения пальцев (рис. 68).
Рис. 68. Перчатка виртуальной реальности
Как только палец начинает сгибаться, световод сужает просвет, а датчики улавливают падение интенсивности света на каком-либо участке.
Такие же принципы работы заложены в датчиках при движении кисти, стопы.
Основное применение подобных устройств – научные исследования.
Упрощенные конструкции датчиков используются в различных игровых приставках. Ярким примером такой игровой приставки является Nintendo Wii, для которой выпущено множество
контроллеров, определяющих положение тела, ног, реагирующих
на изменение положения тела и т. п.
81
5.6. VR-костюм
Самым полным набором оборудования для виртуальной реальности является виртуальный костюм (рис. 69).
Он состоит из обтягивающего комбинезона со множеством магнитных
сенсоров, которые отслеживают движения всех частей тела. К нему добавляется VR-шлем, различные датчики
(или перчатки) и провода для связи с
компьютером.
Подобный костюм используется для
создания "законченной" системы виртуальной реальности, для научных целей, обучения/тренировок и в симулято- Рис. 69. Костюм виртуальной
рах.
реальности
5.7. Симуляторы
Можно выделить несколько видов симуляторов:
1. Игры-симуляторы какого либо рода деятельности, обычно
это авиа-, авто-, спортсимуляторы. Это программы, которые создают для человека виртуальный мир, приближенный к реальности. Взаимодействие человека с виртуальным миром может осуществляться через различные классы устройств: джойстики, геймпады, рули, пистолеты и другие игровые манипуляторы.
2. Специализированные симуляторы – это компьютеризированные программно-аппаратные комплексы.
Они применяются при обучении персонала в тех областях, где
работа связана с риском для жизни (сперва персонал проходит
обучение на симуляторе, а уже затем приступает к работе).
Рис. 70. Симулятор вождения
82
5.8. Генераторы запахов
Уже сейчас имеются устройства, обеспечивающие генерацию
различных запахов. Основное применение подобных устройств –
телевизионные системы, системы продаж и игры.
В настоящее время ведется разработка устройств, "записывающих" и воспроизводящих запахи.
Основу всех этих устройств составляют нетоксичные химические соединения, при "смешивании" которых получается необходимый запах.
Рис. 71. Генератор запахов ScentScape компании «Scent Sciences»
На рис. 71 изображен "игровой" генератор запахов ScentScape,
который подключается к ПК или консоли и обеспечивает подачу в
воздух запахов, соответствующих текущему игровому моменту.
Например, если игровой персонаж передвигается по лесу, воздух
наполнится ароматом сосновой хвои, путешествие по морю будет
сопровождаться запахом водорослей и соленой воды, а при
стрельбе будет чувствоваться запах пороха.
В систему входит около двух десятков четко идентифицируемых "базовых" ароматов и редактор, позволяющий создавать собственные ароматы.
5.9. 4D-измерение
Помимо запахов, в кинотеатрах могут применяться и другие
устройства, позволяющие повысить реалистичность воспринимаемой сцены – примером можно назвать виброкресла, генераторы
воздуха и водяных брызг. Для домашнего применения они пока
мало приспособлены (за исключением виброкресел).
83
6. СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
1. Соломенчук, В. Г. Аппаратные средства персональных компьютеров /
В. Г. Соломенчук. – СПб.: БХВ-Петербург, 2003. – 512 с.
2. Колесниченко, О. В. Аппаратные средства PC. – 4-е издание / О. В. Колесниченко, И. В. Шишигин. – СПб.: БХВ-Петербург, 2000. – 1024 с.
3. Компакт-диски – общие принципы оптической записи. Конструктивные
особенности. Принципы работы устройств записи и воспроизведения КД [Электронный ресурс]. – 2005. – Режим доступа: http://www.disc.ru/print.htm?tbl=stat&id=1
4. Структура DVD-дисков, принцип записи [Электронный ресурс]. – 2005. –
Режим доступа: http://www.stoik.ru/print.php?src=article&id=2002_12_99_3&cat_id
= 3&subcat_id=1
5. Основные различия DVD+R(W) и DVD-R(W) дисков [Электронный ресурс]. – 2010. – Режим доступа: http://www.r-quest.ru/technology/article/dvd_differences.htm
6. Обзор формата DVD-VIDEO [Электронный ресурс]. – 2010. – Режим доступа: http://www.premium-video.ru/info_22-s.htm
7. HD DVD [Электронный ресурс]. – 2010. – Режим доступа: http://www.
hi-def. ru/hd-dvd
8. Blu-Ray Disc [Электронный ресурс]. – 2010. – Режим доступа: http://ru.
wikipedia. org /wiki/ Blu-Ray_Disc
9. Технология AMR (Audio/Modem Riser Card) [Электронный ресурс]. –
2005. – Режим доступа: http://www.ixbt.com/mainboard/amr.html
10. Dolby Digital [Электронный ресурс]. – 2010. – Режим доступа: http:
//ru.wikipedia.org/wiki/Dolby_Digital
11. DTS [Электронный ресурс]. – 2010. – Режим доступа: http://ru.wikipedia.
org/wiki/DTS
12. OpenAL [Электронный ресурс]. – 2010. – Режим доступа: http://ru.
wikipedia. org/wiki/OpenAL
13. Обзор 3D дисплеев [Электронный ресурс]. – 2010. – Режим доступа:
http://trigonal.ru/article_3d_displ/3d_displ.htm
14. Какие есть устройства воспроизведения запахов? [Электронный ресурс].
– 2011. – Режим доступа: http://www.genon.ru/GetAnswer.aspx?qid=8ec42c46-b6dc4124-b15f-33d9a2d8eea8
84
СОДЕРЖАНИЕ
СПИСОК АББРЕВИАТУР…………………….………………………..…
1. ВВЕДЕНИЕ………………………………………………….
1.1. Основные понятия……………………………………
1.2. Аппаратные средства мультимедиа…………………
1.3. Программные средства мультимедиа………….……
2. НОСИТЕЛИ ИНФОРМАЦИИ МУЛЬТИМЕДИА………………...
2.1. Компакт-диски…………………………….………….
2.2. Стандарт DVD………………………………………...
2.3. Стандарты HD DVD и Blu-Ray……………..……….
3. СРЕДСТВА ДЛЯ РАБОТЫ СО ЗВУКОМ………………….……
3.1. Акустические системы………………….……….……
3.2. Звуковые карты………………………………….……
3.3. Системы пространственного звучания….…………..
4. СРЕДСТВА ДЛЯ РАБОТЫ С ВИДЕОИНФОРМАЦИЕЙ ………..
4.1. Видеобластеры (платы видеозахвата)……………….
4.2. ТV-тюнеры……………………………………………
4.3 Платы нелинейного монтажа………………….……..
4.4. Видеоадаптеры (видеоакселераторы)……….………
5. СРЕДСТВА ВИРТУАЛЬНОЙ РЕАЛЬНОСТИ……………..…….
5.1. Очки виртуальной реальности……………………….
5.2. Шлем виртуальной реальности (VR-шлем)…………
5.3. 3D-дисплеи и панели…………………………………
5.4. 3D-звук……………………………….………………..
5.5. VR-перчатки и датчики………….….………………..
5.6. VR-костюм……………………….……………………
5.7. Симуляторы…………………….…….……………….
5.8. Генераторы запахов…………………………….……..
5.9. 4D-измерение………………………………………….
6. СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ…………………
85
3
4
4
6
6
8
8
25
36
43
43
44
53
66
66
72
74
74
76
76
78
78
80
80
81
81
82
82
83
Related documents
Download