РТФ РАДИОТЕХНИЧЕСКИЙ ИНСТИТУТ

advertisement
РАДИОТЕХНИЧЕСКИЙ ИНСТИТУТ
РТФ
Радиотехнический институт УГТУ – УПИ
Инновационная образовательная
программа
Основы построения
телекоммуникационных
систем и сетей:
краткий курс лекций
Автор курса лекций:
Удинцев Владимир Николаевич, канд. техн. наук, доцент
кафедры ТСС УГТУ-УПИ
Екатеринбург
2008
2
Основы построения
телекоммуникационных
систем и сетей:
краткий курс лекций
лекция 21
Видеосигналы цифрового
телевидения
Цели лекции:




Изучение основных видов телевизионных
видеосигналов и их систем кодирования;
Изучение основных способов получения
стандартных
видеосигналов
цифрового
телевидения;
Знакомство с основными видами систем
цветного эфирного цифрового телевидения;
Знакомство с основными понятиями и
терминами.
4
Основные термины





Видеосигнал – сигнал, передаваемый в виде мгновенных
значений постоянного тока или напряжения.
Видеоимпульс – импульс постоянного тока или напряжения.
Вторичные сигналы – сигналы в системах связи, получаемые в
результате преобразования первичных и способные проходить по
данной среде распространения.
Динамический диапазон сигнала – отношение максимально
возможной к минимально возможной мощности или отношение
максимально возможного к минимально возможному напряжению
сигнала.
Дискретные сигналы – непрерывные по уровню, но дискретные
по времени сигналы (информационный параметр может
принимать бесконечно большое число значений).
5
Основные термины





Избыточность сообщения – мера возможного сокращения
объема сообщения без потери
содержащейся
в
нем
информации.
Канал электросвязи - совокупность технических устройств
(преобразователей), обеспечивающих передачу первичных
электрических сигналов на расстояние.
Первичные электрические сигналы – сигналы, подаваемые на
вход систем электросвязи.
Пропускная способность линии связи – максимальное
количество информации, передаваемое по линии связи за
единицу времени.
Частотный спектр – совокупность ряда гармонических
составляющих (гармоник) сложного сигнала.
6
Видеосигналы цифрового
телевидения
Цифровые формы представления
видеосигналов и системы
вещательного цифрового телевидения
Видеосигналы цифрового
телевидения





Цифровое телевидение (ЦТВ или DTV) — система телевизионного вещания с передачей видео- и аудиосигналов в
цифровой форме представления и сжатием ее объема. В
настоящее
время
существует три стандарта цифрового
телевизионного вещания:
DVB – европейский стандарт цифрового телевидения;
ATSC – американский стандарт цифрового телевидения;
ISDB – японский стандарт цифрового телевидения.
В России принято решение о создании национальной сети
эфирного цифрового телевидения (стандарта DVB-T) и идут
экспериментальные работы по внедрению своего варианта
стандарта эфирного широковещательного цифрового телевидения на базе стандарта сжатия видеоданных MPEG 4 ITU-T и
использования относительной фазовой манипуляции для
передачи сжатых данных.
8
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления
Особенность преобразования аналоговых телевизионных
видеосигналов в цифровую форму заключается в их широкополосности (более 6 МГц) и большой информационной
избыточности. Чтобы при дискретизации видеосигналов не
возникало синхронных помех на изображении, частота
дискретизации должна быть кратна частоте строчной развертки.
В системе NTSC она равна 15734,2657 Гц, а в системах PAL и
SECAM – 15625 Гц. Поэтому, в принятой в настоящее
время Рекомендации ITU-R ВТ.601 на цифровое
представление видеосигналов широковещательного телевидения (Broadcasting service Television –
BT), рекомендуется частота дискретизации 13,5
МГц – минимальная частота, кратная этим частотам
и большая 12 МГц.
9
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления



В качестве входного сигнала для кодирующего устройства
(кодера) используется компонентный видеосигнал.
Рекомендация ITU-R BT.601 устанавливает правила раздельной дискретизации, квантования и кодирования компонентного видеосигнала Y'CbCr, т.е. сигнала яркости и
двух цветоразностных сигналов.
Рекомендуется, чтобы частоты дискретизации яркостной и
цветоразностных компонент находились в соотношении 4:2:2,
что и дает часто используемое название стандарта: "4:2:2". Для
сигналов цветности рекомендованы частоты дискретизации
6,75 МГц. При таких значениях
частот
дискретизации
практически без искажений преобразуются в цифровую форму
сигналы яркости в полосе до 5,75 МГц и цвето-разностные
сигналы в полосе до 2,75 МГц.
10
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления

Согласно Рекомендации "4:2:2" в активной части кадра
содержится 720 ∙ 486 (для системы NTSC 525/60) или
720 ∙ 576 (для систем PAL и SECAM 625/50) 10-разрядных отсчетов яркостной компоненты видеосигнала и по
360 ∙ 486 или 360 ∙ 576 10-разрядных отсчетов цветоразностных компонент соответственно (сигнал Y'CbCr), что
удовлетворяет требованиям к качеству изображения всех
действующих стандартов вещательного телевидения.
Рекомендация допускает также использование
8разрядных отсчетов. Скорость передачи такого цифрового компонентного видеосигнала при длине кодового
слова в 10 бит будет составлять 270 Мбит/с.
11
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления

Стандартизованы параллельный и последовательный
интерфейсы для передачи видеоданных. Параллельный интерфейс
ITU-R BT.656 использует 8- или 10-разрядную шину видеоданных
для передачи цифрового компонентного видеосигнала Y'CbCr
и сигнал (строб-импульс) для их синхронизации с частотой 27
МГц (применяется в студийной аппаратуре).
Аналоговый
сигнал
Y
Pb
Pr
Кодер
- АЦП
10 разрядная
шина данных
Синхронизация 27 МГц
Аналоговый
сигнал
Декодер
- ЦАП
Y
Pb
Pr
Скорость передачи
потока 270 Мбит/с
12
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления

Каждый кадр передачи начинается с передачи синхросимвола
начала очередного кадра (SAV) за которым последовательно
следуют видеоданные в следующем порядке: Cb0, Y'0, Cr0, Y'1,
Cb2, Y'2, Cr2,Y3, Cb4, Y4… и т. д. Такой порядок передачи
определяется по-очередной передачей отсчетов сигналов
цветности, что обеспечивает сокращение общего числа их
отсчетов. Первой (нулевой) точке изображения соответствует
триада Cb0, Y'0, Cr0, второй – Cb0, Y'1, Cr0, третьей – Cb2,
Y'2, Cr2 … и так далее.
SAV
Cb
Cb00 Y0 Cr
Cr0
0 Y
Y1
1 Cb
Cb2
2 Y2
Y2 Cr2
Cr2 Cb4
Cb4 Y3
Y3 Cr4
Cr4
Первая точка Вторая точка Третья точка Четвертая точка
изображения изображения изображения изображения
Y0Cb0Cr0
Y1Cb0Cr0
Y2Cb2Cr2
Y3Cb2Cr2 13
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления
Для сигналов строчной и кадровой синхронизации и других
служеб-ных сигналов в BT.656 определены уникальные
кодовые комбинации со всеми логическими единицами или
нулями в
восьми старших разрядах. Например, при
восьмиразрядном кодировании
комбинация из четырех
символов FFH, 00H, 00H, xxH определяет начало строки
(при 10-разрядном, соответственно 000Н, 003Н и 3FC –
3FFH). В связи с этим на цифровое представление
компонент видеосигнала
Y'CbCr наложены ограничения.
Так, компонента яркости Y' может принимать значения от
10Н (уровень черного) до EBH (уровень белого), т. е.
иметь 235 – 16 = 219 градаций, а цветоразностные сигналы
– значения от 10Н до EFН, причем за нулевое их значение
принимается число 80Н. Оставшиеся кодовые комбинации
являются некорректными.
14
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления

В аналоговом композитном телевизионном сигнале всегда
передаются импульсы гашения обратного хода луча
кинескопа по строкам и кадрам. Поскольку в этот момент
времени видеоинформация отсутствует, BT.656 определяет это время для передачи служебной или дополнительной информации. Длительность импульса гашения
по строке (бланкирующего импульса – Blanking) равна
288 периодам передачи видеоинформации. Таким образом, при восьмиразрядном кодировании может быть передана информация со скоростью потока 288∙576∙50∙8
= = 66,3552 Мбит/с. Например, может передаваться
квад-рофоническое
звуковое сопровождение высокого
качест-ва, в том числе на нескольких языках, титры и
сигналы телетекста.
15
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления


BT.656 регламентирует также передачу потока 8- или 10разрядных слов в последовательном коде по каналу SDI
(Serial Digital Interface –последовательный цифровой
интерфейс) с тактовыми частотами
для
восьмибитного кодирования 8 ∙ 27 = 216 МГц и для десятибитного – 1 0 ∙ 27 = 270 МГц.
Перед передачей кода в линию производится операция
скремблирования, что позволяет сжать спектр передаваемого сигнала и обеспечить его самосинхронизацию.
Младший бит каждого передаваемого слова передается
первым. В качестве направляющей системы может
использоваться
коаксиальный или оптоволоконный
кабель.
16
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления



При практическом применении последовательного канала по Рекомендации ITU-R BT.656 возникают трудности с реализацией рекомендованного метода кодирования линейного сигнала, поэтому фактическим стандартом стал последовательный канал SDI, предложенный организацией SMPTE (Society of Motion Picture and
Television Engineers). SMPTE была создана еще в 1916
г.
в
США
для разработки стандартов студийной
аппаратуры в киноиндустрии. В телевидении наиболее
известны два ее стандарта:
SMPTE 259М (SDI);
SMPTE 292М (HD-SDI).
17
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления






SMPTE 259М (SDI) – стандарт последовательной передачи по ко-
аксиальному кабелю цифрового потока композитных сигналов
системы NTSC со скоростью 143 Мбит/с и системы PAL со
скоростью 177 Мбит/с, а также передачи цифрового потока компонентных сигналов согласно Рекомендации ITU-R BT.601 со
скоростью 270 Мбит/с и системы PALplus со скоростью 360
Мбит/с.
143 Мбит/с ("Level А") – стандарт США ANSI/SMPTE 244M – 1995.
177 Мбит/с ("Level В") – стандарт Европейского Союза IEC 61179.
270 Мбит/с ("Level C") – Рекомендация ITU-R
BT.601-5 и
стандарт США ANSI/SMPTE 125M – 1995, ("270 Мбит SDI").
360 Мбит/с ("Level D") – Рекомендация ITU-R
BT.601-5 и
стандарт США ANSI/SMPTE 267M – 1995, ("360 Мбит SDI").
Согласно стандарту
SMPTE 259М, если оборудование поддерживает большую скорость, то оно должно поддерживать и
меньшие.
18
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления

SMPTE 292М (HD-SDI) – стандарт последовательной передачи
по коаксиальному кабелю цифрового потока композитных
сигна-лов (1000/60) телевидения высокой четкости (ТВВЧ или
HDTV) со скоростью 1,458 Гбит/с.

Все эти интерфейсы для синхронизации видеоданных используют сигналы строчной и кадровой
синхронизации, начинающиеся с синхрослова состоящего
из логических единиц. После декодирования (дескремблирования) видеопотока выполняется преобразование его в параллельный 8- или
10-битный код ITU-R BT.656, который проходит
операции либо цифровой обработки, либо прямое
цифроаналовогое преобразование в аналоговый
Y'PbPr видеосигнал.
19
Преобразование аналоговых
телевизионных видеосигналов в
цифровую форму представления


Для уменьшения скорости передачи в BT.601 предложены упрощенные
форматы представления цифрового видеосигнала. Их получают путем предварительной обработки и децимации (прореживания) отсчетов
формата "4:2:2", как в горизонтальном, так и в вертикальном направлениях
телевизионного растра.
Среди
них
наиболее
целесообразными для телевизионного вещания считаются форматы
"4:1:1" (720∙576 отсчетов для яркостной компоненты и
180∙576
отсчетов для цветоразностных компонент) и "4:2:0" (720∙576 отсчетов
для яркостной компоненты и 360∙288 отсчетов для цветоразностных
компонент). В этих форматах полная скорость передачи составляет
205,5 Мбит/с для 10-битных кодовых слов и 162 Мбит/с для 8-битных
слов. Передача толь-ко активной части изображения (без обратного
хода по строкам и кадрам) приводит к еще некоторому уменьшению
требуемой скорости, например, для длины кодового слова 8 бит она
составит 124 Мбит/с.
Формат "4:1:1" рекомендован для стандарта NTSC-М (525/60), а
формат "4:2:0" – для стандартов PAL-B/G и SEKAM-D/K (625/50) с
чересстрочной поочередной передачей цветоразностных сигналов.
20
Видеосигналы цифрового телевидения
Информационная избыточность видеосигналов

Минимальная скорость передачи цифрового видеосигнала
по каналу связи составляет 124 Мбит/с. Поэтому основная
проблема при реализации цифровых систем вещательного многоканального телевидения – это необходимость
обработки и передачи высокоскоростных потоков
цифровых видеосигналов.

Спектр телевизионного видеосигнала в силу специфики его получения имеет линейчатую структуру. Для неподвижного изображения в
спектре
существуют только составляющие, являющиеся кратными
гармониками частот вертикальной и горизонтальной развертки. Это
используется для создания генераторов
"электронного занавеса",
испытательных сигналов, таблиц
и т. п.
Форма видеосигнала
неподвижного изображения повторяется с частотой полукадров или,
иначе имеет период, равный длительности вертикальной развертки. Это
означает, что для его представления возможно использование рядов
Фурье, в отличие от сигналов, не имеющих периодичности,
где
требуется интегральное преобразование Фурье.
21
U
ω0n
2
 2πf n  2πf k n
Видеосигналы цифрового телевидения
Информационная избыточность видеосигналов

Ряд Фурье будет иметь вид:
U0
u(t ) 
 U1sin( ω1t  1 )  U 2 sin( ω 2 t   2 )  ...  U n sin( ω n t   n )  ...
2

U0
где 2 – постоянная составляющая видеосигнала (средняя
яркость);
ω n  2πf n  2πf k n

– круговая частота n-й гармоники;
fk – частота вертикальной развертки (частота полей, равная 50 или
60 Гц); φn – фаза n-й – гармоники.
22
Видеосигналы цифрового телевидения
Информационная избыточность видеосигналов


При неподвижном изображении в спектре видеосигналов
отсутствуют составляющие, отличные от nfk, т. е. он полностью определяется гармониками частоты полей (полукадровой частоты).
В телевидении, как и в кинематографе,
наилучшее
изобра-жение
получается
при
передаче
последовательности
от-дельных
неподвижных
("несмазанных") кадров.
При быст-рых перемещениях
деталей
изображения
в спектре
видео-сигнала
нарушается периодичность и появляется
неопределенность
по частоте. Эта
неопределенность
проявляет-ся в том, что гармоники "расширяются" по оси
частот, т.е. вокруг них появляются "боковые" частоты.
23
Видеосигналы цифрового телевидения
Информационная избыточность видеосигналов

Спектры телевизионных изображений
U
f
U
Спектр движущегося изображения
Спектр «подвижного» изображения
f
24
Видеосигналы цифрового телевидения
Информационная избыточность видеосигналов

Аналогичная картина наблюдается при амплитудной модуляции несущей частоты низкочастотными колебаниями с
изменяющейся от нуля до какого-то значения частотой,
причем, чем больше это значение, тем значительнее это
"уширение". Приняв период этих низкочастотных колебаний равным 1/3 с, получим величину неопределенности – 3,3 Гц. Таким образом, в спектре видеосигнала
между его соседними гармониками существуют значительные "пустые" промежутки: 50 – 6,6 = 43,4 Гц, а
собственно ширина частотных полос, в которых передается информация, составляет лишь 13,2 % от общей
ширины спектра. Это свидетельствует о очень большой
информационной
видеосигналов.
избыточности
25
Видеосигналы цифрового телевидения
Виды информационной избыточности видеосигналов

Избыточность по восприятию обусловлена несовершенством
зрения и рассматривалась нами ранее, например, то, что глаз замечает
изменение яркости лучше, чем изменение цвета.
 Спектральная избыточность возникает в результате использования чрезмерно высокой частоты дискретизации. Интерполируя
определенные группы отсчетов, можно изменить их спектральный состав
за счет высшей частоты получаемого на выходе ЦАП аналогового ТВсигнала и оцифровки его с меньшей частотой дискретизации.
 Структурная избыточность заложена в исходном телевизионном
сигнале. Избыточными являются вводимые в аналоговый ТВ-сигнал служебные сигналы: гасящие, синхронизирующие и уравнивающие импульсы, «вспышки» поднесущей и т.п. При передаче цифрового сигнала
необходимость в них отпадает, поскольку они легко синтезируются.

Статистическая избыточность — это взаимозависимость между соседними (по вертикали, горизонтали и во времени) отсчетами сигнала. Уменьшение такой избыточности до определенных пределов полностью обратимо, т. е. исходный сигнал может быть восстановлен без
потери информации.
26
Видеосигналы цифрового телевидения
Сжатие видеосигналов в цифровой форме представления



В 1988 году для разработки методов обработки, сжатия и восстановления цифровых видеосигналов в профессиональной кинематографии и телеиндустрии,
была создана специальная
организация – "Motion Pictures Expert Group" (MPEG). В результате
ее работы появились международные стандарты сжатия цифровых телевизионных сигналов, также получившие название MPEG.
Система стандартов MPEG определяет принципы компрессии динамических изображений для самых различных областей применения и выполнена ассимметричной: в ней кодеры гораздо сложнее декодеров (в них выбирается оптимальная стратегия кодирования, что требует значительных вычислительных мощностей, а
декодеры просто восстанавливают переданный цифровой поток,
поэтому значительно проще и дешевле кодеров).
На данный момент существуют три ее варианта: MPEG-1, MPEG2 и MPEG-4.
27
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандарту MPEG-1


Стандарт MPEG-1 предназначен для систем записи на
компакт-диски и низкокачественных каналов передачи
видеоданных. Алгоритм сжатия MPEG-1 предусматривает
получение изображения с разрешением вчетверо меньшим,
чем разрешение в вещательном телевидении: 288
активных строк по 352 отсчета в активной части каждой
строки. Сжатие достигнуто благодаря «прореживанию»
исходного телевизионного сигнала по вертикали и
горизонтали (изымается каждая вторая строка и каждый
второй отсчет в оставшихся строках). При приеме
изображение «растягивается» до размера полного экрана.
Видеоданные передаются с переменной скоростью, но не
более 1,5 Мбит/с (коэффициент сжатия объема сообщения
около 100).
28
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандарту MPEG-2


MPEG-2 (он же международный стандарт ISO/IEC 13818-2)
специально разработан для кодирования сигналов широковещательного телевидения и обеспечивает четкость декодированного
изображения в соответствии с Рекомендацией ITU-R BT.601
("4:2:2"). Сфера его применения – производство и распределение
телепрограмм, а также «мультимедиа».
Имеет широкий диапазон значений качества изображения: от
уровня бытовой записывающей аппаратуры до телевидения высокой четкости (ТВВЧ), поэтому в рамках стандарта определена
система профилей и уровней (5 профилей и 4 уровня). Системе
вещательного телевидения обычной четкости соответствует вариант: основной профиль/основной уровень (MP@ML) с максимальной скоростью передачи компонентного цифрового потока
Y'CbCr 15 Мбит/с (коэффициент сжатия около 20). Вещательное
качество декодированного видеосигнала достигается уже при
скорости 8 Мбит/с, а по экспертным оценкам от 4 до 6 Мбит/с.
29
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандарту MPEG-4






MPEG-4 (он же международный стандарт ISO/IEC 14496)
объединяет в себе несколько подстандартов,
из которых
выбирается соответствующий решаемым задачам.
Наиболее важные из них перечислены ниже:
ISO 14496-1
(Системы), формат контейнера MP4,
анимация/интерактивность (например, DVD меню);
ISO 14496-2 (Видео), Улучшенный Простой Профайл (Advanced
Simple Profile – ASP);
ISO 14496-3 (Аудио), Улучшенное Аудио Кодирование
(Advanced Audio Coding – AAC)
ISO 14496-10 (Видео #2), Улучшенное Видео Кодирование
(Advanced Video Coding – AVC), аналогичен стандарту H.264.
В
рамках
стандарта
MPEG4
существуют
система
транскодирования MPEG4/MPEG2
и система условного
доступа.
30
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандарту MPEG-4

В MPEG-4 по сравнению с MPEG-2 значительно возрастает объем вычислений в реальном
масштабе времени, как в передающем, так и в
прием-ном оборудовании, что в значительной
степени увеличивает его стоимость. Но, для
«эфирного телевидения», из соображений
экономии частотных ресурсов, предпочтителен
именно стандарт MPEG4, поскольку с его
помощью достигается скорость кодирования
менее 1,5 Мбит/с без существенной потери
качества изображения.
31
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG


В основу алгоритмов сжатия MPEG заложены особенности восприятия и статистические параметры изображения. Например, глаз
намного лучше воспринимает градации яркости, чем цветности, гра-дации
одних цветов воспринимаются лучше, других – хуже и т. п., что было
рассмотрено ранее. Кроме того, чаще всего на экране присутствует
неподвижный фон и несколько движущихся объектов небольших размеров. Поэтому достаточно передать информацию о базовом кадре, а затем передавать информацию только о его изменениях (ДИКМ с компенсацией движения). Этим исключается пространственная, временная и
психофизическая избыточность видеосигналов. Еще один принцип, который применяется при компрессии изображений – это отбрасывание малозначимой информации, аналогичный принципам, используемым в графическом формате JPEG, т.е. энтропийное кодирование и адаптивное
квантование. Для этого видеоданные проходят сначала предварительное, а затем повторное сжатие.
Алгоритмы сжатия MPEG анализируют динамику изменений изображения
и устраняют имеющуюся избыточность по восприятию, спектраль-ную,
структурную и статистическую избыточность, как следствие корреляционных связей элементов изображения во времени и пространстве.
32
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG


Передача только значений векторов, описывающих направление и величину смещения от кадра к кадру движущихся
частей изображения, резко уменьшает объем передаваемой
информации о текущем кадре.
Если же в подвижном изображении какие-либо объекты движутся в одном направлении и с одинаковой скоростью, то
соответствующие фрагменты изображения будут кодироваться одними и теми же векторами смещения. В этом
случае применяется векторный анализ с переменной
разрешающей способностью – векторы определяются
относительно рядом расположенных векторов, что позволяет
еще более повысить степень сжатия.
33
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG

Алгоритм сжатия MPEG-2 использует возможность разделить подготовленный к передаче, видеосигнал на несколько независимых потоков, содержащих сигналы различного качества, что позволяет вести одновременную
трансляцию сигнала ТВЧ (телевидения высокой четкости)
и стандартного цифрового телевизионного сигнала. Это
обеспечивает совместимость различных телевизионных
систем - они будут принимать одну и ту же программу, но
с разным качеством и создает условия для постепенного
перехода на более высокие уровни качества. Поэтому
кодер MPEG-2 получается гораздо сложнее декодера, а
система кодирования - ассиметричной.
34
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG


В MPEG-2 использованы и новые алгоритмы сокращения
статистической избыточности: кодирование отсчетов с
предсказанием и дискретно-косинусное преобразование
(ДКП).
При кодировании с предсказанием вычисляется разность
между истинным и предсказанным значением отсчета и
эта величина передается. Предсказание выполняется по
соседним с предсказываемым отсчетам, расположенным
до и после рассматриваемого по горизонтали (соседние
отсчеты на строке), вертикали (в соседних строках) и во
времени (отсчеты с теми же координатами в соседних
полях и кадрах).
35
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG




В MPEG-2 предсказание может быть:
Экстраполяционным (предсказание вперед). В этом случае оценку отсчета получают в результате экстраполяции
предшествующих значений. За ожидаемое значение принимается предшествующий отсчет по строке (внутрикадровое предсказание по координате «строка»).
Межкадровым – текущий отсчет оценивается на основании
знания о величине отсчета с теми же координатами в
предыдущем кадре (дополнительно используется координата «время»).
Интерполяционным (двунаправленным) – оценка выполняется по известным значениям предшествующих и последующих отсчетов с применением алгоритмов интерполяции.
Оценка получается более точной, но резко увеличивается
объем вычислений в кодере.
36
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG


Предсказания очень эффективны при передаче неподвижных изображений или крупных участков изображения без
мелких деталей, где яркость остается постоянной или изменяется медленно. Если же имеются быстро движущиеся
объекты, то отсчеты одних и тех же точек растра, от кадра к
кадру будут изменяться, что приведет к появлению значительной по объему разностной информации и увеличению скорости выходного потока видеоданных.
Для увеличения степени компрессии в этом случае применяется «компенсация движения», т.е. определяются векторы, описывающие направление и величину смещения от
кадра к кадру движущихся частей изображения. С их помощью указывается положение отсчета в новом кадре
(компенсируется его движение) и сохраняется высокая точность передачи изображения.
37
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG


Дискретно-косинусное преобразование (ДКП) предусматривает разбиение кадра на блоки по 64 (8х8) отсчета (сигнальные
матрицы). Далее сигнальная матрица преобразуется в матрицу
частотных коэффи-циентов такого же размера. Она уже не имеет
прямой геометрической связи с положением отсчетов сигнала в
растре, а просто является удобной формой математической записи, в которой частотные коэффициенты ДКП можно рассматривать как двумерный спектр изображения в горизонтальном и
вертикальном направлениях.
Основная часть составляющих этого спектра концентрируется в
небольшой области вблизи нулевых частот, а амплитуды высокочастотных составляющих или очень малы, или равны нулю.
Передаются только те коэффициенты, которые превышают пороговую величину, а остальные считаются нулевыми. Это приводит к
потерям информации и к снижению качества восстановленного
изображения, но при оптимальном выборе величины порога такое
ухудшение практически незаметным.
38
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG

MPEG-сжатие начинается с создания Intra-кадра (I-кадра).
I-кадры играют роль опорных при восстановлении
остальных изображений и размещаются пос-ледовательно
через каждые 10—15 кадров. В интер-вале между Iкадрами изменяются только некоторые фрагменты
изображений, и именно эта разница коди-руется.
Кроме I-кадров в MPEG-последовательности имеются еще два
типа изображений:
 predicted (P) — предсказанные кадры, описывающие различия
между текущим и предыдущим кадрами (типа I или P);
 bi-directional interpolated (B) — интерполированные в двух
направлениях (вперед и назад) кадры, содержащие лишь указатели на предыдущие или последующие кадры типа I или P.

39
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG

Основой объем передаваемого файла форматов
MPEG составляют I-кадры, сжатие которых
выполняется только с применением внутрикадрового предсказания. Выделение I-кадра —
это первый этап, на котором степень компрессии
еще относительно невелика, а восстановленное
изображение почти полностью соответствует
исходному, причем его качество мало зависит от
ошибок, возникающих в процессе кодирования и
передачи сигнала по каналу связи.
40
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG



Кодирование (сжатие) Р-кадров выполняется с помощью
алгоритмов компенсации движения и межкадрового
предсказания вперед по предшествующим I- или Р-кадрам
до тех пор, пока в блоке не появится новый объект. После
его обнаружения опять происходит переход к алгоритмам,
используемым для кодирования I-кадров, т. е. к
внутрикадровому предсказанию. Степень сжатия Р-кадров
почти втрое превышает этот показатель для I-кадров.
Опорные I-кадры являются основой для создания Р- и Вкадров, а Р-кадры, в свою очередь, используются для
создания последующих Р- или В-кадров.
Ошибки в любом опорном кадре приводят к
размножению ошибок во всех кадрах,
созданных на его основе.
41
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG

Алгоритмы кодирования В-кадров зависят от характера
изображения. В MPEG-2 предусмотрено четыре способа их сжатия:

Первый – используется компенсация движения и предсказание вперед по
ближайшим предшествующим I- и (или) Р-кадрам.
Второй – при появлении в кодируемом В-кадре новых объектов
применяется предсказание назад по ближайшим последующим I- или Ркадрам вместе с компенсацией движения.
Третий – используется компенсация движения и двунаправленное
предсказание по предшествующим и последующим I- или Р-кадрам.
Четвертый – используется внутрикадровое предсказание без компенсации
движения (он чаще всего используется при резкой смене плана или
высоких скоростях движения отдельных фрагментов изображения).




При кодировании В-кадров обеспечивается наибольший
коэффициент сжатия. Но, чем выше степень их сжатия, тем
ниже точность восстановления исходного изображения.
Поэтому В-кадры не используются в качестве опорных.
42
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG



Метод компенсации движения, определенный в алгоритме MPEG-2,
основан на обработке макроблоков (структурных единиц кадра, описывающих квадратные участки изображения размером 16 пикселей на 16
строк). Согласно спецификации MPEG-2, размеры макроблока согласуются со структурой, используемой для дискретизации изображения ТВкадра. При этом в каждом ТВ-кадре должно быть целое число
макроблоков.
В процесс кодирования входят операции сравнения базового и последующих кадров, поиска идентичных или похожих макроблоков. Макроблоки, не содержащие изменений, игнорируются. В результирующем
потоке сохраняются только данные о различиях между кадрами — так
называемый вектор смещения.
Чтобы определить вектор смещения, например, при предсказании вперед, поиск нового положения определенного макроблока первого кадра
выполняется в зоне поиска второго кадра. Для всех отсчетов этого
макроблока вычисляются межкадровые разности и рассчитываются
координаты вектора смещения, описывающего движение макроблока по
вертикали и горизонтали относительно его начального положения.
43
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG

Зона поиска должна быть достаточно большой, чтобы
быстро движущийся макроблок изображения первого
кадра не вышел из зоны поиска второго кадра. Однако ее
размеры ограничены техническими возможностями
аппаратуры, так как понятно, что чем больше размер
зоны, тем больше и объем вычислений, которые
необходимо выполнить в масштабе реального времени.
На практике размеры зоны в четыре раза больше
размеров макроблока, т. е. она ограничена квадратом
изображения 64х64 пикселей.
44
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG



Наличие шума приводит к увеличению полосы частот кодированного
сигнала.
Подавление шума на этапе предварительной обработки исключает
как сами шумовые составляющие, так и необходимость их
кодирования.
Добавленное
к
эффективному
кодированию,
шумоподавление обеспечивает выигрыш в скорости передачи до 15%
(при передаче сильно зашумленных сигналов). Сохраненная полоса
может использоваться либо для добавления новых каналов, либо для
повышения качества изображения.
Выравнивание качества. Поскольку при телевизионном вещании
качество передаваемого сигнала во многом определяется сложностью
изображения, то для обеспечения комфортного просмотра важно
поддерживать качество такого сигнала практически постоянным для
изображений различной сложности. С этой целью в MPEG-2
предусмотрен буфер, позволяющий избежать переполнения или
недостаточного заполнения декодера.
45
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG

Двупроходное кодирование применяется в качестве
дополнительного способа повышения эффективности
сжатия. Процедура выполняется в режиме реального
времени, при этом каждый кадр «просматривается»
дважды. Во время первого прохода анализируется
сложность изображения, чтобы обнаружить момент
смены плана и выбрать тип структуры, наилучшим
образом
соответствующей
кодированию
данного
изображения. При втором проходе создается бинарный
поток и выполняется оптимизация распределения бит в
доступной
пропускной
способности
канала
и
использования объема буфера.
46
Видеосигналы цифрового телевидения
Сжатие видеосигналов по стандартам MPEG

Статистическое мультиплексирование. Основу системы
кодирования составляет видеокодер, рассчитанный на работу с
постоянной либо переменной скоростью потока. Говоря о
статистическом мультиплексировании, необходимо понимать, что
взаимосвязь между скоростью потока и картинкой не описывается фиксированным соотношением бит, а зависит от содержимого изображения, точнее — от показателя, который часто называют его сложностью (X). Например, если для кодирования двух
картинок (1 и 2) разной сложности (Х1<Х2) используется
одинаковое количество бит, то их качество изображения (PQ)
будет различным (PQ1>PQ2). Системы с постоянной скоростью
потока будут вести себя именно так. Как правило, качество
изображения, полученного при использовании таких систем,
достаточно хорошее, за исключением случаев, когда степень
сложности изображения превышает возможности видеокодера
(тогда искажения кодирования становятся заметными).
47
Контрольные вопросы






Дайте определение понятию «Вещательное цифровое телевидение».
Перечислите виды избыточности в телевизионном видеосигнале.
Перечислите психофизиологические особенности зрения человека, использующиеся в алгоритмах устранения избыточности в
телевизионном видеосигнале.
Что такое «статистическая избыточность» в телевизионном
видеосигнале?
Что такое «статистическое мультиплексирование», применяемое при сжатии телевизионных видеосигналов?
Что такое «метод компенсации движения»?
48
Информационное обеспечение
лекции
Список литературы





Пескин А. Е. Мировое вещательное телевидение.
Стандарты и системы. – М.: Горячая линия – Телеком,
2004.
Бадялик В. П. Основы телевизионного вещания со
спутников. – М.: Горячая линия – Телеком, 2004.
Телекоммуникационные системы и сети. Том 2. Радиосвязь,
радиовещание, телевидение. Учебное пособие. В. П.
Шувалов.– М.: Радио и связь, 2003.
Дансмор
Б.
Справочник
по
телекоммуникационным
технологиям. – М.: Диалектика, 2004.
Додд Аннабел 3. Мир телекоммуникаций. Обзор технологий и
отрасли. Пер. с англ. – М.: ЗАО «Олимп—Бизнес», 2002. – 400
с.: ил.
49
Конец фильма
Спасибо за внимание!
Download