стр. 175 из 278 УДК 681.3.07 ВЛИЯНИЕ СЮЖЕТА ПОТОКОВОГО ВИДЕО НА КАЧЕСТВО ПЕРЕДАЧИ ПО БЕСПРОВОДНЫМ СЕТЯМ Понкин Алексей Викторович, аспирант, [email protected], ФГОУВПО «Российский государственный университет туризма и сервиса», г. Москва The article presents the dependence of quality of streaming video from a plot transferred on wireless networks; calculation of existential characteristics of streaming video with the subsequent division into 3 subject groups: static subject group (SSG), inactive subject group (ISG), highly-dynamic subject group (HDSG). Results of imitating modeling of transfer of streaming video on wireless communication networks taking into account distinction of existential characteristics of various plot groups. Рассмотрена зависимость качества потокового видео от сюжета, передаваемого по беспроводным сетям; вычисление пространственно-временных характеристик потокового видео с последующим разделением на 3 сюжетных группы: статичная сюжетная группа (ССГ), малоподвижная сюжетная группа (МПСГ), высокодинамичная сюжетная группа (ВДСГ). Представлены результаты имитационного моделирования передачи потокового видео по беспроводным сетям связи с учетом различия пространственно-временных характеристик различных сюжетных групп. Keywords: MPEG, streaming video, quality of video, PSNR Ключевые слова: MPEG, потоковое видео, качество видео, PSNR Постановка задачи Растущая популярность передачи мультимедийных приложений привела к необходимости оптимизации распределения полосы пропускания телекоммуникационных сетей. Качество воспроизведения видео в определенной степени зависит от типа сюжета этих приложений. Например, при просмотре высокодинамичных видеороликов (спортивные игры, кинофильмы) необходимо, прежде всего, сохранять высокое качество, тогда как в сравнении с более статическими сюжетами (новости или видеоконференции), где более важно содержание. Современные телекоммуникационные сети должны уметь поддерживать качество различных приложений с различным уровнем QoS [1]. Требования QoS, как правило, зависимы от параметров сетевого и прикладного уровней [2]. На прикладном уровне QoS зависит от таких факторов, как разрешение, битрейт, скорость кадров, тип видео- и аудиокодека и т.д. На сетевом уровне вводятся такие искажения, как задержка, джиттер, потеря пакета и т.д. Как правило, передача данных по проводным сетям, в которых полоса пропускания не ограничена, характеризуется очень низкой вероятностью появления ошибочных битов. Однако вследствие непредсказуемости условий передачи при трансляции приложений в стр. 176 из 278 реальном времени, передача данных по беспроводному каналу имеет ряд особенностей. Беспроводные каналы связи характеризуются случайно распределенными и независимыми битовыми ошибками. В связи с этим при имитации беспроводного канала, часто применяют модель «белого шума», при которой определенный бит в последовательности искажается (инвертируется) с заданной вероятностью. Влияние различных типов сюжета, например, статических (новости), высокодинамических (спортивные игры) на конечное качество видео, переданного через беспроводные сети, с учетом параметров сетевого и прикладного уровней сети практически не рассматривалось. Объединение видеопотоков в определенную сюжетную группу позволяет говорить об их сходных характеристиках. Это позволит организовать контроль за приоритетом и следовательно, оптимизировать распределение полосы пропускания определенного видеопотока. Автоматическая классификация видеосюжета позволит предсказать качество видео с определенной вероятностью. Сюжет каждого видео клипа может существенно отличаться в зависимости от его динамики (то есть пространственной сложности и временной активности изображения). Видеопоследовательности классифицируются на различные группы, основываясь на пространственном и временном изменении элементов изображения [3]. Вычисление временных изменений Движение в видеоклипе вычисляется показателем суммы абсолютных различий SAD (от англ. Sum of Absolute Difference), который вычисляет по-пиксельную сумму абсолютных различий между двумя сравниваемыми кадрами N M SAD n, m = ∑∑ Bn (i, j ) − Bm (i, j ) , (1) i =1 j =1 где Bn и Bm – два кадра размером N×М, и i и j – координаты пиксела. Вычисление пространственных изменений Пространственные особенности вычисляются на краях блока, контрастности и яркости между текущим и предыдущим кадром. Яркость вычисляется как модуль разности между средним значением яркости предыдущего и текущего кадра. N M Brn = ∑∑ Brav (i, j ) − Brav (i, j ) , ( 2) i =1 j =1 стр. 177 из 278 где Brav(n) и – средняя яркость n-го кадра размером N×М, и i и j – координаты пиксела. На основании проведенных вычислений видеопоследовательности можно разделить на три типа сюжетов. 1. Статичная сюжетная группа (ССГ): включает последовательности с небольшой областью наблюдения (например, лицо диктора) на статическом фоне. 2. Малоподвижная сюжетная группа (МПСГ): видеопоследовательности с непрерывным и однородным изменением изображения (напримр, художественный фильм). 3. Высокодинамичная сюжетная группа (ВДСГ): видеопоследовательности, где локальные или глобальные участки изображения изменяются резко и неоднородно (напр. спортивные игры). Классификация параметрах. Из-за сюжета основывается обширного набора на вышеупомянутых объективных параметров определенных использовался статистический метод для анализа данных и классификации по сюжетам. Каждый из описанных типов сюжета определяется уникальными статистическими особенностями движения. Полученные эмпирические функции распределения каждого видеоклипа принадлежащего к определенному сюжету имеют существенные различия. Затем был проведен эксперимент трансляции видео по беспроводной сети при различных условиях. В качестве исходных тестовых видеопоследовательностей использовались 6 стандартных тестовых видеоклипов в формате YUV с разрешением CIF (352x288), представленные на сайте http://trace.eas.asu.edu и рекомендованные для проведения тестовых испытаний организацией IТU. Эти видеоролики были объединены в вышеописанные сюжетные группы, по два видеоклипа в каждой. Исходные видеопоследовательности формата YUV кодировались кодеком MPEG-2 с типом GOP IBBPBBPBB. При этом каждое видео кодировалось с различным битрейтом (128, 384, 768 и 1150 кбит/с). Кодирование/декодирование исходных видеопоследовательностей и моделирование беспроводной сети со случайными битовыми ошибками в канале производилось с помощью программы VCDemo [5]. Имитация передачи видео потока через беспроводную сеть выполнялось согласно модели OSI на известных уровнях: прикладном, транспортном, сетевом, канальном и физическом. На прикладном уровне модели OSI производится кодирование/декодирование и пакетирование видеопотока. Видеопоток делится на пакеты переменной длины размером стр. 178 из 278 до 1500 байтов, добавляя при этом 12-байтовый заголовок RTP. При добавлении заголовка RTP к данным, битовый поток MPEG сегментируется таким образом, чтобы стартовые коды MPEG содержались в начале пакетов данных. На транспортном уровне моделируется протокол UDP, соответственно добавляя заголовок и контрольную сумму (8 байт). И далее на сетевом уровне добавляется 20байтовый заголовок IP. На канальном уровне связи моделируется протокол IEEE 802.11. Пропускная способность канала устанавливается равной 20 Мб/с. На физическом уровне производится имитация случайной битовой ошибки в канале (гауссовский шум) с заданной вероятностью BER (от англ.), задаваемой равной 106 , 10-5, 10-4 и 10-3. Таким образом, произведено изменение параметров передаваемого видео по беспроводной сети на прикладном (изменение скорости битрейта) и на сетевом уровнях (изменение BER). В качестве показателя качества использовались показатели PSNR и MOS, вычисленные с помощью инструментов программно-аппаратного комплекса. Передача каждого видеоклипа по сети имитировалась 16 раз с учетом различных настроек. Выводы Имитационное моделирование показало, что различные сюжетные группы поразному влияют на воспринимаемое качество при передаче по сетям. Необходимо учитывать не только качество транслируемого и впоследствии декодируемого видеопотока на прикладном (битрейт) и сетевом (BER) уровне, но и другой, не менее важный критерий – сюжет видеопотока. Так, было показано, что в условиях передачи по сети с малой вероятностью появления ошибок (BER=10-6, BER=10-5) минимальное значение битрейта (128 кбит/с) сохраняет приемлемое качество видеопотока, соответствующее MOS > 3 для всех типов сюжета. При этом увеличение битрейта в большей степени сказывается на качестве видеопоследовательностей ССГ, тогда как для видеоизображений с движущимися элементами (МПСГ и ВДСГ) заметного выигрыша в качестве не наблюдается. Присутствие небольших ошибок (BER=10-4) не сказывается на качестве декодирования видеопоследовательностей ССГ, но проявляется в МПСГ и ярко выражено в ВДСГ. Это позволяет судить о способности декодера исправлять небольшие ошибки только в условиях статичного изображения. Увеличение числа ошибок до BER=10-3 сказывается на декодировании видеопоследовательностей всех сюжетных групп. стр. 179 из 278 При этом ССГ и МПСГ демонстрируют удовлетворительное, а ВДСГ -- плохое качество с точки зрения субъективной оценки. Таким образом, приемлемым числом ошибочных битов и, следовательно, порогом с точки зрения качества, при котором воспринимаемое пользователями изображение остается приемлемым является BER=10-4 для всех типов сюжета. Литература 1. Ghinea G., Thomas J. P. QoS impact on user perception and understanding of multimedia video clips, Proc. Of ACM Multimedia’98, Bristol, UK. Р. 49—54. 1998. 2. Khan A., Li Z., Sun L., Ifeachor E. Audiovisual quality assessment for 3G networks in support of E-healthcare, Proc. of CIMED , Plymouth, UK, 25-27 July 2007. 3. Khan A., Sun L., Ifeachor E. Content Clustering Based Video Quality Prediction Model for MPEG4 Video Streaming over Wireless Networks IEEE ICC CQRM 14-18 June 2009, Dresden, Germany. 4. Шелухин О.И., Иванов Ю.А. Оценка качества передачи потокового видео в телекоммуникационных сетях с помощью программно-аппаратных средств // Электротехнические и информационные комплексы и системы, 2009, т.5, №4, С.48–56. 5. http://ict.ewi.tudelft.nl/vcdemo (Дата обращения 23.01.2010).