Кодирование числовой информации

advertisement
Кодирование информации в
компьютере
Двоичный код
Вся информация, которую обработает
компьютер, должна быть представлена
двоичным кодом с помощью двух цифр
– 0 и 1.
Эти два символа 0 и 1 принято называть
битами
(от англ. binary digit – двоичный знак).
Кодирование и декодирование
Кодирование – преобразование входной
информации в форму, воспринимаемую
компьютером, т.е. двоичный код.
Декодирование – преобразование
данных из двоичного кода в форму,
понятную человеку.
Почему двоичное кодирование
С точки зрения технической реализации использование двоичной
системы счисления для кодирования информации оказалось
намного более простым, чем применение других способов.
Действительно, удобно кодировать информацию в виде
последовательности нулей и единиц, если представить эти
значения как два возможных устойчивых состояния
электронного элемента:
0 – отсутствие электрического сигнала;
1 – наличие электрического сигнала.
Эти состояния легко различать. Недостаток двоичного
кодирования – длинные коды. Но в технике легче иметь дело с
большим количеством простых элементов, чем с небольшим
числом сложных.
Способы кодирования
Способы кодирования и декодирования
информации в компьютере, в первую
очередь, зависит от вида информации
(числа, текст, графические
изображения или звук).
Представление чисел
Для записи информации о количестве
объектов используются числа. Числа
записываются с использованием особых
знаковых систем, которые называют
системами счисления.
Система счисления – совокупность
приемов и правил записи чисел с
помощью определенного набора
символов.
Позиционные и непозиционные
системы счисления
Все системы счисления делятся на две
большие группы:
ПОЗИЦИОННЫЕ
Количественное значение
каждой цифры числа зависит
от того, в каком месте (позиции
или разряде) записана та или
иная цифра.
0,7
7
70
НЕПОЗИЦИОННЫЕ
Количественное значение
цифры числа не зависит от
того, в каком месте (позиции
или разряде) записана та или
иная цифра.
XIX
Римская
непозиционная система счисления
Самой распространенной из
непозиционных систем счисления
является римская. В качестве цифр
используются: I(1), V(5), X(10), L(50),
C(100), D(500), M(1000).
Величина числа определяется как сумма
или разность цифр в числе.
MCMXCVIII = 1000+(1000-100)+(100-10)+5+1+1+1
= 1998
Позиционные системы счисления
Первая позиционная система счисления была
придумана еще в Древнем Вавилоне, причем
вавилонская нумерация была шестидесятеричная,
т.е. в ней использовалось шестьдесят цифр!
В XIX веке довольно широкое распространение
получила двенадцатеричная система счисления.
В
настоящее время наиболее распространены
десятичная,
двоичная,
восьмеричная
и
шестнадцатеричная системы счисления.
Основание системы счисления
Количество различных символов, используемых
для изображения числа в позиционных
системах счисления, называется основанием
системы счисления.
Система счисления
Основание
Алфавит цифр
Десятичная
10
0, 1, 2, 3, 4, 5, 6, 7, 8, 9
Двоичная
2
0, 1
Восьмеричная
8
0, 1, 2, 3, 4, 5, 6, 7
Шестнадцатеричная
16
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F
Соответствие систем счисления
Десятичная
0
1
2
3
4
5
6
7
Двоичная
0
1
10
11
100
101
110
111
Восьмеричная
0
1
2
3
4
5
6
7
Шестнадцатеричная
0
1
2
3
4
5
6
7
Десятичная
Двоичная
Восьмеричная
Шестнадцатеричная
8
9
10
11
12
13
14
15
16
1000
1001
1010
1011
1100
1101
1110
1111
10000
10
11
12
13
14
15
16
17
20
8
9
A
B
C
D
E
F
10
Двоичное кодирование
текстовой информации
Начиная с 60-х годов, компьютеры все
больше стали использовать для обработки
текстовой информации, и в настоящее
время большая часть ПК в мире занята
обработкой именно текстовой
информации.
Традиционно для кодирования одного
символа используется количество
информации = 1 байту (1 байт = 8 битов).
Двоичное кодирование
текстовой информации
Для кодирования одного символа
требуется один байт информации.
Учитывая, что каждый бит принимает
значение 1 или 0, получаем, что с
помощью 1 байта можно закодировать
256 различных символов.
28=256
Двоичное кодирование
текстовой информации
Кодирование заключается в том, что
каждому символу ставится в
соответствие уникальный двоичный код
от 00000000 до 11111111
(или десятичный код от 0 до 255).
Важно, что присвоение символу
конкретного кода – это вопрос
соглашения, которое фиксируется
кодовой таблицей.
Таблица кодировки
Таблица, в которой всем символам
компьютерного алфавита поставлены в
соответствие порядковые номера (коды),
называется таблицей кодировки.
Для разных типов ЭВМ используются различные
кодировки. С распространением IBM PC
международным стандартом стала таблица
кодировки ASCII (American Standart Code for
Information Interchange) – Американский
стандартный код для информационного
обмена.
Таблица кодировки ASCII
Стандартной в этой таблице является только первая
половина, т.е. символы с номерами от 0 (00000000) до
127 (0111111). Сюда входят буквы латинского
алфавита, цифры, знаки препинания, скобки и
некоторые другие символы.
Остальные 128 кодов используются в разных вариантах. В
русских кодировках размещаются символы русского
алфавита.
В настоящее время существует 5 разных кодовых таблиц
для русских букв
(КОИ8, СР1251, СР866, Mac, ISO).
В настоящее время получил широкое распространение
новый международный стандарт Unicode, который
отводит на каждый символ два байта. С его помощью
можно закодировать 65536 (216= 65536 ) различных
символов.
Таблица стандартной части ASCII
Таблица
расширенного
кода ASCII
Обратите внимание!
!
Цифры кодируются по стандарту ASCII в
двух случаях – при вводе-выводе и
когда они встречаются в тексте. Если
цифры участвуют в вычислениях, то
осуществляется их преобразование в
другой двоичный код.
Возьмем число 57.
При использовании в тексте каждая цифра будет представлена
своим кодом в соответствии с таблицей ASCII. В двоичной
системе это – 00110101 00110111.
При использовании в вычислениях код этого числа будет получен
по правилам перевода в двоичную систему и получим –
00111001.
Двоичное кодирование
графической информации
Информация и информационные процессы
Аналоговая и дискретная форма
представления информации
Человек
Восприятие информации
Образ
(зрительный,
звуковой и т.д.)
Зрительный образ
Изображения
(рисунки,
фотографии)
Информация
(графическая и
звуковая)
Аналоговая
форма
Дискретная
форма
Звуковой образ
Пластинки,
магнитные ленты,
лазерные диски
физическая
величина
принимает
бесконечное
множество
значений, причем
ее значения
изменяются
непрерывно
физическая
величина
принимает
конечное
множество
значений, причем
ее величина
изменяется.
скачкообразно
Источники
аналоговой
информации:
•
•
•
•
•
скрипка;
телевизор;
телефон;
картина, нарисованная
художником (живописное
полотно);
виниловая пластинка
(звуковая дорожка
изменяет свою форму
непрерывно).
Источники
цифровой
информации:
•
•
•
•
монитор компьютера;
цифровая фотография;
изображение, напечатанное с
помощью струйного принтера
и состоящее из отдельных
точек разного цвета;
аудиокомпакт-диск
(звуковая дорожка содержит
участки с различной
отражающей способностью).
Аналоговая и дискретная форма
представления информации
Приведем пример аналогового и
дискретного представления
информации.
Положение тела на наклонной
плоскости и на лестнице
задается значениями координат
X и У.
При движении тела по наклонной
плоскости его координаты могут
принимать бесконечное
множество непрерывно
изменяющихся значений из
определенного диапазона, а при
движении по лестнице — только
определенный набор значений,
причем меняющихся
скачкообразно.
Дискретизация
Преобразование графической и звуковой информации
из аналоговой формы в дискретную производится
путем дискретизации, то есть разбиения
непрерывного графического изображения и
непрерывного (аналогового) звукового сигнала на
отдельные элементы.
В процессе дискретизации производится кодирование,
то есть присвоение каждому элементу конкретного
значения в форме кода.
Дискретизация – это преобразование непрерывных
изображений и звука в набор дискретных значений в
форме кодов.
Виды компьютерных изображений
ИЗОБРАЖЕНИЯ
РАСТРОВЫЕ
ВЕКТОРНЫЕ
Для каждого типа изображений используется свой способ кодирования.
Кодирование растровых изображений
Растровое изображение
представляет собой
совокупность точек
(пикселей) разных цветов.
Пиксель - минимальный
участок изображения, цвет
которого можно задать
независимым образом.
В процессе кодирования изображения производится его пространственная
дискретизация.
Пространственную дискретизацию изображения можно сравнить с построением
изображения из мозаики (большого количества маленьких разноцветных стекол).
Изображение разбивается на отдельные маленькие фрагменты (точки), причем
каждому фрагменту присваивается значение его цвета, то есть код цвета
(красный, зеленый, синий и так далее).
Качество изображения зависит от количества точек
(чем меньше размер точки и, соответственно, больше их
количество, тем лучше качество)
и количества используемых цветов
(чем больше цветов, тем качественнее кодируется
изображение).
Кодирование растровых
изображений
Для черно-белого изображения информационный
объем одной точки равен 1 биту, т.к. она может
быть либо черной, либо белой, что можно
закодировать двумя цифрами - 0 или 1.
Цветные изображения формируются в соответствии с двоичным кодом цвета
каждой точки, они могут иметь различную глубину цвета .
Глубина цвета (I)
Количество цветов (N)
1
21=2
8
28=256
16 (High Color)
216=65 536
24 (True Color)
224=16 777 216
32 (True Color)
232=4 294 967 296
Кодирование растровых
изображений
Для четырехцветного – 2 бита.
Для 8 цветов необходимо – 3 бита.
Для 16 цветов – 4 бита.
Для 256 цветов – 8 бит (1 байт).
Цветное изображение на экране
монитора формируется за счет
смешивания трех базовых цветов:
красного, зеленого, синего. Т.н.
модель RGB.
Для получения богатой палитры базовым
цветам могут быть заданы различные
интенсивности.
4 294 967 296 цветов (True Color) – 32 бита
(4 байта).
Цветовые модели
Для представления цвета в виде числового кода
используются две обратных друг другу цветовые
модели: RGB или CMYK.
• Модель RGB используется в телевизорах,
мониторах, проекторах, сканерах, цифровых
фотоаппаратах… Основные цвета в этой модели:
красный (Red), зеленый (Green), синий (Blue).
• Цветовая модель CMYK используется в
полиграфии при формировании изображений,
предназначенных для печати на бумаге.
Цветовые модели
Модель RGB:
R- Red (красный)
G- Green (зеленый)
B- Blue (синий)
Модель CMYK:
С- Cyan (голубой)
M –Magenta (пурпурный)
Y – Yellow (желтый)
К – black (черный)
Цветовая модель RGB
Цветные изображения могут иметь различную глубину цвета, которая задается
количеством битов, используемых для кодирования цвета точки.
Если кодировать цвет одной точки изображения тремя битами (по одному
биту на каждый цвет RGB), то мы получим все восемь различных цветов.
True Color
На практике же, для сохранения информации о цвете каждой
точки цветного изображения в модели RGB обычно
отводится 3 байта (т.е. 24 бита) - по 1 байту (т.е. по 8 бит)
под значение цвета каждой составляющей.
Таким образом, каждая RGB-составляющая может принимать
значение в диапазоне от 0 до 255 (всего 28=256 значений), а
каждая точка изображения, при такой системе кодирования
может быть окрашена в один из 16 777 216 цветов.
Такой набор цветов принято называть
True Color (правдивые цвета),
потому что человеческий глаз все равно не в состоянии
различить большего разнообразия.
Вычислим объем видеопамяти
Для того чтобы на экране монитора
формировалось изображение,
информация о каждой точке (код
цвета точки) должна храниться в
видеопамяти компьютера.
Рассчитаем необходимый объем
видеопамяти для одного из
графических режимов.
В современных компьютерах
разрешение экрана обычно
составляет 1280х1024 точек.
Т.е. всего 1280 * 1024 = 1310720
точек.
При глубине цвета 32 бита на точку
необходимый объем
видеопамяти: 32 *1310720 =
41943040 бит = 5242880 байт =
5120 Кб = 5 Мб.
Кодирование
векторных изображений
Векторное изображение
представляет собой совокупность
графических примитивов (точка,
отрезок, эллипс…). Каждый
примитив описывается
математическими формулами.
Кодирование зависит от прикладной
среды.
Достоинством векторной графики
является то, что файлы,
хранящие векторные
графические изображения,
имеют сравнительно небольшой
объем.
Важно также, что векторные
графические изображения могут
быть увеличены или
уменьшены без потери
Графические форматы файлов
Форматы графических файлов определяют способ
хранения информации в файле
(растровый или векторный),
а также форму хранения информации
(используемый алгоритм сжатия).
Наиболее популярные растровые форматы:
• BMP
• GIF
• JPEG
• TIFF
• PNG
Графические форматы файлов
•
•
•
•
•
Bit MaP image (BMP) — универсальный формат растровых графических файлов, используется в
операционной системе Windows. Этот формат поддерживается многими графическими
редакторами, в том числе редактором Paint. Рекомендуется для хранения и обмена данными с
другими приложениями.
Tagged Image File Format (TIFF) — формат растровых графических файлов, поддерживается всеми
основными графическими редакторами и компьютерными платформами. Включает в себя
алгоритм сжатия без потерь информации. Используется для обмена документами между
различными программами. Рекомендуется для использования при работе с издательскими
системами.
Graphics Interchange Format (GIF) — формат растровых графических файлов, поддерживается
приложениями для различных операционных систем. Включает алгоритм сжатия без потерь
информации, позволяющий уменьшить объем файла в несколько раз. Рекомендуется для
хранения изображений, создаваемых программным путем (диаграмм, графиков и так далее) и
рисунков (типа аппликации) с ограниченным количеством цветов (до 256). Используется для
размещения графических изображений на Web-страницах в Интернете.
Portable Network Graphic (PNG) — формат растровых графических файлов, аналогичный формату
GIF. Рекомендуется для размещения графических изображений на Web-страницах в Интернете.
Joint Photographic Expert Group (JPEG) — формат растровых графических файлов, который
реализует эффективный алгоритм сжатия (метод JPEG) для отсканированных фотографий и
иллюстраций. Алгоритм сжатия позволяет уменьшить объем файла в десятки раз, однако
приводит к необратимой потере части информации. Поддерживается приложениями для
различных операционных систем. Используется для размещения графических изображений на
Web-страницах в Интернете.
ВЫВОД
• Качество двоичного кодирования
изображения определяется разрешающей
способностью экрана и глубиной цвета.
Вопросы и задания:
• Какие виды компьютерных изображений вы
знаете?
• Какое максимальное количество цветов может
быть использовано в изображении, если на
каждую точку отводится 3 бита?
• Что вы знаете о цветовой модели RGB?
• Рассчитайте необходимый объем видеопамяти
для графического режима: разрешение экрана
800х600, качество цветопередачи 16 бит.
Двоичное кодирование звука.
Представление видеоинформации
Информация и информационные процессы
Кодирование звука
Использование компьютера для обработки звука началось
позднее, нежели чисел, текстов и графики.
Звуковые сигналы в окружающем нас мире необычайно
разнообразны. Сложные непрерывные сигналы можно с
достаточной точностью представлять в виде суммы некоторого
числа простейших синусоидальных колебаний. Причем каждое
слагаемое, то есть каждая синусоида, может быть точно задана
некоторым набором числовых параметров –
амплитуды, фазы и частоты,
которые можно рассматривать как код звука в некоторый
момент времени.
Кодирование звука
Звук – это волна с непрерывно меняющейся частотой
и амплитудой.
Чем больше амплитуда – тем громче звук.
Чем больше частота – тем выше тон.
Временная дискретизация звука
В процессе кодирования
звукового сигнала
производится его временная
дискретизация –
непрерывная волна
разбивается на отдельные
маленькие временные
участки и для каждого
такого участка
устанавливается
определенная величина
амплитуды.
Таким образом непрерывная
зависимость амплитуды
сигнала от времени
заменяется на дискретную
последовательность уровней
громкости.
Качество двоичного кодирования звука
определяется глубиной кодирования и
частотой дискретизации.
Частота дискретизации – количество измерений
уровня сигнала в единицу времени.
Количество уровней громкости определяет
глубину кодирования.
Современные звуковые карты обеспечивают
16-битную глубину кодирования звука.
При этом количество уровней громкости равно
N = 2I = 216 = 65536.
Рассчитаем необходимый информационный объем
аудиофайла, длительностью 1 секунда при качестве
кодирования 16 битов и частотой дискретизации
48кГц:
Количество битов умножаем на частоту
дискретизации:
16 бит *48 000 * 1сек = 76800 бит
Представление
видеоинформации
В последнее время компьютер все чаще используется для
работы с видеоинформацией. Простейшей такой работой
является просмотр кинофильмов и видеоклипов. Следует
четко представлять, что обработка видеоинформации
требует очень высокого быстродействия компьютерной
системы.
Что представляет собой фильм с точки зрения информатики?
Прежде всего, это сочетание звуковой и графической
информации. Кроме того, для создания на экране эффекта
движения используется дискретная по своей сути
технология быстрой смены статических картинок.
Исследования показали, что если за одну секунду
сменяется более 10-12 кадров, то человеческий глаз
воспринимает изменения на них как непрерывные.
Представление
видеоинформации
Казалось бы, если проблемы кодирования статической графики
и звука решены, то сохранить видеоизображение уже не
составит труда.
Но это только на первый взгляд, поскольку при использовании
традиционных методов сохранения информации электронная
версия фильма получится слишком большой.
Достаточно очевидное усовершенствование состоит в том,
чтобы первый кадр запомнить целиком (в литературе его
принято называть ключевым), а в следующих сохранять
лишь отличия от начального кадра (разностные кадры).
Некоторые форматы
видеофайлов
Существует множество различных форматов представления
видеоданных.
• В среде Windows, например, уже более 10 лет применяется
формат Video for Windows, базирующийся на универсальных
файлах с расширением AVI (Audio Video Interleave – чередование
аудио и видео).
• Более универсальным является мультимедийный формат
Quick Time, первоначально возникший на компьютерах Apple.
• Все большее распространение в последнее время получают
системы сжатия видеоизображений, допускающие некоторые
незаметные для глаза искажения изображения с целью
повышения степени сжатия. Наиболее известным стандартом
подобного класса служит MPEG (Motion Picture Expert Group).
Методы, применяемые в MPEG, непросты для понимания и
опираются на достаточно сложную математику.
• Большее распространение получила технология под названием
DivX (Digital Video Express). Благодаря DivX удалось достигнуть
степени сжатия, позволившей вмесить качественную запись
полнометражного фильма на один компакт-диск – сжать 4,7 Гб
DVD-фильма до 650 Мб.
Мультимедиа
Мультимедиа (multimedia, от англ. multi - много и media носитель, среда) - совокупность компьютерных технологий,
одновременно использующих несколько информационных
сред: текст, графику, видео, фотографию, анимацию,
звуковые эффекты, высококачественное звуковое
сопровождение.
Под словом «мультимедиа» понимают воздействие на
пользователя по нескольким информационным каналам
одновременно. Можно еще сказать так: мультимедиа – это
объединение изображения на экране компьютера (в том
числе и графической анимации и видеокадров) с текстом и
звуковым сопровождением.
Наибольшее распространение системы мультимедиа получили
в области обучения, рекламы, развлечений.
Приведите примеры
аналогового и дискретного
способов представления
графической информации.
Что такое дискретизация?
От чего зависит качество
изображения на экране?
От каких параметров зависит
качество двоичного
кодирования звука?
1-й вариант
1. Приведите примеры аналогового и
дискретного способов представления
звуковой информации.
2. Какие цветовые модели вы знаете?
3. От чего зависит качество
изображения на экране?
4. Рассчитать необходимый объем
видеопамяти графического режима
1440*990 точек с глубиной цвета 32
бита на точку:
2-й вариант
1. Приведите примеры аналогового и
дискретного способов
представления графической
информации.
2. Из каких элементов составляется
изображение на экране?
3. От каких параметров зависит
качество двоичного кодирования
звука?
4. Рассчитаем необходимый
информационный объем
аудиофайла, длительностью 1
секунда при качестве кодирования
24 бита и частотой дискретизации
32кГц:
Download