Document 4966870

advertisement
Информация в памяти
компьютера
Память компьютера состоит из ячеек.
0 1 1 0 0 0 1 1 1 0
0 0 1 1 0 0 1 0 1 1
0 0 0 1 1 0 1 1 0 1
1 1 1 0 1 0 1 1 0 1
1 0 1 1 1 0 0 0 1 1
0 1 1 0 1 0 0 1 0 0
1 1 0 1 1 1 0 0 0 1
1 0 0 1 1 0 1 1 0 1
Ячейка памяти
компьютера называется
БИТ
и содержит только 0 и 1
Текстовая информация
(документы, статьи)
Видеоинформация
(фильмы,
видеоролики,
анимация)
В памяти
компьютера
представлены
в виде
ноликов и
единичек
Звуковая информация
(голоса, музыка)
Графическая
информация
(фотографии,
рисунки)
Кодирование числовой информации
Как любое число записать 0 и 1?
Десятичная позиционная система
счисления:
0, 1, 2, 3, 4, 5, 6, 7, 8, 9 – итого 10 цифр
Значение цифры зависит от ее ПОЗИЦИИ в
записи числа: 5, 53, 531, 5314

1, 10, 100, 1000, 10000, 100000…
Любое число можно записать в виде суммы
разрядных слагаемых:
1327 = 1∙1000 + 3∙100 + 2∙10 + 7∙1
Двоичная позиционная система счисления
0, 1 – итого 2 цифры

1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048…
Любое число можно записать в виде суммы
этих разрядных слагаемых:
1327 = 1∙1024 + 0 ∙512 + 1∙256 + 0∙128 + 0∙64 +
1∙32 + 0∙16 + 1∙8 + 1∙4 + 1∙2 + 1∙1 =
101001011112
Перевод десятичных чисел в
двоичные
1. Делим число на 2, справа от него
записываем целую часть от результата,
а снизу – остаток от деления.
2. То же самое делаем с результатом
деления, повторяя процесс до тех пор,
пока результат не станет равным 0.
3. Читаем двоичное число по остаткам от
деления СПРАВА НАЛЕВО!
Перевод двоичных чисел в
десятичные
Нужно представить число в виде суммы
разрядных слагаемых:
64 32 16 8 4
2 1
1 1 0 0 1 0 12=64+32+4+1=10110
Арифметические операции
Таблица сложения
0
+
0
=
0
0
+
1
=
1
1
+
0
=
1
0
∙
0
=
0
1
+
1
=
10
0
∙
1
=
0
1
∙
0
=
0
1
∙
1
=
1
Таблица умножения
Таблица вычитания
0
-
0
=
0
0
-
1
=
11
1
-
0
=
1
1
-
1
=
0
Домашнее Задание
1.
2.
Перевести в двоичную систему счисления:
3510
Перевести в десятичную систему
счисления: 1011012
3.
10110101
+
10111000
1010
·
1100
Число
Двоичная запись
0
0000
1
0001
2
0010
16=24
3
0011
4
0100
1610=100002
Числа от 0 до 15
записываются в
двоичном виде
ровно 4
двоичными
цифрами:
5
0101
6
0110
7
0111
8
1000
9
1001
10
1010
11
1011
12
1100
13
1101
14
1110
15
1111
Шестнадцатеричная
система счисления
Шестнадцатеричная система
счисления
Шестнадцатеричные
цифры используются
для более компактной
записи двоичного кода :
4 двоичным цифрам
соответствует
1 шестнадцатеричная
Число Двоичная запись
Шестнадцатерич
ная цифра
0
0000
0
1
0001
1
2
0010
2
3
0011
3
4
0100
4
5
0101
5
6
0110
6
7
0111
7
8
1000
8
9
1001
9
10
1010
A
11
1011
B
12
1100
C
13
1101
D
14
1110
E
15
1111
F
Шестнадцатеричная
система счисления
Один байт (8 двоичных цифр) можно
разделить на две группы по 4 цифры,
и записать ровно двумя
шестнадцатеричными цифрами.
←
байт
→ ←
байт
→ ←
байт
→
1 0 0 1 1 0 1 0 1 1 1 0 0 1 0 0 1 1 0 0 1 1 0 1
9
A
E
4
C
D
Перевод шестнадцатеричных
чисел в десятичные
Нужно представить число в виде суммы
разрядных слагаемых:
4096 256 16
1
A 1 6 F
16
= A∙4096+ 1∙256 +6∙16+F∙1=
= 10∙4096+1∙256+ 6∙16+15 = 4132710
Кодирование текстовой
информации
Один символ кодируется одним байтом!
Каждому символу ставится в соответствие
уникальная цепочка из 8 двоичных цифр:
А - 01000001
Всего существует 256 таких разных цепочек,
то есть одним байтом можно закодировать
256 символов.
Соответствие символов и кодов задается с
помощью кодовой таблицы.
Существуют множество кодовых таблиц:
ASCII, КОИ-8, Windows и т.д.
Структура кодовой таблицы
.0
В
Т.1
.2
О
Р.3
.4
А
.5
Я
.6
.7
П
.8
О
.9
Л
.A
О
с
и
м
в
о
л
ы
.B
В
.C
И
.D
Н
.E
А
и
Е
0.
П
Е1.
Р2.
3.
В
4.
А
5.
Я
L
с
о
т
в
в
е
т
с
т
к
о
д
а
м
6.
7.
П
8.
О
9.
Л
A.
О
B.
В
C.
И
D.
Н
E.
А
F.
A7
в
у
ю
щ
.F
Код ASCII – первая кодировка
алфавита
.0
.1
0.
.2
.3
.4
.5
.6
.7
.8
.9
.A
.B
.C
у
п
р
а
в
л
я
ю
щ
и
е
с
и
м
в
о
л
ы
*
+
1.
2.
!
"
#
$
%
&
'
(
)
:
;
.D
.E
.F
,
—
.
/
<
=
>
?
3.
0
1
2
3
4
5
6
7
8
9
4.
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
5.
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]
^
_
6.
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
7.
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
Верхняя часть кодовой таблицы содержит
английские буквы, знаки, управляющие символы.
Остается неизменной до сих пор.
Кодирование русских букв
Изначальная вторая часть кодировки ASCII
содержит европейские буквы и символы
псевдографики:
Кодирование русских букв
На место европейских букв были
вставлены русские буквы. Сейчас это
называется «кодировка MS-DOS»
или Code Page 866 (cp866):
Кодирование русских букв
Для
преодоления
разрыва в
расположении
русских букв
была
предложена
новая кодовая
страница,
которая
называется
“кодировка
Windows” или
cp1251:
.0
.1
.2
.3
.4
.5
.6
.7
.8
8.
Ђ
Ѓ
‚
ѓ
„
… †
‡
€ ‰ Љ ‹ Њ Ќ Ћ Џ
9.
ђ
‘
’
“
”
•
– —
Ў
ў
Ј
¤
Ґ
¦
A.
.9
.A
.B
.C
.E
.F
™ љ
›
њ ќ
ћ
џ
§
Ё © Є
«
¬
®
Ї
·
ё № є
»
ј
ѕ
ї
B.
°
±
І
і
ґ
µ ¶
C.
А
Б
В
Г
Д
Е Ж З
D.
Р
С
Т
У Ф Х Ц Ч Ш Щ Ъ Ы Ь
E.
а
б
в
г
д
е ж
з
F.
р
с
т
у
ф
х
ч ш щ ъ ы
ц
.D
Ѕ
И Й К Л М Н О П
и
й
к
Э Ю Я
л м н
ь
о
п
э ю я
Проблемы
Наличие разных кодовых страниц
порождает следующие проблемы:
1. Вывод текста не в той кодировке, в
какой он был создан (кракозябры);
2. Невозможность использовать в
одном документе символы разных
языков (например, грузинского и
арабского);
3. Невозможно создать кодовые
страницы для китайского и японского
языков.
Пример кракозябр
Юникод – решение проблем
Юникод – международная система кодирования
для обмена информацией.
Стандарт UNICODE 4.0 позволяет закодировать
до 1 114 112 символов, что достигается путем
расширения кодового пространства: каждый
символ кодируется
 1 байтом (8-битная UTF-8, для совместимости)
 2 байтами (16-битная форма UTF-16)
 4 байтами (32-битная UTF-32)
Сейчас наиболее часто используется
2-х байтовая форма UTF-16.
Кодирование текста в Microsoft Office Word 2007
Система письма
Стандарты кодировки
Используемый шрифт
Многоязычная
Юникод (UCS-2 little-endian и bigendian, UTF-8, UTF-7)
Арабская
Windows 1256, ASMO 708
Шрифт по умолчанию основан на
стиле Normal для соответствующей
языковой версии Word
Courier New
Китайская (упрощенное
письмо)
Китайская (традиционное
письмо)
Кириллица
GB2312, GBK, EUC-CN, ISO-2022CN, HZ
BIG5, EUC-TW, ISO-2022-TW
SimSun
Windows 1251, KOI8-R, KOI8-RU,
ISO8859-5, DOS 866
Windows 1250, 1252-1254, 1257,
ISO8859-x
Courier New
Windows 1253
Courier New
Иврит
Windows 1255
Courier New
Японская
Shift-JIS, ISO-2022-JP (JIS), EUC-JP
MS Gothic
Вьетнамская
Windows 1258
Courier New
Индийская: тамильский язык
ISCII 57004
Latha
Индийская: непальский язык
ISCII 57002 (Devanagari)
Mangal
Английская,
западноевропейская или
другая латинская система
письма
Греческая
MingLiU
Courier New
Кодирование графической информации
Растровое кодирование
Рисунок делится вертикальными и
горизонтальными линиями на крошечные
фрагменты – пиксели. Цвет каждого пикселя
кодируется двоичным числом.
Совокупность всех пикселей – двумерный
массив точек, цвет каждой из которых
задается независимо – называется растр.
Основная характеристика растра – размер:
количество
точек по
вертикали
Х
количество
точек по
горизонтали
Кодирование графической информации
Для монохромного (черно-белого)
изображения каждый пиксель можно
кодировать 1 битом: 0 – нет цвета, 1 – есть
цвет.
 Для цветного изображения (Truecolor)
каждый пиксель кодируется смешением
оттенков трех основных цветов: Красного,
Зеленого и Синего. На каждый цвет
отводится по 8 битов, в которых можно
записать 256 различных оттенков. Это
называется «цветовая схема RGB» (Red,
Green, Blue).
Точное число цветов можно вычислить если
перемножить 256∙256∙256=?

Объем памяти на 1 пиксель
Монохромное
изображение
Цветное
изображение
1 бит на
пиксель
24-разрядный рисунок
(глубина цвета – 24 бита)
16 777 216 цветов
24 бита (3 байта) на
пиксель
Векторное кодирование
Рисунок представляется как состоящий из
геометрических фигур. Каждая фигура
может быть математически описана:
отрезки – координатами своих концов,
прямоугольники – координатами углов,
окружности – координатами центра и
радиусом и т.д.
Преимущества растрового и
векторного кодирования
Векторное
кодирование:
Независимость размера
файла от размеров рисунка;
Удобно преобразовывать
(поворачивать, растягивать)
Растровое
кодирование:
Возможность
кодировать реальные
изображения
(фотографии, факсы)
Кодирование звуковой
информации
Давление звуковой
волны
Из курса физики известно, что звук есть
колебания среды (например, воздуха).
Время
Временная дискретизация и
квантование звука
Значения
звукового
давления
фиксируются с
определенной
точностью
Квантование
Измерения проводятся через
определенные промежутки времени
Дискретизация
Параметры дискретизации
Частота дискретизации звука - это
количество измерений громкости
звука за одну секунду (8000 – 48 000).
 Глубина кодирования звука - это
количество бит, используемое для
кодирования уровней громкости
звука.
При глубине кодирования звука в 16
битов количество уровней громкости
звука равно N = 216 = 65 536.

Оцифровывание звуковой
информации
Аналоговый
(непрерывный)
звуковой сигнал
АЦП
(Аналогово
-цифровой
преобразо
ватель)
Оцифрованный
сигнал
Воспроизведение цифрового
звука
Оцифрованный
сигнал
ЦАП
(ЦифроАналоговый
преобразователь)
Аналоговый
(непрерывный)
звуковой
сигнал
Звуковая карта
ЦАП
АЦП
Звуковая
карта
Правила вычисления
информационного объема
объектов разных типов

Текст (только английские буквы и цифры):
1символ = 1 байт

Текст в Юникоде (кириллица, многоязычный текст):
1 символ = 2 байта

Черно-белое изображение:
1 пиксель = 1 бит

Цветное изображение:
1 пиксель = 3 байта
Звук:
1 секунда = глубина кодирования ∙ частота дискретизации ∙
количество каналов (в битах)

Задачи на измерение информации
На странице учебника немецкого языка
содержится 40 строк, в каждой строке –
примерно 60 символов. Каков
информационный объем страницы?
60 ∙ 40 ∙ 2 = 4 800 байт
Весь учебник содержит 176 страниц,
каков информационный объем учебника
в Килобайтах?
4 800 ∙ 176 = 844 800 байт = 825 К
Задачи на измерение информации
Пьерро объясняется в любви Мальвине с
помощью SMS-ок. Текст его письма
содержит 15 строк по 60 символов
каждая. На сколько SMS-ок будет разбито
его письмо, если размер одной SMS-ки
140 байт?
Символов в письме: 15 ∙ 60 = 900
Информационный объем письма: 900 ∙ 2= 1800
Количество SMS: 1800 / 140 = 13 (12.8)
Задачи на измерение информации
Информационный объем доклада 75,6 К.
На каждом листе содержатся 43 строки, в
каждой строке – в среднем 75 символов.
Сколько листов занимает доклад?
Информационный объем доклада:
75,6 ∙ 1024 ≈ 77 414 байт
Количество символов в докладе:
77 414 / 2 ≈ 38 707
Количество строк в докладе:
38 707 / 75 ≈ 516
Количество листов: 516 / 43 = 12
Задачи на измерение информации
Ромео нарисовал для Джульетты чернобелый рисунок размером 800 пикселей на
400 пикселей. Каков информационный
объем рисунка в килобайтах?
Сколько пикселей содержится в рисунке?
(Сколько пикселей – столько бит)
400 ∙ 800 = 320 000 пикселей = 320 000 бит
320 000 / 8 = 40 000 байт
40 000 / 1024 ≈ 39 К
Задачи на измерение информации
А Джульетта изменила формат
представления на цветной и раскрасила
ее. Каков теперь информационный объем
картинки?
Сколько пикселей содержит картинка?
400 ∙ 800 = 320 000 пикселей
320 000 ∙ 3 = 960 000 байт = 937,5 К
Задачи на измерение информации
Информационный объем цветного
изображения составляет 360 К. Какова
ширина картинки, если ее высота равна
240 пикселей?
Сколько байт содержит изображение?
360 ∙ 1024 = 368 640 байт
А сколько пикселей?
368 640 / 3 = 122 880 пикселей
Чему равна ширина картинки?
122 880 / 240 = 512 пикселей
Задачи на измерение информации
Информационный объем картинки 42,8 К.
Размер растра – 500 на 700. Изображение
цветное или монохромное?
Информационный объем:
42,8 ∙ 1024 ≈ 43827 байт ≈ 350616 бит
Количество пикселей: 500 ∙ 700 = 350 000
Бит на пиксель: 350616 / 350 000 ≈ 1
Следовательно, изображение
монохромное
Задачи на измерение информации
Оценить информационный объем цифровых
звуковых файлов длительностью 10 секунд при
глубине кодирования и частоте дискретизации
звукового сигнала, обеспечивающих
минимальное и максимальное качество звука:
а) моно, 8 битов, 8000 измерений в секунду;
б) стерео, 16 битов, 48 000 измерений в секунду.
а) 10 ∙ 8 ∙ 8000 ∙ 1 = 640 000 бит = 80 000 байт = 78,125 К
б) 10 ∙ 16 ∙ 48000 ∙ 2 = 15 360 000 бит = 1 920 000 байт =
1875 К ≈ 1,8 М
Задачи на измерение информации
Определить длительность звукового файла,
который уместится на дискете 3,5" (учтите, что
для хранения данных на такой дискете
выделяется 2847 секторов объемом 512 байтов
каждый):
а) при низком качестве звука: моно, 8 битов,
8000 измерений в секунду;
б) при высоком качестве звука: стерео, 16
битов, 48 000 измерений в секунду.
Объем файла:
512 ∙ 2847 = 1457664 байт = 11 661 312 бит
а) 11 661 312 бит / 8 / 8000 ≈ 182 сек
б) 11 661 312 бит / 2 / 16 / 48000 ≈ 7 сек
Самостоятельная работа
I вариант
II вариант
1. Пьеро написал Мальвине
1. На свадьбе Пьеро и
объяснение в любви на 10
Мальвины сделали цветную
страницах. На каждой странице по
фотографию размером 1250
40 строк, в каждой строке
на 960 пикселей. Каков
примерно 75 символов. Каков
информационный объем
информационный объем письма в
изображения в Мегабайтах?
Килобайтах?
2. Информационный объем
2. Информационный объем черно-
книги 1,5 М. В книге 512
белого изображения 53,125 К. Если
страниц, на каждой странице
ширина изображения 850
64 строки. Сколько символов
пикселей, то какова высота?
в каждой строке?
Самостоятельная работа
1.
2.
3.
Что такое растровое
кодирование?
Информационный объем
черно-белого изображения
53,125 К. Если ширина
изображения 850 пикселей,
то какова высота?
Пьеро написал Мальвине
объяснение в любви на 10
страницах, используя
итальянский, латинский,
греческий и английский
языки. На каждой странице
по 40 строк, в каждой строке
примерно 75 символов. Каков
информационный объем
письма в Килобайтах?
1.
2.
3.
Что такое векторное
кодирование?
Информационный объем
книги 1,5 М. В книге 512
страниц, на каждой
странице 64 строки.
Сколько символов в
каждой строке?
На свадьбе Пьеро и
Мальвины сделали
цветную фотографию
размером 1250 на 960
пикселей. Каков
информационный объем
изображения в
Мегабайтах?
Download