Измерение информации. Объемный подход. Алфавитный подход к

advertisement
Информатика ФГОСС
Измерение
информации.
Объемный подход.
Алфавитный подход к
измерению информации
10 класс
Информатика ФГОСС
Измерение информации. Объемный подход. Алфавитный подход к измерению
информации
Измерение информации.
Объемный подход.
Алфавитный подход к
измерению информации
Информатика 10 класс
Токар И.Н.
Ключевые слова
• бит
• информационный вес символа
• информационный объём сообщения
• единицы измерения информации
Измерение информации. Содержательный подход.
При работе с информацией важно возникают
вопросы
связанные
с
измерением
информации:
достаточно ли места на носителе, чтобы
разместить нужную информацию?
 сколько времени понадобиться, чтобы
передать её по имеющемуся каналу
связи?
Величина, которая нас интересует в этих
случаях,
называется
ОБЪЁМОМ
ИНФОРМАЦИИ.
Измерение информации. Содержательный подход.
Объём текста
• Количество
страниц
• Формат листов
(размер)
• Величина
шрифта
• Длина строки
• Межстрочное
состояние
• Но
детскую книгу из
нескольких
десятков страниц
можно
перепечатать
мелким шрифтом
и без
иллюстраций на 23 страницы!!!
Измерение информации. Содержательный подход.
Количество страниц не является
универсальным измерением
информации.
количество
объем
страниц
информации,
определяет расход
заключённый в
бумаги, а не объём
тексте, разумнее
информации.
измерять
количеством
знаков этого
текста.
Измерение информации. Содержательный подход.
Знаки
• алфавит языка, на котором написан
текст
• знаки препинания
• цифры
• буквы других языков (английский,
греческий)
• пробел
Измерение информации. Содержательный подход.
Например:
• На странице
формата А4 (21см
х 30 см) при
размере шрифта
(кегле) 12 пунктов
и одинарном
интервале между
строками
помещается текст
объёмом
примерно 4000
знаков.
• Определением
объёма
информации в
знаках часто
пользуются в
издательской
практике.
например,
журналисту может
быть дано
ограничение на
объём статьи в 40 000
знаков.
Измерение информации. Содержательный подход.
Для
двоичного представления текстов в
компьютере
чаще
всего
используется
равномерный восьмиразрядный код.
С его помощью можно закодировать 256
символов, 28=256
 прописные и строчные
 английские и русские буквы
 цифры
 знаки препинания
 знаки арифметических операций
 всевозможные скобки и т.д..
Измерение информации. Содержательный подход.
Информационный объём текста в
память компьютера измеряется в
байтах.
Он равен количеству знаков а записи
текста.
8 бит= 1 байту.
Каждый
символ
некоторого
сообщения
определённый
информационный
вес
–
фиксированное количество информации.
имеет
несёт
Все символы одного алфавита имеют один и тот же вес,
зависящий от мощности алфавита.
Информационный вес символа двоичного алфавита
принят за минимальную единицу измерения информации
и называется 1 бит (bit)».
Информационный вес символа
произвольного алфавита
1
• Алфавит любого языка можно заменить
двоичным алфавитом.
2
• Для кодирования N символов произвольного
алфавита требуется i-разрядный двоичный код
3
• Информационный вес символа = разрядность
двоичного кода.
4
• Мощность алфавита и информационный вес
символа алфавита: N=2i
позволяет определить количество информации, заключенной
в тексте.
Полный набор символов, используемый для кодирования
текста, называется алфавитом или азбукой
Полное количество символов в алфавите называется
мощностью (размером) алфавита.
Если допустить, что все символы алфавита встречаются в
тексте с равной частотой (равновероятно), то количество
информации, которое несёт каждый символ, вычисляется
по формуле:
2i = N, где N - мощность алфавита;
i-информационная ёмкость (вес) одного символа алфавита.
Как измерить объём информации
в тексте из k символов
Vi = k . i
Где Vi – информационный объём
текста;
i – информационный вес одного
символа;
k – количество символов в тексте
Измерение информации. Содержательный подход.
1 Кб (килобайт) = 2 10 байт = 1024 байт
1 Мб (мегабайт) = 2 10 Кб = 1024 Кб
1 Гб (гигабайт) = 2 10 Мб = 1024 Мб
Измерение информации. Содержательный подход.
На странице формата 4000 байт
А4 (21см х 30 см) при
размере шрифта
3,9 Кб
(кегле) 12 пунктов и
одинарном
500 страниц ͌ 1,9 Мб
интервале между
строками помещается
текст объёмом
примерно 4000
знаков.
Задача 1
Алфавит племени Пульти содержит 8 символов. Каков
информационный вес символа этого алфавита?
Решение:
N=8
N = 2i
i–?
Краткая запись условия задачи
8 = 2i.
i = 3.
Соотношение, связывающее величины i и N
Ответ: 3 бита.
Вычисления
Информационный объем
сообщения
Информационный
объём
I
сообщения
равен
произведению количества K символов в сообщении на
информационный вес i символа алфавита:
K
Количество символов
в сообщении
i
Информационный вес
символа алфавита
I = K i
Задача 1
Сообщение, записанное буквами из 64-хсимвольного
алфавита, содержит 20 символов. Какой объём информации
оно несёт?
Дано:
Решение:
N= 64
K=20
1)Определение информационного веса одного
Vi = ?
64 = 2 i
символа алфавита:
26= 2i
i = 6 бит/символ
2) Информационный объём текста:
Vi= k. i= 20. 6 = 120 бит = 15 байт
Ответ: 15 байт
Задача 2
Сообщение, записанное буквами 32-символьного
алфавита, содержит 140 символов. Какое количество
информации оно несёт?
Решение:
N = 32,
K = 140
I –?
I = K  i,
N=2i
32 = 2 i, i = 5, I = 140  5 = 700 (битов)
Ответ: 700 битов.
Задача 3
Информационное сообщение объёмом 720 битов
состоит из 180 символов. Какова мощность алфавита, с
помощью которого записано это сообщение?
Решение:
I = 720;
N = 2 i,
K = 180;
I = K  i,
N –?
i = I/K
Ответ: 16 символов.
i = 720/180 = 4 (бита);
N = 24 = 16 (символов)
Единицы измерения информации
КОМПЬЮТЕРНЫЙ АЛФАВИТ
• русские (РУС) буквы
• латинские (LAT) буквы
• цифры (1, 2, 3, 4, 5, 6, 7, 8, 9, 0)
• математические знаки (+, -, *, /, ^, =)
• прочие символы («», №, %, <, >, :, ;, #, &)
Алфавит содержит 256 символов.
256 = 28  i=8
1
байт
информационный
алфавита мощностью 256.
1 байт = 8 битов
вес
символа
Задача 4
Информационное сообщение объёмом 4 Кбайта состоит
из 4096 символов. Каков информационный вес символа
этого сообщения? Сколько символов содержит алфавит, с
помощью которого записано это сообщение?
Решение:
I = 4 Кб,
K = 4096;
N = 2i, I = K  i, i = I/K
I = 4 (Кб) = 4 1024 8 (битов)
i–?N –?
i = 4  1024  8/4096 = 8 (битов)
N = 28 = 256 (символов)
Ответ: информационный вес символа = 8,
алфавит содержит 256 символов.
Самое главное
1 бит - минимальная единица измерения информации.
Информационный вес i символа алфавита и мощность N алфавита
связаны между собой соотношением: N = 2i.
Информационный объём I сообщения равен произведению количества
K символов в сообщении на информационный вес i символа алфавита:
I = K i.
1 байт = 8 битов.
Бит, байт, килобайт, мегабайт, гигабайт, терабайт - единицы
измерения
информации. Каждая следующая единица больше
предыдущей в 1024 (210) раза.
Вопросы и задания
Как
Что
нужно
определить
знать
для
определения
информационного
сообщения,
Что
Впринято
чем
сутьинформационный
за
алфавитного
минимальную
подхода
к измерению
измерения
Определите
информационный
весединицу
iобъём
символа
алфавитавеса
символа
представленного
алфавита
символами
некоторого
некоторого
естественного
естественного
или
или
информации?
информации?
мощностью
N, заполняя
таблицу:
формального языка?
N
8
32
64
128
256
N=2i
23
25
26
27
28
i (битов)
3
5
6
7
8
Племя Мульти пишет письма, пользуясь 16-символьным
Определите
информации
в сообщении
из К
алфавитом. количество
Племя Пульти
пользуется
32-символьным
символов
алфавита мощностью N, заполняя таблицу:
алфавитом.
Вожди племён обменялись письмами. Письмо племени
Мульти содержитi 100 символов, а письмо племени Пульти
N
i (битов)
K
I=K i
N=2 информационные
- 50. Сравните
объёмы сообщений,
(битов)
содержащихся в письмах.
8
3
400
2
3
1200
Решение:
5
16
200
2
1000
=
NМ 16, KМ=100. iМ=4, IМ=5400
100
26 iП=5, IП= 250
6
600
NП64
=32, KП=50.
Ответ:
27
7
700
128
100
Информационный
объём письма племени Пульти
8
2
8
800
256
100
больше чем объём письма племени Мульти.
Для записи текста использовался 64-символьный
алфавит. Какой объём информации в байтах содержат 10
страниц текста, если на каждой странице расположено 32
строки по 64 символа в строке?
Решение:
N=64, i=6, K=10  32  64= 20 480 (символов)
I= K  i / 8 = 20480  6 / 8 = 15360 (байтов)
Ответ: 15360 байтов.
Система основных понятий
Измерение информации — объемный подход
На
бумажных
носителях
На цифровых носителях и в технических системах
передачи информации
Объем
текста
измеряется
в знаках
Объем информации равен длине двоичного кода
Основная единица:
1 бит — один разряд двоичного кода
Длина кода символа (i бит)
кодируемого алфавита
мощностью N символов:
2' = N
Информационный объем
текста (I), содержащего К
символов:
I = К-1
Производные единицы
Байт
1 байт = 8 бит
Килобайт
(Кб) 1 Кб=
1024 байт
Мегабайт
(Мб) 1 Мб =
1024 Кб
Гигабайт (Гб)
1 Гб = 1024
Мб
Опорный конспект
АЛФАВИТ – это вся совокупность символов, используемых в
некотором языке для представления информации.
МОЩНОСТЬ АЛФАВИТА ( N ) – это число символов в
алфавите
N = 2i
I = Ki
N
МОЩНОСТЬ АЛФАВИТА
i
ИНФОРМАЦИОННЫЙ ВЕС СИМВОЛА
количество информации в одном символе
K
КОЛИЧЕСТВО СИМВОЛОВ В СООБЩЕНИИ
I
КОЛИЧЕСТВО ИНФОРМАЦИИ
В СООБЩЕНИИ
1 килобайт = 1 Кб = 1024 байта = 210 байтов
1 мегабайт = 1 Мб = 1024 Кб = 210 Кб = 220 байтов
1 гигабайт = 1 Гб = 1024 Мб = 210 Мб = 220 Кб = 230 байтов
1 терабайт = 1 Тб = 1024 Гб = 210 Гб = 220 Мб = 230 Кб = 240 байтов
Download