Алфавитный подход измерения информации

advertisement
Измерение информации:
алфавитный подход
Информация и информационные процессы
Как измерить информацию?
Вопрос: «Как измерить информацию?»
очень непростой.
Ответ на него зависит от того, что понимать
под информацией. Но поскольку
определять информацию можно поразному, то и способы измерения тоже
могут быть разными.
2
Алфавитный подход к измерению
информации
Познакомимся с способом измерения информации,
который не связывает количество информации с
содержанием сообщения, и называется он
алфавитным подходом.
При алфавитном подходе к определению количества
информации
отвлекаются
от
содержания
информации и рассматривают информационное
сообщение как последовательность знаков
определенной знаковой системы.
Применение алфавитного подхода удобно прежде всего при использовании
технических средств работы с информацией. В этом случае теряют смысл
понятия «новые — старые», «понятные — непонятные» сведения.
Алфавитный подход является объективным способом измерения
информации в отличие от субъективного содержательного подхода.
3
Алфавит и его мощность
Все множество используемых в языке символов будем
традиционно называть алфавитом.
Обычно под алфавитом понимают только буквы, но поскольку в
тексте могут встречаться знаки препинания, цифры, скобки,
то мы их тоже включим в алфавит. В алфавит также следует
включить и пробел, т.е. пропуск между словами.
Полное количество символов алфавита принято называть
мощностью алфавита.
Будем обозначать эту величину буквой N. Например, мощность
алфавита из заглавных русских букв и отмеченных
дополнительных символов равна 54.
АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЪЭЮЯ0123456789().,!?«»:-; (пробел)
4
Сколько информации несет один
символ в русском языке
Представьте себе, что текст к вам поступает последовательно,
по одному знаку, словно бумажная ленточка, выползающая
из телеграфного аппарата. Предположим, что каждый
появляющийся на ленте символ с одинаковой вероятностью
может быть любым символом алфавита.
В каждой очередной позиции текста может появиться любой из
N символов.
Тогда, согласно известной нам формуле 2I = N , каждый
такой символ несет I бит информации, которое можно
определить из решения уравнения: 2I = 54.
Получаем: I = 5.755 бит.
Вот сколько информации несет один символ в русском тексте!
5
Количество информации в тексте
А теперь для того, чтобы найти количество информации во
всем тексте, нужно посчитать число символов в нем и
умножить на I.
Посчитаем количество информации на одной странице книги.
Пусть страница содержит 50 строк. В каждой строке —
60 символов. Значит, на странице умещается
50x60=3000 знаков. Тогда объем информации будет
равен: 5,755 х 3000 = 17265 бит.
При алфавитном подходе к измерению информации
количество информации зависит не от содержания, а
от размера текста и мощности алфавита.
6
Основные формулы:
 N=2i
 V=k*i
N- мощность алфавита
i- информационный вес одного символа
алфавита в битах
k -количество символов в тексте (сообщении)
V-информационный объем текста (сообщения)
7
Задание 1:

Алфавит некоторого языка состоит из 32
символов. Какое количество информации в
битах будет содержать сообщение длиной в 80
символов?
Дано:
Решение:
N=20
K=80
N=2i
32=2i
i=5 бит
V=k*I
V=80*5 бит=400 бит
Найти:V
8
Двоичный алфавит
А что если алфавит состоит только из двух
символов 0 и 1?
В этом случае: N = 2; 2I = N; 2I = 2; I = 1!
При использовании двоичной системы (алфавит
состоит из двух знаков: 0 и 1) каждый двоичный
знак несет 1 бит информации.
Интересно, что сама единица измерения информации «бит»
получила свое название от английского сочетания
«binary digit» - «двоичная цифра».
9
Достаточный алфавит
Удобнее всего измерять информацию, когда размер алфавита N
равен целой степени двойки. Например, если N=16, то каждый
символ несет 4 бита информации потому, что 24 = 16. А если N
=32, то один символ «весит» 5 бит.
Ограничения на максимальный размер алфавита теоретически не
существует. Однако есть алфавит, который можно назвать
достаточным. С ним мы скоро встретимся при работе с
компьютером. Это алфавит мощностью 256 символов. В
алфавит такого размера можно поместить все практически
необходимые символы: латинские и русские буквы, цифры, знаки
арифметических
операций,
всевозможные
скобки,
знаки
препинания....
Поскольку 256 = 28, то один символ этого алфавита «весит» 8 бит.
Причем 8 бит информации — это настолько характерная величина,
что ей даже присвоили свое название — байт.
1 байт = 8 бит
10
Количество информации в тексте
Сегодня очень многие люди для подготовки писем, документов,
статей, книг и пр. используют компьютерные текстовые
редакторы. Компьютерные редакторы, в основном,
работают с алфавитом размером 256 символов.
В этом случае легко подсчитать объем информации в тексте.
Если 1 символ алфавита несет 1 байт информации, то надо
просто сосчитать количество символов; полученное число
даст информационный объем текста в байтах.
Пусть небольшая книжка, сделанная с помощью
компьютера, содержит 150 страниц; на каждой
странице — 40 строк, в каждой строке — 60
символов.
Значит
страница
содержит
40x60=2400
байт
информации.
Объем всей информации в книге: 2400 х 150 = 360 000
байт.
11
Более крупные единицы информации
Название
Условное
обозначение
Соотношение с другими единицами
Килобит
Кбит
1 Кбит = 1024 бит = 210 бит
Мегабит
Мбит
1 Мбит = 1024 Кбит = 220 бит
Гигабит
Гбит
1 Гбит = 1024 Мбит = 230 бит
Килобайт
Кбайт (Кб)
Мегабайт
Мбайт (Мб)
1 Мбайт = 1024 Кбайт = 220 байт=223 бит
Гигабайт
Гбайт (Гб)
1 Гбайт = 1024 Мбайт = 230 байт=233 бит
1 Кбайт = 1024 байт = 210 байт=213 бит
12
Скорость передачи информации
Прием-передача информации могут происходить с
разной скоростью.
Количество
информации,
передаваемое
за
единицу времени, есть скорость передачи
информации или скорость информационного
потока.
Очевидно, эта скорость выражается в таких
единицах, как бит в секунду (бит/с), байт в
секунду (байт/с), килобайт в секунду (Кбайт/с) и
т.д.
13
Вопросы:

Сколько информации содержится в сообщении, если для
кодирования одного символа использовать 1 байт:
«Компьютер – универсальный прибор.»

Два текста содержат одинаковое количество символов.
Первый текст составлен в алфавите мощностью 32 символа,
второй – мощностью 64 символа. Во сколько раз отличается
количество информации в этих текстах?
14
Задание 2:
Племя Мумбу-Юмбу использует алфавит из
букв: αβγδεζηθλμξσφψ, точки и для
разделения слов используется пробел.
Сколько информации несет свод законов
племени, если в нем 12 строк и в каждой
строке по 20 символов?
15
Задание 3:
Вычислите какова мощность алфавита, с
помощью которого записано сообщение,
содержащее 2048 символов, если его
объем составляет 1,25 Кбайта.
16
Задание 4.

Электронный термометр холодильника
способен измерять температуру в
диапазоне от -20 0 С до +11 0 С с
точностью 0,5 0 С. Произведено 15
замеров температуры. Оцените объем
полученной информации.
17
Решение:

В отрезке от -20 до 11 с шагом 0,5
содержится 64 значения. Это N.

Для кодирования каждой величины
температуры нужно i бит, где i=6 (N=2i)

Всего проведено 15 измерений, поэтому
V=15*6=90 бит
18
Задание 5.
Каждый символ кодируется одним байтом.
Чему будет равен информационный
объём предложения?
В одном килограмме 1000 граммов.
1.
16 килобайтов;
2.
256 бит;
3.
32 бита;
4.
16 байтов
19
Задание 6.
Каждый символ кодируется 16 битами. Чему
будет равен информационный объём
предложения?
Без труда не вытащишь рыбку из пруда.
1.
37 бит;
2.
592 бита;
3.
37 байт;
4.
592 байта
20
Задание 7.
Автоматическое устройство осуществило
перекодировку информационного сообщения
из 16-битной кодировки Unicode в 8-битную
кодировку ASCII. При этом информационный
объем сообщения уменьшился на 16 байт.
Сколько бит было в первоначальном
сообщении?
1). 512
2). 374
3). 256
4). 128
21
Задание 8.
Автоматическое устройство осуществило
перекодировку двух информационных
сообщений равной длины из 8-битной кодировки
ASCII в 16-битную кодировку Unicode в одно
новое сообщение, которое при этом
увеличилось на 240 байт. Какова длина каждого
из исходных сообщений в символах?
1). 120
2). 230
3). 460
4). 920
22
Задание 9.
В марафоне участвуют 12 спортсменов.
Специальное устройство регистрирует
прохождение финиша, записывая его номер с
использованием минимально возможного
количества бит, одинакового для каждого бегуна.
Каков информационный объем сообщения,
записанного устройством, после того, как финиш
пересекли 2/3 спортсменов?
1). 6 байт
2). 32 бита
3). 3 байта
4). 48 бит
23
Задание 10.
131 спортсмен участвовал в соревнованиях по
толканию ядра. Все результаты записывались
специальным автоматическим устройством с
помощью минимально возможного кол-ва бит,
одинакового для всех спортсменов. Каков
информационный объем сообщения, если
известно, что наилучшим результатом было 37
метров.
1). 100 байт
2). 126 байт
3). 712 бит
4). 786 бит
24
Задание11
На олимпиаде участники получают баллы от1 до
10 на каждом этапе, которые затем кодируются
специальным устройством минимально
возможным количеством бит для каждого
участника. Каков информационный объем
сообщения, записанного устройством, после того
как 75 участников прошли по 3 этапа?
1). 900 бит
2). 300 байт
3). 256 бит
4). 110 байт
25
Задание 12.
ЕГЭ сдавали 64 ученика. Максимальный балл,
который можно было получить -100. Набранный
балл (число, а не цифра) каждого ученика был
закодирован с использованием двоичного кода
минимально возможным количеством бит,
равным для всех. Определите информационный
объем сообщения, содержащего набранные
баллы каждого ученика.
1). 450 бит
2). 217 бит
3). 112 байт
4). 56 байт
26
Задание 13.

1. В некоторой стране автомобильный номер состоит
из 7 символов. В качестве символов используют 18
различных букв и десятичные цифры в любом
порядке.Каждый такой номер в компьютерной
программе записывается минимально возможным и
одинаковым целым количеством байтов, при этом
используют посимвольное кодирование и все
символы кодируются одинаковым и минимально
возможным количеством битов. Определите объем
памяти, отводимый этой программой для записи 60
номеров.

1) 240 байт

2) 300 байт

3) 360 байт

4) 420 байт
27
Задание 14.

Автоматическое устройство осуществило
перекодировку информационного
сообщения на русском языке,
первоначально записанного в 16-битном
коде Unicode, в 8-битную кодировку КОИ8. При этом информационное сообщение
уменьшилось на 480 бит. Какова длина
сообщения в символах?
28
Задание 15.

Скорость передачи данных через ADSL–
соединение равна 256000 бит/с. Передача
файла через данное соединение заняла 3
минуты. Определите размер файла в
килобайтах
29
Задание 16.

Приветствие участникам олимпиады от
марсиан записано с помощью всех
символов марсианского
алфавита:ТЕВИРП!КИ!Сколько
информации оно несет?
30
Задание 17.

Известно, что длительность непрерывного
подключения к сети Интернет с помощью
модема для некоторых АТС не превышает
10 минут. Определите максимальный
размер файла (в Килобайтах), который
может быть передан за время такого
подключения, если модем передает
информацию в среднем со скоростью 32
Килобит/с?
31
Download