ALF_bit

advertisement
Поскольку определять информацию
можно по-разному,
то и способы измерения
тоже могут быть разными.
Существует множество подходов к
измерению информации
Алфавитный
подход
к измерению информации
Познакомимся с способом измерения информации,
который не связывает количество информации с
содержанием сообщения, и называется он алфавитным
подходом.
При алфавитном подходе к определению количества
информации отвлекаются от содержания информации и
рассматривают
информационное
сообщение
как
последовательность знаков определенной знаковой
системы.
Применение алфавитного подхода удобно прежде
всего при использовании технических средств работы с
информацией. В этом случае теряют смысл понятия
«новые — старые», «понятные — непонятные» сведения.
Алфавитный
подход
является
объективным
способом измерения информации в отличие от
субъективного содержательного подхода.
Алфавит и его мощность
Все множество используемых в языке символов будем
традиционно называть алфавитом.
Обычно под алфавитом понимают только буквы, но поскольку
в тексте могут встречаться знаки препинания, цифры, скобки, то
мы их тоже включим в алфавит. В алфавит также следует включить
и пробел, т.е. пропуск между словами.
Полное количество символов алфавита принято называть
м о щ н о с т ь ю алфавита.
Будем обозначать эту величину буквой N.
Например, мощность алфавита из заглавных русских букв и
отмеченных дополнительных символов равна 54.
А Б В ГД Е Ё Ж З И Й К Л М Н О П Р С Т УФ Х Ц Ч
ШЩЬЪЭЮЯ0123456789().,!?«»:-;
(пробел)
Алфавит — это вся совокупность
символов, используемых в некотором
языке для представления информации.
Мощность алфавита — это
число символов в алфавите ( N).
Информационный вес символа
Представьте себе, что текст к вам поступает последовательно, по
одному знаку, словно бумажная ленточка, выползающая из телеграфного
аппарата. Предположим, что каждый появляющийся на ленте символ с
одинаковой вероятностью может быть любым символом алфавита.
При алфавитном подходе считается, что каждый символ текста
имеет определенный информационный вес. Информационный
вес символа зависит от мощности алфавита.
А каким может быть наименьшее число символов в алфавите?
Двоичным называется алфавит,
мощность которого равна 2.
Информационный вес 1 символа
двоичного алфавита принят
за единицу информации и равен 1 бит.
Информационный вес 1 символа
двоичного алфавита принят
за единицу информации и называется 1 бит.
Алфавит- 0,1
Мощность N= 2
Порядковый номер символа
Двузначный двоичный код
0
0
1
1
Кодируется одним битом(0,1)- 2 комбинации
С увеличение мощности алфавита увеличивает информационный вес
символов алфавита
Один символ из четырехсимвольного
алфавита (N = 4) «весит» 2 бита.
Порядковый номер символа
0
1
2
3
Двузначный двоичный код
00
01
10
11
Используя три двоичные цифры, можно составить 8
различных комбинаций.
Порядковый номер
символа
Трехзначный
двоичный код
0
1
2
3
4
5
6
7
000
001
010
011
100
101
110
111
Комбинацию из нескольких
(двух, трех и т. д.) знаков двоичного
алфавита (0,1) назовем двоичным кодом.
Используя три двоичные цифры, можно составить 8
различных комбинаций.
Порядковый номер
символа
Трехзначный
двоичный код
0
1
2
3
4
5
6
7
000
001
010
011
100
101
110
111
Используя четыре двоичные цифры, можно составить
16 различных комбинаций.
0
1
2
3
4
5
6
7
0000
0001
0010
0011
0100
0101
0110
0111
8
9
10
11
12
13
14
15
1000
1001
1010
1011
1100
1101
1110
1111
Зависимость между мощностью алфавита N и
количеством знаков в коде i.
N
2
4
i
1 бит
1
Заметим 2 = 2
8
16
2 бита 3 бита 4 бита
2
3
4=2
8=2
16 = 2
В общем виде это записывается
следующим образом:
N= 2
i
4
1
27= 128
2
28= 256
3
29= 512
2 =2
2 =4
2 =8
4
2 = 16
26= 64
2 10= 1024
Информационный вес каждого
символа, выраженный в битах (i) и
мощность алфавита (N) связаны
между собой формулой:
N= 2
i
.
N= 2
i
Алфавит племени Мульти состоит из 8 букв. Какое
количество информации несет одна буква этого алфавита?
i
N=8
8=2
i-?
2 =2  3= i
3
i
Задание:
Определите
информационный
объем
страницы книги (3000), если для записи текста
использовались только заглавные буквы русского
алфавита, кроме буквы Ё.
Решение:
1.
2.
3.
4.
5.
N = 32
2I = N
2I = 32
I=5
На странице 3000 знаков, тогда
информации = 3000 * 5 = 15000 бит.
объем
I= K · i ,
I - количество информации в тексте
K – количество символов в тексте
i
- информационный вес 1 символа
Какой объем информации несет
слово «информация»?
i
N=32
32=2
K=10
2 =2  i =5 бит – 1 буква
I-?
I = K· i  I = 10 · 5=50
Ответ: 50 бит
5
i
Алфавит и его мощность
Все множество используемых в языке символов будем
традиционно называть алфавитом.
Обычно под алфавитом понимают только буквы, но поскольку
в тексте могут встречаться знаки препинания, цифры, скобки, то
мы их тоже включим в алфавит. В алфавит также следует включить
и пробел, т.е. пропуск между словами.
Полное количество символов алфавита принято называть
м о щ н о с т ь ю алфавита.
Будем обозначать эту величину буквой N.
Например, мощность алфавита из заглавных русских букв и
отмеченных дополнительных символов равна 54.
А Б В ГД Е Ё Ж З И Й К Л М Н О П Р С Т УФ Х Ц Ч
ШЩЬЪЭЮЯ0123456789().,!?«»:-;
(пробел)
Сколько информации несет
один символ в русском языке
Представьте себе, что текст к вам поступает последовательно, по
одному знаку, словно бумажная ленточка, выползающая из телеграфного
аппарата. Предположим, что каждый появляющийся на ленте символ с
одинаковой вероятностью может быть любым символом алфавита.
В каждой очередной позиции текста может появиться любой из N
символов.
Тогда, согласно известной нам формуле 2I = N , каждый такой
символ несет I бит информации, которое можно определить из решения
уравнения: 2I = 54.
Получаем: I = 5.755 бит.
Вот сколько информации несет один символ в русском тексте!
Количество информации в тексте
А теперь для того, чтобы найти количество информации во всем
тексте, нужно посчитать число символов в нем и умножить на I.
Посчитаем количество информации на одной странице книги.
Пусть страница содержит 50 строк. В каждой строке — 60 символов. Значит,
на странице умещается 50x60=3000 знаков. Тогда объем информации будет равен:
5,755 х 3000 = 17265 бит.
При алфавитном подходе к измерению информации
количество информации зависит не от содержания, а от размера
текста и мощности алфавита.
Двоичный алфавит
А что если алфавит состоит только из двух символов
0 и 1?
В этом случае: N = 2; 2I = N; 2I = 2; I = 1!
При использовании двоичной системы (алфавит
состоит из двух знаков: 0 и 1) каждый двоичный
знак несет 1 бит информации.
Интересно, что сама единица измерения информации «бит»
получила свое название от английского сочетания
«binary digit» - «двоичная цифра».
Найти информационный объем
текста, записанного с помощью
двоичного алфавита:
1101001011000101110010101101000111010010
содержит 40 символов,
Так как мощность алфавита N=2 
i
1
i
2=2  2 =2  1= i
I = K· i  I = 40 · 1= 40.
Ответ: информационный объем равен 40 битам.
Достаточный алфавит
Удобнее всего измерять информацию, когда размер алфавита N
равен целой степени двойки. Например, 4если N=16, то каждый символ
несет 4 бита информации потому, что 2 = 16. А если N =32, то один
символ «весит» 5 бит.
Ограничения на максимальный размер алфавита теоретически не
существует. Однако есть алфавит, который можно назвать
достаточным.
С ним мы имеем дело при работе с компьютером.
Это алфавит мощностью 256 символов. В алфавит такого размера
можно поместить все практически необходимые символы: латинские и
русские буквы, цифры, знаки арифметических операций,
всевозможные скобки, знаки препинания....
Поскольку 256 = 28, то один символ этого алфавита
«весит» 8 бит.
Причем 8 бит информации — это настолько характерная величина,
что ей даже присвоили свое название — байт.
1 байт = 8 бит
Количество информации в тексте
Сегодня очень многие люди для подготовки писем,
документов, статей, книг и пр. используют компьютерные
текстовые редакторы. Компьютерные редакторы, в основном,
работают с алфавитом размером 256 символов.
В этом случае легко подсчитать объем информации в
тексте. Если 1 символ алфавита несет 1 байт информации, то
надо просто сосчитать количество символов; полученное число
даст информационный объем текста в байтах.
Пусть небольшая книжка, сделанная с помощью
компьютера, содержит 150 страниц; на каждой странице —
40 строк, в каждой строке — 60 символов.
Значит страница содержит
40x60=2400 байт информации.
Объем всей информации в книге:
2400 х 150 = 360 000 байт.
Выполнить в тетради:
28= 256
8*7=56
 Один
символ алфавита «весит» 8 бит,
сколько символов в алфавите? И какой
объем
будет
занимать
сообщение,
256*9=2304
состоящее из 7 символов?
 Подсчитать информационный объем слова
«компьютер»
Более крупные единицы информации
Условное
Название
обозначение
Соотношение с другими единицами
Килобит
Кбит
1 Кбит = 1024 бит = 210 бит ==1024 бит
Мегабит
Мбит
1 Мбит = 1024 Кбит = 220 бит ==1024*1024 бит
Гигабит
Гбит
1 Гбит = 1024 Мбит = 230 бит==1024*1024*1024 бит
Килобайт
Кбайт (Кб)
1 Кбайт = 1024 байт = 210 байт=1024*8 бит
Мегабайт Мбайт (Мб)
1 Мбайт = 1024 Кбайт = 220 байт=1024* 1024*8 бит
Гигабайт
1 Гбайт = 1024 Мбайт = 230 байт=1024*1024*1024*8 бит
Гбайт (Гб)
Скорость передачи
информации
Прием-передача
информации
могут
происходить с разной скоростью.
Количество информации, передаваемое за
единицу времени, есть скорость передачи
информации или скорость информационного
потока.
Очевидно, эта скорость выражается в таких
единицах, как бит в секунду (бит/с), байт в секунду
(байт/с), килобайт в секунду (Кбайт/с) и т.д.
Задачи:
С помощью модема (скорость 16 Кб/с) скачали
сообщение за 7 секунд. Определите информацион-ный
объем и количество символов в сообщение, если он
закодированы в кодах ASCII (8 бит- «вес» символа).
Задачи:
1. Сколько килобайтов составляет сообщение,
содержащее 12288 битов?
2. С помощью модема (скорость 64 Кб/с) скачали
сообщение за 5 секунд. Определите информационный
объем и количество символов в сообщение, если он
закодированы в кодах ASCII (8 бит- «вес» символа).
3. Два текста содержат одинаковое количество
символов. Первый текст составлен в алфавите
мощностью 32 символа, второй – мощностью 64
символа. Во сколько раз отличается количество
информации в этих текстах?
Практическая работа
«Измерение
информации»
Минимальным
адресуемым
элементом
жесткого диска
является кластер, размер которого зависит от типа
используемой таблицы размещения файлов FAT и
емкости жесткого диска.
Таблица FAT32, NTFS логически разбивает жесткий
диск на кластеры, содержащие по восемь секторов.
Таким образом, независимо от информационной
емкости жесткого диска размер кластера составляет 4
Кбайта.
На жестком диске с файл будет занимать один
кластер, объем которого равен 4 Кбайта.
Каждый файл на диске занимает определенное
количество
секторов
(кластеров).
Кластеры
нумеруются и каталог диска содержит указание на
начало файла (содержит номер первого кластера
файла).
Информация
о
последовательность
кластеров (номера кластеров), в которых хранится
Вопросы:
Что такое «алфавит»? Что такое «мощность алфавита»?
Как определяется количество информации в сообщении с
алфавитной точки зрения?
Что больше 1 Кбайт или 1000 байт?
Расположите единицы измерения информации в порядке
возрастания:
Гигабайт; Байт; Мегабайт; Килобайт.
Сколько информации содержится в сообщении, если для
кодирования одного символа использовать 1 байт:
«Компьютер – универсальный прибор.»
Задание 1:
Племя Мумбу-Юмбу использует алфавит из букв:
αβγδεζηθλμξσφψ, точки и для разделения слов
используется пробел.
Сколько информации несет свод законов племени,
если в нем 12 строк и в каждой строке по 20 символов?
Задание 2:
Вычислите какова мощность алфавита, с помощью
которого записано сообщение, содержащее 2048 символов,
если его объем составляет 1.25 Кбайта.
АЛФАВИТНЫЙ ПОДХОД
К ИЗМЕРЕНИЮ ИНФОРМАЦИИ
МОЩНОСТЬ АЛФАВИТА
2 = N
N
i
ИНФОРМАЦИОННЫЙ ВЕС СИМВОЛА
I = K·i
K
ЧИСЛО СИМВОЛОВ В СООБЩЕНИИ
i
I
число символов в алфавите (его размер)
количество информации в одном символе (в битах)
КОЛИЧЕСТВО ИНФОРМАЦИИ В СООБЩЕНИИ
Download