ИНФОРМАЦИЯ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ 1 бит Графическая форма

advertisement
ИНФОРМАЦИЯ
ИНФОРМАЦИЯ
И ЗНАНИЯ
ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ
1 – есть сигнал
0 – нет сигнала
Символьная форма
- языки
Естественные
Формальные
(речь устная и
письменная)
Измерение информации
I=K*b
2b=N
N – мощность алфавита
b – информационный вес символа
K – число символов в тексте
I - информационный объем текста
Единицы информации:
1байт =8 бит
1 Кб = 1024 б
1 Мб = 1024 Кб
1 бит
Графическая форма:
рисунки, схемы, чертежи, карты,
графики, диаграммы.
ИНФОРМАЦИОННЫЕ
ПРОЦЕССЫ
Т Е К С Т О В А Я ИНФОРМАЦИЯ
Анализ информационной деятельности
специалистов различных профилей,
показывает, что немалую её долю
составляет работа с текстовой
информацией.
За последние 15 лет доля текстовой
информации профессиональных баз,
оформленных с помощью компьютера,
выросла почти в 2 раза (47 % - 84 %).
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И
КОМПЬЮТЕР
В настоящее время
большая часть
персональных
компьютеров в мире
(и по количеству,
и по времени)
занято обработкой
именно
текстовой
информации.
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И
КОМПЬЮТЕР
или что такое
1) Сколько символов можно ввести в текстовый документ с
помощью компьютера
2) Каким образом компьютер распознает символы
3) Практическая работа
«П Е Р Е К О Д И Р О В А Н И Е Т Е К С Т А»
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И
КОМПЬЮТЕР
N=2
b
N – мощность алфавита
b – информационный вес символа
8
2 = 256
256 символов
Мощность алфавита
8бит=1 байт
Информационный вес символа
0
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И1
1
КОМПЬЮТЕР
10
0
1
1 1 0 1 1
1
0
0
1
1
1 10
1
1
0
0
При нажатии на клавиатуре любой 0
алфавитно–цифровой клавиши,
в компьютер поступает определенная
1 последовательность из
8 электрических импульсов (д в о и ч н ы й к о д с и м в о л а).
0
1
1
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И
КОМПЬЮТЕР
Присвоение каждому символу уникального числового кода вопрос соглашения, которое фиксируется в кодовой таблице.
В качестве международного стандарта принята кодовая таблица
ASCII
American Standard Code for Internation Interchange
Стандартная (0 – 127)
(международный стандарт)
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И
КОМПЬЮТЕР
American Standard Code for Internation Interchange
Стандартная (0 – 127)
(международный стандарт)
Альтернативная (128 – 225)
(национальные кодовые страницы)
•
•
•
•
•
KOI 8
Windows (CP 1251)
DOS (CP 866)
Mac
ISO
Использование различных кодовых страниц создаёт много неудобств как
для пользователей, так и для программистов.
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И
КОМПЬЮТЕР
Проблема стандартизации символьного кодирования решается
введением нового международного стандарта (U n i c o d e),
который допускает включение в кодовую таблицу до 6 5 5 3 6
символов.
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И
КОМПЬЮТЕР
Для преобразования русскоязычных текстовых документов из
одной
кодировки в
другую
используются специальные
программы - конверторы.
Одна из таких программ – текстовый редактор H i e r o g l y p h.
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И
КОМПЬЮТЕР
П Р А К Т И Ч Е С К А Я Р А Б О Т А «П Е Р Е К О Д И Р О В А Н И Е Т Е К С Т А»
До кодирования
После кодирования
Кодировка WIN (CP 1251)
Кодировка WIN (CP 1251)
Кодировка DOS
Љ
Љ®
®¤
¤Ё
Ёа
а®
® ўў Є
Є D
DO
OS
S
Кодировка ISO
є
єЮ
ЮФ
ФШ
Ша
аЮ
ЮТ
ТЪ
ЪР
Р II S
SO
O
Кодировка KOI8
л
лП
ПД
ДЙ
ЙТ
ТП
ПЧ
ЧЛ
ЛБ
Б K
KO
O II 8
8
Кодировка MAC
Љ
Љо
од
ди
ир
ро
оЮ
Юк
ка
а M
MA
AC
C
В Ы В О Д : В разных кодировочных таблицах буквы русского алфавита
имеют разный числовой код.
Использование различных кодовых страниц приводит к тому, что тексты,
созданные в одной кодировке, не будут правильно отображаться в другой.
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И
КОМПЬЮТЕР
ПРЕДСТАВЛЕНИЕ ТЕКСТА В ПАМЯТИ
КОМПЬЮТЕРА
ПРЕДСТАВЛЕНИЕ СИМВОЛОВ
Мощность алфавита
256 символов
Информационный вес
символа – 1 б а й т
Таблица кодировки
ASCII
•стандартная часть
•альтернативная часть
Т Е К С Т О В А Я ИНФОРМАЦИЯ
И
КОМПЬЮТЕР
Download