ИНФОРМАЦИЯ ИНФОРМАЦИЯ И ЗНАНИЯ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ 1 – есть сигнал 0 – нет сигнала Символьная форма - языки Естественные Формальные (речь устная и письменная) Измерение информации I=K*b 2b=N N – мощность алфавита b – информационный вес символа K – число символов в тексте I - информационный объем текста Единицы информации: 1байт =8 бит 1 Кб = 1024 б 1 Мб = 1024 Кб 1 бит Графическая форма: рисунки, схемы, чертежи, карты, графики, диаграммы. ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ Т Е К С Т О В А Я ИНФОРМАЦИЯ Анализ информационной деятельности специалистов различных профилей, показывает, что немалую её долю составляет работа с текстовой информацией. За последние 15 лет доля текстовой информации профессиональных баз, оформленных с помощью компьютера, выросла почти в 2 раза (47 % - 84 %). Т Е К С Т О В А Я ИНФОРМАЦИЯ И КОМПЬЮТЕР В настоящее время большая часть персональных компьютеров в мире (и по количеству, и по времени) занято обработкой именно текстовой информации. Т Е К С Т О В А Я ИНФОРМАЦИЯ И КОМПЬЮТЕР или что такое 1) Сколько символов можно ввести в текстовый документ с помощью компьютера 2) Каким образом компьютер распознает символы 3) Практическая работа «П Е Р Е К О Д И Р О В А Н И Е Т Е К С Т А» Т Е К С Т О В А Я ИНФОРМАЦИЯ И КОМПЬЮТЕР N=2 b N – мощность алфавита b – информационный вес символа 8 2 = 256 256 символов Мощность алфавита 8бит=1 байт Информационный вес символа 0 Т Е К С Т О В А Я ИНФОРМАЦИЯ И1 1 КОМПЬЮТЕР 10 0 1 1 1 0 1 1 1 0 0 1 1 1 10 1 1 0 0 При нажатии на клавиатуре любой 0 алфавитно–цифровой клавиши, в компьютер поступает определенная 1 последовательность из 8 электрических импульсов (д в о и ч н ы й к о д с и м в о л а). 0 1 1 Т Е К С Т О В А Я ИНФОРМАЦИЯ И КОМПЬЮТЕР Присвоение каждому символу уникального числового кода вопрос соглашения, которое фиксируется в кодовой таблице. В качестве международного стандарта принята кодовая таблица ASCII American Standard Code for Internation Interchange Стандартная (0 – 127) (международный стандарт) Т Е К С Т О В А Я ИНФОРМАЦИЯ И КОМПЬЮТЕР American Standard Code for Internation Interchange Стандартная (0 – 127) (международный стандарт) Альтернативная (128 – 225) (национальные кодовые страницы) • • • • • KOI 8 Windows (CP 1251) DOS (CP 866) Mac ISO Использование различных кодовых страниц создаёт много неудобств как для пользователей, так и для программистов. Т Е К С Т О В А Я ИНФОРМАЦИЯ И КОМПЬЮТЕР Проблема стандартизации символьного кодирования решается введением нового международного стандарта (U n i c o d e), который допускает включение в кодовую таблицу до 6 5 5 3 6 символов. Т Е К С Т О В А Я ИНФОРМАЦИЯ И КОМПЬЮТЕР Для преобразования русскоязычных текстовых документов из одной кодировки в другую используются специальные программы - конверторы. Одна из таких программ – текстовый редактор H i e r o g l y p h. Т Е К С Т О В А Я ИНФОРМАЦИЯ И КОМПЬЮТЕР П Р А К Т И Ч Е С К А Я Р А Б О Т А «П Е Р Е К О Д И Р О В А Н И Е Т Е К С Т А» До кодирования После кодирования Кодировка WIN (CP 1251) Кодировка WIN (CP 1251) Кодировка DOS Љ Љ® ®¤ ¤Ё Ёа а® ® ўў Є Є D DO OS S Кодировка ISO є єЮ ЮФ ФШ Ша аЮ ЮТ ТЪ ЪР Р II S SO O Кодировка KOI8 л лП ПД ДЙ ЙТ ТП ПЧ ЧЛ ЛБ Б K KO O II 8 8 Кодировка MAC Љ Љо од ди ир ро оЮ Юк ка а M MA AC C В Ы В О Д : В разных кодировочных таблицах буквы русского алфавита имеют разный числовой код. Использование различных кодовых страниц приводит к тому, что тексты, созданные в одной кодировке, не будут правильно отображаться в другой. Т Е К С Т О В А Я ИНФОРМАЦИЯ И КОМПЬЮТЕР ПРЕДСТАВЛЕНИЕ ТЕКСТА В ПАМЯТИ КОМПЬЮТЕРА ПРЕДСТАВЛЕНИЕ СИМВОЛОВ Мощность алфавита 256 символов Информационный вес символа – 1 б а й т Таблица кодировки ASCII •стандартная часть •альтернативная часть Т Е К С Т О В А Я ИНФОРМАЦИЯ И КОМПЬЮТЕР