Основные понятия и методы теории информации и кодирования

advertisement
ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
(ТПУ)
КАФЕДРА ПРИКЛАДНОЙ МАТЕМАТИКИ (ПМ)
ИНФОРМАТИКА
Лектор: к.т.н., доцент кафедры ПМ, Зимин Вячеслав Прокопьевич
Лабораторные занятия ведут:
к.т.н., доцент кафедры ПМ, Вадутова Фаина Александровна
старший преподаватель кафедры ПМ, Крылова Лариса Михайловна
ассистент кафедры ПМ, Моисеенко Нина Борисовна
к.т.н., доцент кафедры ПМ, Зимин Вячеслав Прокопьевич
1
ТЕМА 1.
ОСНОВНЫЕ ПОНЯТИЯ И МЕТОДЫ ТЕОРИИ ИНФОРМАЦИИ И
КОДИРОВАНИЯ.
СИГНАЛЫ, ДАННЫЕ, ИНФОРМАЦИЯ.
ОБЩАЯ ХАРАКТЕРИСТИКА ПРОЦЕССОВ СБОРА, ПЕРЕДАЧИ,
ОБРАБОТКИ И НАКОПЛЕНИЯ ИНФОРМАЦИИ
1. Основные определения дисциплины «Информатика».
2. Сообщения, данные, сигнал, атрибутивные свойства информации, показатели
качества информации, формы представления информации.
3. Системы передачи информации.
4. Меры и единицы количества и объема информации.
5. Позиционные системы счисления.
6. Логические основы ЭВМ.
2
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ДИСЦИПЛИНЫ «ИНФОРМАТИКА»
Считается, что дисциплина «Информатика» получила название из сочетания
двух слов – ИНФОРМАция и автомаТИКА, т.е. автоматическая обработка
(преобразование) информации.
За рубежом (в Европе) также применяется название «Информатика», а, например
в США эта дисциплина носит название «Computer Science» – «Вычислительные
науки».
В настоящее время человечество активно осваивает и оперирует информацией.
Можно говорить о третьем этапе активного освоения обществом информации.
Первые два этапа были связаны с освоением материи и энергии. На первых двух
этапах информация играла, в какой-то степени, вспомогательную роль.
В настоящее время происходит информатизация общества, целью которой
является создание информационного общества, когда большинство людей занято
производством, хранением, переработкой и передачей различных видов и объемов
информации. Для решения этой задачи возникают новые направления в научной
и практической деятельности членов общества. В результате чего возникла
«Информатика» и «Информационные технологии».
3
ИНФОРМАЦИОННОЕ ОБЩЕСТВО имеет следующие характерные черты:
1) решена проблема информационного кризиса, когда устранено противоречие
между информационной лавиной и информационным голодом;
2) обеспечен приоритет информации перед другими ресурсами;
3) главная форма развития общества – информационная экономика;
4) в основу общества закладывается автоматизированная генерация, хранение,
обработка и использование знаний с помощью новейшей информационной
техники и технологии;
5) информационные технологии приобретают глобальный характер, охватывая все
сферы социальной деятельности человека;
6) формируется информационное единство всей человеческой цивилизации;
с помощью средств информатики реализован свободный доступ каждого человека к
информационным ресурсам всей цивилизации;
7) реализованы гуманистические принципы управления обществом и воздействия
на окружающую среду.
Помимо перечисленных положительных результатов процесса информатизации
общества, возможны и негативные тенденции, сопровождающие этот процесс:
1) все большее влияние приобретают средства массовой информации;
2) информационные технологии могут разрушить частную жизнь человека;
3) существенное значение приобретает проблема качественного отбора достоверной
информации;
4) некоторые люди испытывают сложности адаптации к информационному
4
обществу.
Определение. Информатика – это научная дисциплина, изучающая структуру и
общие свойства научной информации, а также закономерности всех процессов
научной коммуникации – от неформальных процессов обмена научной
информации при непосредственном устном и письменном общении ученых и
специалистов до формальных процессов обмена посредством научной литературы.
Определение. Информатика – это комплекс наук, которые изучают процессы,
связанные с регистрацией, производством, обработкой, передачей и хранением
информации.
Определение. Информация (лат. informatio – разъяснение, изложение,
осведомленность) – это понятие, обозначающее некоторые сведения, совокупность
каких-либо данных, знаний и т.д. и подлежащих регистрации, передаче, хранению
и обработке на вычислительных машинах.
Определение. Информация научная – логическая информация, адекватно
отображающая объективные закономерности природы, общества и мышления.
5
Информатика – это область человеческой деятельности, связанная с процессами
преобразования информации с помощью компьютеров и других средств
вычислительной техники.
С информатикой часто связывают одно из следующих понятий: это либо
совокупность определенных средств преобразования информации, либо
фундаментальная наука, либо отрасль производства,
либо прикладная дисциплина.
Совокупность средств преобразования информации включает технические
средства (hardware), программные продукты (software), математические методы,
модели и типовые алгоритмы (brainware).
Технические средства - это компьютеры и связанные с ними периферийные устройства
(мониторы, клавиатуры, принтеры и плоттеры, модемы и т.д.), линии связи, средства
оргтехники и т.п.
Программные продукты - это операционные системы и их интегрированные оболочки,
системы программирования и проектирования программных продуктов, различные
прикладные пакеты, такие, как текстовые и графические редакторы, бухгалтерские и
издательские системы и т.д.
Математические методы, модели и типовые алгоритмы - это базис, который
составляет основу проектирования и изготовления программного, технического средства
или другого объекта в силу исключительной сложности последнего и, как следствие,
невозможности умозрительного (упрощенного, приблизительного) подхода к созданию. 6
Информатика как фундаментальная наука занимается разработкой абстрактных
методов, моделей и алгоритмов, а также связанных с ними математических
теорий. Ее прерогативой является исследование процессов преобразования
информации и на основе этих исследований разработка соответствующих теорий,
моделей, методов и алгоритмов, которые затем применяются на практике.
Информатика как отрасль производства практически использует результаты
исследований фундаментальной науки информатики. В самом деле, широко
известны западные фирмы по производству программных продуктов, такие как
«Microsoft», «Lotus», «Borland», и технических средств – «IBM», «Apple», «Intel»,
«Hewlett Packard» и другие. Помимо производства самих технических и
программных средств разрабатываются также и технологии преобразования
информации.
Информатика как прикладная дисциплина занимается подготовкой специалистов
в области преобразования информации. Она изучает закономерности протекания
информационных процессов в конкретных областях и методологии разработки
конкретных информационных систем и технологий.
Таким образом, главная функция информатики состоит в разработке методов и
средств преобразования информации с использованием компьютера, а также в
применении их при реализации технологического процесса преобразования
7
информации.
ИНФОРМАЦИЯ – ОСНОВНОЙ ОБЪЕКТ ИЗУЧЕНИЯ ИНФОРМАТИКИ
Характерными чертами информации являются следующие:
1) это наиболее важный ресурс современного производства: он снижает
потребность в земле, труде, капитале, уменьшает расход сырья и энергии. Это
возникает вследствие создания новых технологий обработки материалов,
преобразования энергии и т.д.
2) информация является источником инноваций. Например, изобретение лазера
явилось причиной возникновения и развития производства лазерных
(оптических) дисков;
3) информация является товаром, причем продавец информации ее не теряет после
продажи. Так, если студент сообщит своему товарищу сведения о технологии
решения задачи по математики, он эти данные не потеряет для себя;
4) информация придает дополнительную ценность другим ресурсам, в частности,
трудовым. Действительно, работник с высшим образованием ценится больше, чем
со средним, т.к. он обладает большей созидательной способностью.
8
Обычно информация становится актуальной, когда имеется источник и
потребитель информации. Но, одновременно, передача информации
осуществляется с помощью какого-либо материального носителя – сигнала.
Источник
информации
1
Сигнал
2
Потребитель
информации
Сигнал – материальный носитель, который фиксирует информацию для
переноса ее от источника к потребителю. При регистрации сигнала образуются
данные. Сигнал может носить электронный или оптический характер. Сигнал
может быть дискретным и аналоговым.
Если же студент возьмет данное пособие в библиотеке, то та же информация
будет иметь бумажный носитель. Будучи прочитанной и запомненной студентом,
информация приобретет еще один носитель – биологический, когда она
«записывается» в память обучаемого.
Сигнал является важнейшим элементом в данной схеме. Формы его
представления, а также количественные и качественные характеристики
содержащейся в нем информации, важные для потребителя информации,
рассматриваются далее в данной дисциплине. С помощью основных
технических характеристик компьютера как основного инструмента,
выполняется отображение источника информации в сигнал (связь 1 на рисунке)
и «доводится» сигнал до потребителя информации (связь 2 на рисунке).
Одновременно с этим реализуется информационный процесс – набор структур
9
процедур, реализующих связи 1 и 2.
СВОЙСТВА ИНФОРМАЦИИ
Будучи объектом преобразования и использования, информация характеризуется
следующими свойствами:
Синтаксис – свойство, определяющее способ представления информации на
носителе (в сигнале). Так, данная информация представлена на электронном
носителе с помощью определенного шрифта. Здесь же можно рассматривать
такие параметры представления информации, как стиль и цвет шрифта, его
размеры, междустрочный интервал и т.д. Выделение нужных параметров как
синтаксических свойств, очевидно, определяется предполагаемым способом
преобразования.
Семантика – свойство, определяющее смысл информации как соответствие
сигнала реальному миру. Так, семантика сигнала «информатика» заключается в
данном ранее определении. Семантика может рассматриваться как некоторое
соглашение, известное потребителю информации, о том, что означает каждый
сигнал (так называемое правило интерпретации). Семантику слов (сигналов)
познаёт обучаемый какому-либо иностранному языку. Можно сказать, что
смысл обучения информатике заключается в изучении семантики различных
сигналов – суть ключевых понятий этой дисциплины.
Прагматика – свойство, определяющее влияние информации на поведение
потребителя. Так прагматика информации, получаемой студентом по дисциплине
«Информатика», заключается, по меньшей мере, в успешной сдаче зачета по
10
информатике.
КАЧЕСТВО ИНФОРМАЦИИ
Качество информации является одним из важнейших параметров для потребителя
информации. Оно определяется следующими характеристиками:
1) репрезентативность – правильность отбора информации в целях адекватного
отражения источника информации. Например, в целях большей репрезентативности
данных о себе абитуриенты стремятся представить в приемную комиссию как можно
больше свидетельств, дипломов, удостоверений и другой информации, подтверждающей их
высокий уровень подготовки, что учитывается при зачислении в ВУЗ;
2) содержательность – семантическая емкость информации. Рассчитывается как
отношение количества семантической информации к ее количеству в геометрической мере.
Это характеристика сигнала, про который говорят, что «мыслям в нем тесно, а словам
просторно». В целях увеличения содержательности сигнала, например, используют для
характеристики успеваемости абитуриента не полный перечень его аттестационных оценок,
а средний балл по аттестату;
3) достаточность (полнота) – минимальный, но достаточный состав данных для
достижения целей, которые преследует потребитель информации. Эта характеристика
похожа на репрезентативность, однако разница состоит в том, что в данном случае
учитывается минимальный состав информации, который не мешает принятию решения.
Например, абитуриент – золотой медалист может не представлять в приемную комиссию
свой аттестат: диплом, подтверждающий получение золотой медали, свидетельствует о
полном наборе отличных оценок в аттестате;
11
4) доступность – простота (или возможность) выполнения процедур получения и
преобразования информации. Эта характеристика применима не ко всей информации, а
лишь к той, которая не является закрытой. Для обеспечения доступности бумажных
документов используются различные средства оргтехники для их хранения, а для облегчения
их обработки используются средства вычислительной техники;
5) актуальность – зависит от динамики изменения характеристик информации и
определяется сохранением ценности информации для пользователя в момент ее
использования. Очевидно, что касается информации, которая используется при зачислении,
она актуальна, так как само обучение уже закончилось, и его результаты изменены быть не
могут, а, значит, остаются актуальными;
6) своевременность – поступление не позже заранее назначенного срока. Этот параметр
также очевиден недавним абитуриентам: опоздание с представлением позитивной
информации (данные об ЕГЭ) о себе при поступлении может быть чревато незачислением в
вуз;
7) точность – степень близости информации к реальному состоянию источника
информации. Например, неточной информацией является медицинская справка, в которой
отсутствуют данные о перенесенных абитуриентом заболеваниях;
8) достоверность – свойство информации отражать источник информации с необходимой
точностью. Эта характеристика вторична относительно точности. В предыдущем примере
получаемая информация недостоверна;
9) устойчивость – способность информации реагировать на изменения исходных данных без
12
нарушения необходимой точности.
ФОРМЫ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ
Существует несколько форм представления информации.
Символьная форма основана на использовании символов – букв, цифр,
разнообразных знаков.
Текстовая информация также использует символы, точнее группы символов,
построенные в определенном порядке.
Графическая форма – это различного рода изображения состояний процессов,
объектов, явлений и т.п. Последняя форма имеет максимальную информационную
емкость.
Кроме этого, имеется речевая (звуковая) форма информация или ее еще
называют информацией, имеющей вербальный характер, т.е. информацией,
которая передается с помощью речи (звуков).
Важное значение имеет видеоинформация, особенно видеоинформация, в
котором имеются временные изменения, движение.
Особо отметим значение цифровой информации, как разновидности
символьной информации, т.к. этот вид информации наиболее широко
используется в компьютерах. При этом широко используются числа по основанию
2, 8, 10 и 16
(см. «Системы счисления»).
Совокупность (объединение) нескольких простых форм представления
информации образует мультимедийную информацию.
13
МЕРЫ И ЕДИНИЦЫ КОЛИЧЕСТВА И ОБЪЕМА ИНФОРМАЦИИ
В информатике, как правило, измерению подвергается информация,
представленная дискретным сигналом. При этом различают следующие
подходы:
Структурный. Измеряет количество информации простым
подсчетом информационных элементов, составляющих сообщение.
Применяется для оценки возможностей запоминающих устройств, объемов
передаваемых сообщений, инструментов кодирования без учета статистических
характеристик их эксплуатации.
Статистический. Учитывает вероятность появления сообщений: более
информативным считается то сообщение, которое менее вероятно, т.е. менее
всего ожидалось. Применяется при оценке значимости получаемой
информации.
Семантический. Учитывает целесообразность и полезность информации.
Применяется при оценке эффективности получаемой информации и ее
соответствия реальности.
Наиболее распространенным на практике является структурный способ измерения
информации.
14
Минимальной единицей количества информации является бит. Бит имеет два
значения «0» или «1» (иногда их обозначают как «нет» или «да»).
Восемь бит составляют байт (сокращенно б или Б)
1 Байт = 8 бит.
В информатике наиболее распространенными, кроме названных единиц измерения
количества информации (информационного объема) являются:
1 килобайт (Кб) = 210 байт = 1024 байт;
1 мегабайт (Мб) = 220 байт = 1024 * 1024 байт = 1048576 байт;
1 гигабайт (Гб) = 230 байт;
1 терабайт(Тб) = 240 байт;
1 петабайт (Пб) = 250 байт;
1 эксабайт (Эб) = 260 байт.
15
ЛОГИЧЕСКИЕ ОСНОВЫ ЭВМ
Кроме арифметических в ЭВМ выполняются логические операции. Последние
необходимы во многих случаях, например, при сравнении (побитно) двух чисел.
Базисом цифровой техники служат три логические операции, лежащие в основе
всех выводов компьютера. Иногда эти операции И, ИЛИ, НЕ называют «тремя
китами» логических основ ЭВМ. Эти операции реализуются в виде технических
устройств.
Логические операции И, ИЛИ совершаются над двумя операндами X, Y, а для
операции НЕ достаточно одного операнда X (или Y).
Для этих логических операций имеются таблицы истинности.
X
0
0
1
1
Y
0
1
0
1
И
0
0
0
1
ИЛИ
0
1
1
1
НЕ
1
0
(для операнда X)
Остальные логические операции (И-НЕ, ИЛИ, ИЛИ-НЕ, исключающее ИЛИ) и
анализ сложных логических выражений строится на основании операций И, ИЛИ,
НЕ.
16
Код ASCII (American Standard Code for Information Interchange) используется для внутреннего
представления символьной информации в ОС MS DOS, в Блокноте
ОС MS Windows’xx, а также для кодирования текстовых файлов в Интернет.
0
1
0
...
...
1
...
...
2
...
3
2
3
4
0
!
...
...
4
5
6
7
8
9
A
B
C
D
E
F
@ P
'
р
А
Р
а
...
...
...
р
Ё
1
A
Q
a
q
Б
С
б
...
...
...
с
ё
"
2
B
R
b
r
В
Т
в
...
...
...
т
Є
...
#
3
C
S
c
s
Г
У
г
...
...
...
у
є
...
...
$
4
D
T
d
t
Д
Ф
д
...
...
...
ф
Ї
5
...
...
%
5
E
U
e
u
Е
Х
е
...
...
...
х
ї
6
...
...
&
6
F
V
f
v
Ж
Ц
ж
...
...
...
ц
Ў
7
...
...
'
7
G
W
g
w
З
Ч
з
...
...
...
ч
ў
8
...
...
(
8
H
X
h
x
И
Ш
и
...
...
...
ш
°
9
...
...
)
9
I
Y
i
y
Й
Щ
й
...
...
...
щ
∙
A
...
...
*
:
J
Z
j
z
К
Ъ
к
...
...
...
ъ
·
B
...
...
+
;
K
[
k
{
Л
Ы
л
...
...
...
ы
√
C
...
...
,
<
L
\
l
|
М
Ь
м
...
...
...
ь
№
D
...
...
-
=
M
]
m
}
Н
Э
н
...
...
...
э
¤
E
...
...
.
>
N
^
n
~
О
Ю о
...
...
...
ю
■
F
...
...
/
?
O
_
o
¤
П
Я
...
...
...
я
п
17
Download