Тема_1 - Факультет Информационных Систем и Технологий

реклама
1
ТЕМА 1
Понятие информации. Общая характеристика процессов сбора,
передачи, обработки и накопления информации.
Основные задачи информатики.
Информатика (computer science) – сводное название областей науки и техники,
связанных с использованием ВТ и современных средств коммуникации.
Предмет курса – использование ВТ для решения профессиональных и учебных
задач.
Компоненты и задачи информатики:
Компьютеры, средства связи
Данные (информация)
Как представить и сохранить?
Как работать?
Алгоритмы, программы
Как составить и выполнить?
Сигналы, данные, информация, информационный процесс.
Информация (сведения) – базовое неопределяемое понятие (наряду с материей
и энергией), соответствует наличию порядка, организации в какой–то области, и
отсутствию неопределенности. Противоположное понятие – энтропия (беспорядок)
Увеличение информации
Полный хаос
(неопределенность)
Строгий порядок
Рост энтропии
Данные – запись информации в определенном виде, на определенном носителе
(информация = содержание данных).
Сигнал (сообщение) – передача данных (данные=зарегистрированный сигнал).
Если ситуацию можно полностью выяснить, задав N вопросов, требующих ответа «да» или «нет», описание ситуации содержит информацию объемом N бит
(binary digit). Если в ситуации возможно N равновероятных вариантов, ее информативность в битах log2N. Если в ситуации возможно N вариантов с вероятностями p1,…,pN, ее информативность в битах –(p1log2 p1+…+ pNlog2 pN). Объем
информации может быть и целым и нецелым действительным числом.
Знание – информация, как описание объектов, их свойств и связей. Включает
компоненты – декларативный (само описание) и процедурный (правила действия, операции).
Семантическая емкость информации (знаний) – ее смысл, содержание общие
для различных форм представляющих информацию данных (форм записи).
Адекватность или достоверность знаний (информации) – степень их соответствия реальности*.
Иногда эти понятия различают и понимают более узко, включая в адекватность степень соответствия ситуации и намерениям источника, а в достоверность степень подтвержденности, гарантированности данных.
*
2
Свойства информации включают также полноту (достаточность для данных целей), доступность (возможность получения и использования), актуальность (соответствие текущим задачам и ситуации), объективность–субъективность (степень искажений, внесенных участниками и элементами информационного процесса)
Основные операции с данными.
Информация функционирует в информационном процессе, включающем источник (человек, документ, СМИ и т.д), передатчик, информационный канал (способ передачи), приемник и получателя. Информационные процессы могут связывать между собой людей, живые организмы и их элементы, компьютеры и
другие технические устройства. Функции (цели использования) информации в
обществе могут быть познавательными, коммуникативными, управленческими.
Основные операциии с данными включают: генерацию (производство), преобразование (фильтрация, группировка, перенос на другой носитель, перекодировка,
формализация), транспортировку (передачу, распространение, прием), хранение
(организацию, накопление, архивацию), поиск, обработку и использование (проверка, анализ, вывод следствий, выбор, принятие решений)
Основные этапы развития информатики и ВТ.
Информационные технологии объединяют методы и средства реализации информационных процессов. Их развитие включает этапы: дописьменный, письменности, книгопечатания (механический), электромеханический (телеграф, телефон, пищущая машинка и т.д.), электронный (компьютеры и информационно–
вычислительные сети).
Развитие ВТ – смена поколений компьютеров:
Поколение
Элементная база
Характеристики
Первое (середина
Электронные лампы Большие габариты и энергопотребление,
40-х – конец 50-х)
низкие быстродействие и надежность,
программирование в кодах.
Второе (конец 50-х Полупроводниковые Лучше по всем параметрам, программи– середина 60-х)
элементы
рование на алгоритмических языках
Третье (середина
Интегральные схеКачественное улучшение всех парамет60-х – конец 70-х)
мы, многослойный
ров, удаленный доступ
печатный монтаж
Четвертое (конец
Микропроцессоры,
Массовое использование ПК, локальные
70-х – по настоябольшие интеграль- и глобальные сети, внедрение электронщее время)
ные схемы
ного документооборота
Перспектива
Микропроцессорная революция в технических и биологических
системах, распределенная обработка данных, интеграция социальной памяти на базе компьютерных сетей, медиатехнологий и
систем связи, безбумажная информатика, использование систем
искусственного интеллекта, нанотехнологии.
Единицы представления, измерения и хранения данных.
В памяти компьютера данные хранятся в виде дискретных единиц (знаков), закодированных цифрами. Минимальная единица хранения – 1 бит(binary digit),
элемент памяти (регистр, ячейка), который может переключаться между 2-мя
состояниями, обозначаемыми 0 и 1 (может быть реализован на различных физи-
3
ческих принципах – гидравлическом, механическом, электрическом, электронном и т.д.).
Любая информация в памяти занимает целое число бит.
В 1 бите может храниться признак принимающий 1 из 2-х значений («ж», «м»).
для признака с 3-мя значениями («ребенок», «средний возраст», «пожилой») – 2
бита. Всего 2 бита, позволяют хранить признак с 4-мя значениями («ребенок»,
«подросток», «средний возраст», «пожилой»), N бит с 2N. Для хранения кода
символа текста (66 знаков кириллицы, 52 латиницы, 10 цифр, ≈20 дополнительных) требуется 8 бит=1 байт.
Единицы памяти: байт(б)=8бит,полуслово=2б(16бит),слово=4б(32бита),двойное
слово=8б(64бита), Кбайт=1024(210)б, Мбайт=1024Кб(220б), Гигобайт=1024Мб
(230б), Терабайт=1024ГБ(240б).
Кодирование текстовых (символьных) данных.
Отличия – место под 1 знак, таблица кодов.
1б (8 бит на знак), 256 возможных знаков:
КОИ–8 (код обмена информацией), ASCII (American Standard Code for Information Interchange), введенный ANSI (American National Standards Institute).
Недостаток – только один национальный алфавит. Для латинских букв 1 общая
таблица кодировки, для русских букв 5 таблиц кодировки: CP866 (для MS DOS),
CP1251 (для MS Windows), ISO 8859–5 (автор – International Standards Organization), Mac (для Mac OS компьютеров Apple).
2б (16 бит на знак), 65 536 возможных знаков:
UNICODE (код обмена информацией), ASCII (American Standard Code for Information Interchange), используется в MS Windows, MS Office с 1997. Основные
национальные алфавиты плюс математические, химические, музыкальные и т.п.
символы в единой кодировке.
При кодировке 1б на знак обычный текст (файл .txt) из 100 знаков занимает
100б или 800 бит (текст .doc содержит еще сведения лб оформлении). Средняя
текстовая страница из 50 строк по 50 символов занимает около 2,5 Кб (1Мб вмещает около 400, а 1Гб – около 400 000 страниц).
Кодирование графической информации.
Используется для построения изображений на кране и при печати.
3 способа кодирования: растровая, векторная, фрактальная графика.
Растровая графика: изображение из точек – пикселей (picture element), для каждой из которых нужно задать цвет и яркость.
При индексном кодировании в каждой точке один из 256 цветов, хранится индекс (номер) цвета – 1б на точку.
Качественное черно–белое изображение с полутонами («серое») – 256 уровней
(градаций) яркости в точке 1б на точку.
Полноцветное изображение (режим реального цвета, True Color) – в точке сумма 3 цветов RGB (Red–Green–Blue) для каждого 256 градаций яркости – 3б на
точку (иногда использют 4 цвета – 4б на точку).
Режим высококачественного цвета ( High Color) – 2б на точку.
Глубина цвета – число бит на каждую точку. При уменьшении числа цветов в
палитре от 22k до 2k глубину цвета и объем файла можно уменьшить в 2 раза.
4
Векторная графика: изображение не из точек, а из объектов – линий (отрезки,
дуги и т.п.) и ограниченных ими фигур. Линии и фигуры задаются уравнениями
и свойствами (цвет и начертание линии, цвет и способ заполнения фигуры). Занимает меньший объем памяти, который зависит от числа и сложности объектов. Построение по данным требует специальных расчетов.
Фрактальная графика – изображение не из линий, а целиком строится по специальным формулам. Позволяет получать наиболее сложное и реалистичное изображение. Используется в играх и других мультимедийных системах.
Кодирование звуковой информации
Используется частотная модуляция звука – разложение звуковой волны на синусоиды, описывающие базовые колебания (гармоники) или таблично–волновой
синтез звука из заранее заготовленных образцов (сэмплов).
Системы счисления.
При записи числа в позиционной системе счисления с основанием N используется N цифр, а каждая позиция в числе обознает N в соответствующей степени.
10-ая система –>0,1,…,9 5202 –> 5
2
0
2 = 5000+200+0+1
3
2
1
10 10
10
100
2-ая система. –> 0,1
11022 –> 1
1
0
2 = 8+4+0+2 = 1410
3
2
1
2
2
2
20
8-ая система. –> 0,1,…,7 5028 –> 5
0
2
= 5*64+0+2 = 32210
2
1
0
8
8
8
16-ная система. –>0,1,…,9,A,B,C,D,E,F E116 –> 14
1 = 14*16+2 =22610
161 160
Представление чисел в компьютере.
Основная система счисления – двоичная.
Числа в двоичной системе или в двоично–десятичном виде (10-ные цифры записываются их двоичным кодом).
Числа в естественной форме (с фиксированной точкой): -30.57, 0.0245. Используется для записи целых чисел в языках программирования. Недостаток – ограниченный дипазон, много «лишних» знаков в числах 20000000000, 0.00004.
Числа в нормализованной (экспоненциальной) форме (с плавающей точкой): –
0.3057*10+02,
0.245*10–01.
Мантисса
Порядок
В 10-й системе A=M*10p, 0.1<=M<1
В позиционной системе с основанием Q A=M*Qp, 1/Q<=M<1
Под число может быть отведен: 1б, полуслово, слово, двойное слово.
Если отведено слово (4б=32бита)
0
1
Знак
числа
7
2
Знак
порядка
|p|
8
31
|M|
Скачать