2.Информация. Формы адекватности информации: синтаксическая, семантическая, прагматическая. Любые сообщения о чем-либо; Сведения, являющиеся объектом хранения, переработки и передачи (например генетическая информация); В математике (кибернетике) количественная мера устранения неопределенности (энтропия), мера организации системы; В теории информации - раздел кибернетики, изучающий количественные закономерности, которые связаны со сбором, передачей, преобразованием и вычислением информации Информация - любые, неизвестные ранее сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций, для которых существует содержательная интерпретация. Адекватность информации может выражаться в трех формах: Синтаксическая адекватность. Она отображает формально-структурные характеристики информации и не затрагивает ее смыслового содержания. Эта форма способствует восприятию внешних структурных характеристик, т.е. синтаксической стороны информации. Семантическая (смысловая) адекватность. Эта форма определяет степень соответствия образа объекта и самого объекта. Семантический аспект предполагает учет смыслового содержания информации. Прагматическая (потребительская) адекватность. Она отражает отношение информации и ее потребителя, соответствие информации цели управления, которая на ее основе реализуется. Эта форма адекватности непосредственно связана с практическим использованием информации, с соответствием ее целевой функции деятельности системы. 3.Показатели качества информации: репрезент. содерж.достат, доступность, актуальность, своевременность, точность, достоверность, устойчивость. Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют: правильность концепции, обоснованность отбора существенных признаков и связей отображаемого явления. Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных. Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений. Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи. Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. .известны четыре классификационных понятия точности: формальная точность, реальная точность, максимальная точность, необходимая точность Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. 4.Системы классификации информации: иерархическая, фасетная, дескрипторная. Классификация – это процесс соотнесения тех или иных объектов по классам в соответствии с определенными признаками Иерархическая. Исходное множество элементов нулевого уровня делится в зависимости от выбранного признака информации на классы. Последовательно детализируются качественные свойства объектов множеств: класс, подкласс, группа, подгруппа, вид и т.д. Ступень классификации ─ этап классификации, результатом которого является совокупность классификационных группировок. Основные достоинства: традиционность и естественность; информационная емкость. Недостатки:Невозможность внесения изменений в классификатор (добавление или удаление классификационных признаков, изменение последовательности их применения) после его создания. Фасетная. Признаки классификации (фасеты) выбираются независимо друг от друга, а каждый фасет содержит совокупность однородных значений данного классификационного признака. К преимуществам: практически не ограниченное добавление числа фасетов, расширения состава значения в отдельных фасетах, группировки множества по любому сочетанию и числу фасетов. Дескрипторная. В данной схеме выбираются ключевые слова (дескрипторы), описывающие определенную предметную область, на основании которых создается классификатор информации, эффективно используемый при поиске. Дескрипторная классификация предполагает использования специального дескрипторного языка. Для кодирования показателей и документов по набору содержательных признаков используется информационный язык дескрипторного типа, который характеризуется совокупностью терминов, дескрипторов или лексикой и набором отношений между терминами. 6.Данные и знания. Экстенсионал и интенсионал понятия. Знания - совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача. Структурированность. Знания должны быть "разложены по полочкам". Удобство доступа и усвоения. Для человека - это способность быстро понять и запомнить или, наоборот, вспомнить; для компьютерных знаний средства доступа к знаниям. Непротиворечивость. Знания не должны противоречить друг другу. Процедуры обработки. Знания нужны для того, чтобы их использовать. Одно из главных свойств знаний - возможность их передачи другим и способность делать выводы на их основе. Понятие – один из способов представления знаний. Существует 2 способа определения понятия: Интенсионал – определение понятия через понятие более высокого уровня абстракции с указанием специфических свойств. Экстенсионал – определение понятия через перечисление понятий более низкого уровня иерархии или фактов, относящихся к определяемому. Т.е определение через данные. В широком понимании данные представляют собой факты, текст, графики, картинки, звуки, аналоговые или цифровые видео-сегменты. Иными словами, данные - это необработанный материал, предоставляемый поставщиками данных Объект описывается как набор атрибутов. Атрибут - свойство, характеризующее объект. Например: цвет глаз человека, температура воды и т.д. Измерение - процесс присвоения чисел характеристикам изучаемых объектов согласно определенному правилу. Шкала - правило, в соответствии с которым объектам присваиваются числа. Переменные могут являться числовыми данными либо символьными. Числовые данные -дискретными и непрерывными. Дискретные данные являются значениями признака, общее число которых конечно либо бесконечно Непрерывные данные - данные, значения которых могут принимать какое угодно значение в некотором интервале. 8.Коды постоянной и переменной длины. Префиксные коды. Пусть объектом кодирования являются тексты, записанные на некотором (естественном или искусственном) языке, причем число букв в алфавите этого языка, включая (если есть такая необходимость) некоторые знаки препинания, знак пробела и т.п., равно п. Пусть далее, l - наименьшее натуральное число, удовлетворяющее условию l≥ log2 n . Тогда можно пользоваться простейшим из различных методов побуквенного кодирования, сводящимся к установлению взаимно однозначного соответствия между различными буквами исходного текста и различными кодовыми наборами двоичных символов фиксированной длины, равной l. Например, если речь идет о текстах, записанных на русском языке, где число букв алфавита, включая знак пробела, n = 34, то, поскольку имеет место неравенство 5 < log234 < 6, можно осуществить побуквенное кодирование. В связи с переходом к переменной длине кодовых наборов возникает проблема установления границ между ними при декодировании. наиболее простыми и в то же время наиболее популярными являются так называемые префиксные коды, обладающие тем свойством, что кодовый набор никакой буквы не является началом (префиксом) кодового набора другой буквы. Префиксный код называется полным, если добавление к нему любого нового кодового набора нарушает свойство префиксности. Пусть, например, буквам А, В и С поставлены в соответствии кодовые наборы 00, 01 и 1. любая попытка закодировать еще хоть одну букву привела бы к нарушению свойства префиксности. Значит, код 00, 01, 1 является полным. Если же буквам А. В и С были поставлены в соответствие кодовые наборы 00, 01 и 10, то через ветвь 11... мы смогли бы, не нарушая свойство префиксности, закодировать сколько угодно новых букв. Значит, коды 00, 01, 10 являются неполными. 7.Сообщения, коды, шифры, знаки, символы. Сигнал называется дискретным, если параметр сигнала может принимать лишь конечное число значений, и существен лишь в конечном числе моментов времени (возможно, периодически повторяющихся). Языковые сообщения в письменной форме строят обычно, записывая знаки письма (графемы) друг за другом. Это оказывается справедливым и для устных языковых сообщений, если разложить устный текст на элементарные составные части, так называемые фонемы Знак - это элемент некоторого конечного множества отличимых друг от друга „вещей", набора знаков. Набор знаков, в котором определён (линейный) порядок знаков, называется алфавитом. Дискретные сообщения представляют собой (конечные или бесконечные) последовательности знаков. исходя из соображений, связанных с физиологией органов чувств, или из чисто технических соображений, их обычно разбивают на конечные последовательности знаков, называемые словами. Слова над двоичным набором знаков называются двоичными словами. Они не обязаны иметь постоянную длину (см. азбуку Морзе), если это всё же так, то говорят об n-разрядных двоичных знаках и nразрядных двоичных кодах. Дадим теперь точное определение: Кодом называется правило, описывающее отображение одного набора знаков в другой набор знаков (или слов); также называют и множество образов при этом отображении. Если каждый образ при кодировании является отдельным знаком, то такое отображение мы называем шифровкой, а образы шифрами (англ. cipher). Поскольку здесь имеется криптографический аспект, обращение этого отображения — когда оно однозначно — называется декодированием или дешифровкой. 5.Понятие о кодировании. Характеристики кодирования. Классификационное и регистрационное кодирование. Комбинирование символов используемого алфавита для построения элементов сообщения по определенным правилам называется кодированием. Различают обратимое и необратимое кодирование. Обратимое кодирование это кодирование, для которого существует способ кодирования обратного, приводящего перекодированную информацию к точному исходному виду.. Избыточным называется обратимое кодирование, если обратное перекодирование возможно по части кодированной информации. Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему. Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочивания объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов не велико Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. ввв