Информация и ее ценность

advertisement
ИНФОРМАЦИЯ И ЕЁ ЦЕННОСТЬ
«Очень редко удается открыть одновременно несколько тайн природы одним и тем же ключом.
Здание нашего несколько искусственно созданного благополучия слишком легко может рухнуть, как
только в один прекрасный день окажется, что при помощи нескольких магических слов,
таких как информация, энтропия, избыточность... нельзя решить всех нерешенных проблем»
Шеннон.
Начиная разговор о ценности, достоверности информации, нужно определиться с
понятием «информация». Сейчас существует много определений понятия «информация»,
и ни одно из них не является общепринятым.
Многие ученые придерживаются мнения, что «информация есть информация и
ничто другое, и этого достаточно».
В книге И.В. Мелик-Гайказян («Информационные процессы и реальность». М.:НаукаФизматлит, 1997) собрана коллекция определений слова «информация».
В гуманитарных науках популярны определения типа «информация есть сведения…»(или
сообщения, знания и т.п.)

«информация есть знания, переданные кем-то другим или приобретенные путем
собственного исследования или изучения»

«информация — это сведения, содержащиеся в данном сообщении и рассматриваемые
как объект передачи, хранения и обработки».
Эти определения по существу являются тавтологией. В ряде случаев информация связывается с
упорядоченностью, на пример:

«информация означает порядок, коммуникация есть создание порядка из беспорядка или
по крайней мере увеличение степени той упорядоченности, которая существовала до
получения сообщения»
Среди философов популярны дефиниции, содержащие термин «отражение»:

«информация есть отражение в сознании людей объективных при чинно-следственных
связей в окружающем нас реальном мире»

«информация — это содержание процессов отражения».
В философском энциклопедическом словаре (1983 г.) приведено «Информация (от лат.
inforraatio — ознакомление, разъяснение, представление, понятие) 1) сообщение, осведомление о
положении дел, сведения о чем-либо, передаваемые людьми; 2) уменьшаемая, снимаемая
неопределенность в результате получения сообщений; 3) сообщение, неразрывно связанное с
управлением, сигналы в единстве синтаксич., семантич и прагматич. характеристик; 4)
передача, отражение разнообразия в любых объектах и процессах (неживой и живой природы)» ].
В «Философской энциклопедии» (1970 г.) во втором томе читаем «Информация (от
латинского informatio — осведомление) .
А в пятом томе в статье «Теория информации» вместо дефиниций приводятся различные
представления о количественной оценке информации. Дефиниции того, что собственно значит
термин «информация» просто не дается.
Аналогичная ситуация с перекрестными ссылками в энциклопедии описана польским
сатириком Станиславом Лемом по поводу определения понятия «сепульки».
Особое место в коллекции определений занимают утверждения о том, что информация — это
алгоритм или инструкция. Так приводятся определения:
• «информация есть некий алгоритм» и далее «совокупность приемов правил или сведений,
необходимых для построения оператора, будем называть информацией».
Большое число похожих и не похожих друг на друга определение понятия «информация»
означает, что общепринятого определения еще нет. Более того, нет даже четкого понимания сути
этого явления, хотя потребность в нем уже назрела.
Сейчас область применимости информационного подхода сушено расширилась. Понятие
«информация» используется при исследовании практически всех процессов самоорганизации
(в частности биологической эволюции). При этом актуальным становится вопрос о
возникновении информации и эволюции ее ценности. Здесь без определения понятий уже не
обойтись.
Выбор определения зависит от аппарата и цели исследования, иными ми, определение должно
быть конструктивным, т. е. пригодным для использования в рамках аппарата.
Этим условиям в наибольшей степени удовлетворяет определение информации, предложенное
Генри Кастлером:

информация есть случайный и запомненный выбор одного варианта из нескольких
возможных и равноправных.
Здесь слово «случайный» выделено, поскольку оно относится к процессу (способу) выбора и
потому сужает область применимости определения. Вообще говоря, выбор может быть и не
случайным (подсказанным), в этом случае говорят о.рецепции информации. Случайный выбор
соответствует генерации (т.е. спонтанному возникновению) информации.
Слово «запомненный» тоже выделено, поскольку играет очень важную роль. Оно относится к
фиксации информации. Выбор может и не запоминаться (т. е. тут же забываться). Такой выбор
называтется микроинформацией. Запомненный выбор называется макроинформацией. Во всех
информационных процессах используется макроинформая.
Поэтому далее под информацией предлагаю понимать только запомненную информацию и
приставку «макро» опустим.
С учетом сказанного, предлагаю принять определение информации в виде:
шформация есть запомненный выбор одного варианта из нескольких возможных и равноправных
(Q). По духу и смыслу оно принадлежит Г. Кастлеру (откуда и обозначение: Q — Quastler)
Определение (Q) отличается от предыдущих следующим: Во-первых, оно четко, понятно и
широко используется в естественных науках. Конструктивность его проверена на многих
примеpax. Это определение не противоречит предыдущим, когда речь идет о реальных
задачах. Так, определение информации как инструкции или оператора в конкретных, случаях
сводится к указанию, какой именно выбор следует сделать в том или ином случае.
Во-вторых, согласно этому определению, информация предстает как нечто конкретное и
«приземленное», ощущение чего-то «сверхъестественного» и романтического в нем отсутствует,
исчезает ореол «божественного». Можно считать это недостатком определения, поскольку
именно это ощущение привлекает многих людей и вдохновляет их на подвиги (научные, не
научные и лже-научные).
Это определение позволяет понять такие тонкие явления, как возникновение жизни и
механизмы мышления с естественно-научной точки зрения. Иными словами — построить
мост между естественными и гуманитарными науками.
В-третьих, определение (Q) допускает введение меры — количества информации.
Подчеркнем еще одну особенность определения (Q).
Слово «выбор» — отглагольное существительное. Его можно понимать в двух смыслах: как
процесс и как результат процесса. Разница примерно такая же, как между
судопроизводством и приговором суда. В определении Кастлера выбор понимается, как
результат процесса, но не как сам процесс. Именно в этом смысле (т. е. как «приговор») оно
Конструктивно. Слово «процесс» в естественных науках прочно занято, оно означает
изменение системы во времени (т. е. ее «движение»), которое в общем случае еще не
известно, чем кончится и кончится ли вообще. Согласно определению (Q) при этом
информация еще отсутствует. Однако информация как результат выбора немыслима без
процесса выбора, как приговор немыслим без суда. Отнюдь не любой процесс заканчивается
выбором. Последнее возможно лишь в процессах определенного класса, поэтому появление
понятия «информационный процесс» целесообразно. В реальных задачах, как правило,
фигурирует не просто информация, а ценная или осмысленная. Часто это упускают
из внимания, полагая, что не ценная информация - вообще не информация. Последнее ведет к
недоразумениям.
Ранее эпитеты «ценная», «осмысленная» употреблялись без определения, в расчете на
интуицию. В действительности, эти понятия являются центральными в современной
информатике. Уместно сделать ряд замечаний.
I. Ценность информации зависит от цели, которую преследует рецептор.
Известны несколько способов количественного определения ценности. Все они
основаны на представлении о цели, достижению которой способствует полученная
информация. Чем в большей мере информация помогает достижению цели, тем более
ценной она считается.
1. Если цель наверняка достижима и притом несколькими путями, то возможно
определение ценности (V) по уменьшению материальных или временных затрат,
благодаря использованию информации. Так, например, сочетание хороших предметного и
алфавитного каталогов библиотеки, наличие библиографических справочников сокращают
время на составление списка литературы по конкретному интересующему нас
вопросу.
Этот метод определения ценности предложен Стратононичем .
2. Если достижение цели не обязательно, но вероятно, то использутся один из
следующих критериев:
а) мерой ценности, предложенной М. М. Бонгардом и А. А. Харкевичем, является:
где р — вероятность достижения цели до получения информации, а Р — после.
Априорная вероятность р зависит от информационной тары или, что то же, полного
количества информации I в (1.2): р = 2_1
Так, если до получения информации все варианты равновероятны, то р = 1/n(где п —
число вариантов, а I = log2 n).
Апостериорная вероятность Р может быть как больше, так и меньше р. В последнем
случае ценность отрицательна и такая информация называется дезинформацией.
Примером последней может служить указатель на разветвлении дорог, который по каким
то причинам повернут в другую сторону. Таким образом, вероятность Р находится в
пределах О < Р < 1, и, соответственно, -оо < V < Vmax
б) мерой ценности, предложенной В. И. Корогодиным , является величина
Она обладает теми же свойствами, что ценность в формуле М. М. Бонгарда и А. А. Харкевича(1),
но изменяется от 0 до 1.
Мы далее будем использовать ценность, определенную В. И. Корогодиным(2) , поскольку это
удобнее и более популярно.
Согласно (1) ценность информации зависит от величины р – вероятности достижения цели до
получения информации, т. е. от того, какой предварительной (априорной) информацией уже располагает
рецептор. Предварительная осведомленность, называется тезаурусом. Если таковая отсутствует, то
априорная вероятность во всех вариантах одинакова и равна р — 1/п (где п — число вариантов). В
этом случае величина р играет роль нормировочного множителя. Если при этом после получения
информации цель достигается наверняка (Р = 1), то ценность этой информации максимальна и равна V
s= Vmax = log2 п., т.е. совпадает с максимальным количеством информации в данном множестве (в данной
таре). Это совпадение не случайно, именно для этого была выбрана форма (1), при этом ценность
информации можно понимать как количество ценной информации.
Количество информации, имеющей нулевую ценность, как правило, не мало по сравнению с
количеством информации, имеющей хоть какую-то ценность (положительную или отрицательную).
Например, пусть цель — узнать прогноз погоды, а по радио передают, кто выиграл в футбол, кто в
теннис и т.д. Для Вас все это имеет нулевую ценность, хотя для другого, возможно, ценна наоборот
именно эта информация.
Отсюда следует, что ценность информации субъективна.
Существует информация которая, на первый взгляд, ни для кого и никогда не может стать
ценной. Пример: в тексте наборщик переставил буквы так, что текст потерял всякий смысл. Количество
информации сохранилось, но ценность его для, кого бы то ни было, стала равна нулю.
Так появляется понятие «осмысленность». В отличие от «ценности» это понятие претендует на
объективность, что основано на следующем положении: в информационной таре, куда вмещена данная
информация, можно выделить определенное количество информации, которая никогда ни для кого ни
для какой цели не понадобится. Тогда эту информацию называют лишенной смысла;
Объективность критерия основана на утверждениях: «ни для кого, никогда, ни для какой цели».
Определение сильное, абсолютное и, как таковое, конечно, не применимое к реальности. Так, в
приведенном примере можно сказать, что абракадабра, которую сотворил наборщик содержит
ценную информацию для психиатра, цель которого — поставить наборщику диагноз. Поэтому
утверждение «ни для «его» следует принимать: ни для кого среди людей, которых интересует
смысл текста и ничего более. Однако и в этом случае осмысленность текста зависит от тезауруса.
Так, например, наборщик набрал слова «трах-тибидох-тах-тах». На первый взгляд, это
бессмыслица, однако люди сведущие знают, что смысл в этих словах есть, поскольку именно с
их помощью старик Хоттабыч творил чудеса.
Я остановилась на этом вопросе подробно по следующим причинам.
Во-первых, в традиционной информатике, основанной на математической теории связи,
не существуют и не обсуждаются вопросы о возникновении ценной информации и ее
эволюции. Ценность информации рассматривается в предположении о том, что цель задана
извне. Вопрос о спонтанном возникновении цели внутри самой системы там не ставится.
Сейчас в связи с развитием междисциплинарных подходов эти вопросы стали
актуальными, особенно в проблеме биологической эволюции. Именно они являются предметом
динамической теории информации.
При этом, ценность информации эволюционирует: неценная информация становится
ценной, бессмысленная — осмысленной и наоборот.
Во-вторых, люди невольно отождествляют просто информацию с ценной и (или)
осмысленной информацией, что приводит к недоразумениям. Эта тенденция проявляется и при
определении понятия «информация».
Действительно, если отождествить понятия «информация» и «ценная информация», то дать
объективное и конструктивное определение для них в принципе невозможно. Напротив, разделив
эти понятия, можно дать конструктивное определение каждому из них, оговорив меру
условности и субъективности.
Download