КОНЦЕПЦИЯ ПОСТРОЕНИЯ НА БАЗЕ НЕЙРОСЕМАНТИЧЕСКОГО ПОДХОДА (ПРИГЛАШЕНИЕ К СОТРУДНИЧЕСТВУ) Бодякин В.И. Институт проблем управления РАН им. В.А. Трапезникова, Москва E-mail: [email protected] , http://www.informograd.narod.ru , служ.тел.:334-92-39 План обсуждения Постановка задачи. Проблемы 2030 года Нейросемантика - Предметная область Информационный канал Информационная система - Форма представления информации - Автосруктуризация - Нейросемантические структуры (НСС) - Сигнал – Информация – Знание - Адаптивные регуляторы на базе НСС - Текстовая энтропия Решение. Проекты: - Искусственный разум - Информоград - Восхождение разума 2 Постановка задачи Проблемы 2030 года • • • • • • Тенденции уменьшения ресурсоемкости информационной техники и прогноз Глобальные эволюционные этапы лидирующей формы высокоорганизованной материи Модель "текстовая жизнь" Естественная эволюция, - это ряд аттракторов Темпы и масштабы эволюции Эволюция технической цивилизации 3 Тенденции уменьшения ресурсоемкости (f(гp*см3*сек*чел)) информационной техники (на 10 000 оп./с) Ресурс f(m*v*t) 1020 MARK-1 ЭНИАК М-4 1018 (гр.* см3* 1016 сек* чел. 1014 ~ (рубли)) 12 10 10 В пересчете на 10 000 оп./с М-220 ЕС-ЭВМ, ЕС-1060 10 РС-286 108 РС Р-4 106 104 102 1 -2 Техноло- 10 гический 10-4 предел -6 10 Эволюционные этапы вычислительной техники 19401950г. 1960 1970 1980 1990 2000г. 2010 2020 2030г. 4 Глобальные эволюционные этапы лидирующей формы высокоорганизованной материи Рождение Вселенной 10 10 Этап физической эволюции материи Возникновение жизни на Земле 9 10 Первые позвоночные Этап биоэволюции 8 10 107 6 10 Первые человекообразные Длительность этапов в годах 10 : 1 Первые люди Огненные прототехнологии 5 10 Этап социальноиндустриальной эволюции Собирательство, охота 4 10 Земледелие, скотоводство 103 Прогноз Индустриальная фаза 102 1970 г. Информационная фаза 10 Этап духовной эволюции 2027 г. 2030 г. Ноосфера 1 Фазовый переход 0.1 1 2 3 4 5 6 7 8 9 10 11 12 Эволюционные этапы № лидирующей формы высокоорганизованной материи 5 Зарождение и механизмы направленности эволюции простейших информационных систем (ИС). ("текстовая жизнь"). bcc z cccc z ааааа ааааа ааааа a bb z ccb z bcdd z … cddb z cccc z cccdd z bddeed z bcdee z … cccdd z cdddddd z … zzz…z … … … zzzzzzzzzzzzzzzz…z А = {a,b,c,d,…,w,x,y - аналоги химических элементов и z - как аналог пространства}. ( a>b>c>d>… >w>x>y>z ≈ 0 ) ДНК человека, число вариантов = А L ; A=4, L= 10 9 P= 4 -1000 000 000 "Быть иль не быть, вот в чем вопрос?" A=256, L= 36, P=10-80 случайн. A=256, L=4 («слоги»=103 ) 2564 =1010 (-7) «слоги»4 = «слова»=105; 103*4=1012 (-7) -46 !!! «слова»4 = «лексемы»=107; 105*4=1020 (-13) случайн. «лексемы»4=«фразы» =109; 107*4=1028 (-19) !!!!!!!!! P=10-34 иерарх.6 Энерго-сырьевой потенциал эволюции простейших информационных систем (ИС). ("первые аттракторы"). П а м я т ь В AL в 2 L Управление и обработка о д Самокопирование ИС . . . L . . c b a b b 3 c a b c . .. . ca cb cc ba bb bc aa ab ac a b c 1 ... ИС В ы в о д Воздейст вие Энергия Вещество 1-й аттрактор ИС – «Рецепторный» L=1 A; L=2 A2 ; L=3 A3 ; … 7 Процесс естественной эволюции ИС представляет ряд аттракторов с экспоненциальными характеристиками Первый из которых "рецепторный" – линейные затраты (x) на расширение диапазона рецепторов ИС дают приращение эволюционного ресурса как Ax, где А – алфавит рецепторов, х – длины образов. Второй эволюционный аттрактор ИС – "ассоциативный", заключается в переводе линейной формы памяти ИС в иерархически-сетевую. Третий аттрактор ИС – "интеллектуальный". Он позволяет сводить воспринимаемые семантические переменные текстов к константам их грамматических структур [4]. Конечное множество грамматических структур покрывает большую часть информационного потока любой среды. Четвертый эволюционный аттрактор ИС – "знание" когда все типы грамматических конструкций ИС по переработке текста сводятся к 4 конструкциям над грамматическими конструкциями ИС ("Homo-sapiens"). Пятый эволюционный аттрактор ИС – "социальный", законы А.А.Богданова о сверхаддитивности сложения усилий субъектов. Шестой аттрактор – "Восхождение разума", интеграция всех ИС независимо от их начальной природы (биологические, искусственные, …), приводит к бесконечному росту эффективности Разума в "понимании " среды. . 8 Темпы и масштабы эволюции Рождение Вселенной Э Возникновение жизни на земле в о Десятки миллиардов лет л ю Первые позвоночные ц Миллиарды лет и Первые человекообразные я Сотни миллионов лет ф Первые люди Цивилизация о р Десятки миллионов лет м t Миллионы лет Сотни тысяч лет 10 : 1 Эпоха прототехнологий Э в Охота, скотоводство о Сотни тысяч лет л ю Аграрная фаза ц Десятки тысяч лет и я Тысячи лет Индустриальная фаза с Информационная фаза т р Сотни лет у к Десятки лет Ноосфера т у Фазовый переход р Годы t Месяцы информационнный этап 1: 1000 Энерго-вещественный этап Солнечная система, Вселенная тысячи километров милиметры простейшие метры высшее растения километры высшее животные Разум, человек Н а п р а в л е н н о с т ь Р о с т Сверхразум, Ноосфера с ф е р ы э в о л ю ц и и в л и я н и я 9 Эволюция технической цивилизации Материальная ресурсоемкость R=f(m,v,t) (продукта, изделия, услуги) Знание, Интеллектуально информационный ресурс t Первый палеокризис 1967 США-СССР 0 2000 2030 годы Экстенсивный Интенсивный Неустойчивость, Этапы развития фазовый переход И Р М И Информоград Одноклеточный социум Н о о с ф е р а – форма существования социального организма (Информоград - первый этап) 10 Нейросемантика - Предметная область – Информационный канал – Информационная система - Форма представления информации - Автосруктуризация - Нейросемантические структуры (НСС) - Сигнал – Информация – Знание - Адаптивные регуляторы на базе НСС - Текстовая энтропия 11 Комплекс: "Предметная область (ПО) Информационный канал (ИК) Информационная система (ИС)" ПО F ИС ak aj ИК … dhdgdgsg ... shlhllb.. + - ai t L m t "Генетич . программа" 0 12 Предметная область (ПО) Любую физическую ПО можно рассматривать как некоторую дискретную пространственно-временную область с взаимодействующими объектами-процессами (ai, aj,). При попадании нескольких объектов, в одну и ту же ячейку (область взаимодействия), происходит процесс их взаимодействия. ПО F aj ak ai m Энергетика физического процесса это некоторый инвариант, характеризующий потенциальную глубину причинно-следственного распространения данного физического процесса Предположим, что скорости распространения разнообразных физических процессов различны. Мы будем рассматривать только такие ПО, в которых существуют малоэнергетические сопутствующие процессы с большими скоростями распространения, относительно основного физического процесса. 14 Процесс взаимодействия объектов осуществляется в течение нескольких тактов времени t2-t1. Результат взаимодействия объектов выражается в изменении величины одного или нескольких параметров W, характеризующих их взаимодействие. Любой W(t) может быть преобразован в текстовую форму. W A Wn Z t t1 ... * * * * tn b a t2 а) * б) * * в) ln <kzkkzkb> текстовая форма г) многомерный физический процесс <-> текстовая форма 15 Будем предполагать, что в любой ПО выполняются: - принцип причинности (инвариантность процессов во времени и в пространстве), т.е. если si sj, то процесс si всегда вызывает sj; - принцип локальной однородности (сведение континуума значений параметра к ограниченному числу качественно-различных образов, т.е. (<zzjbaabj>= si) ~ (<zzjbab>= si); Например, вся температурная шкала разбивается на четыре образа: si= «твердое», sj= «жидкое», sk= «газ», sl= «плазма». - принцип субъектности, т.е. каждый процесс ПО (si) имеет оценку полезности для ИС. 16 При взаимодействии объектов (например, {ai*aj}), в соответствии с F(ПО), порождается ЭСЕ - элементарная семантическая единица (s{ai*aj} = <cade…b>), которая однозначно порождается процессом взаимодействия этих объектов. Все множество взаимодействий в данной ПО, представляет собой семантическое пространство, как совокупность ЭСЕ. В качестве примеров ЭСЕ различных ПО можно привести: взаимодействие элементарных частиц – <ababcw>; <Привет Петров, как дела? Нормально!> – взаимодействие объектов макроуровневых ПО; образование двойной звезды из двух астрообъектов – <zzjbaabj> (на гигауровне). "d" ... "тройки" a1 a2 … "пары" cade…b aj … an a1 a2 … ai … an ЭСЕ, порождаемые в ПО, суперпозиционно "сливаются" в непрерывный информационный поток. W 17 Информационный канал (ИК). В ИК происходит процесс формирования информационного ресурса и его транспортировка к ИС. Частота взаимодействия объектов в ПО определяет плотность информационного потока в ИК. ИК информационная компонента (сигнал) ПО . . . dab d lklj deas tn kjy uuus физическая компонента процесса а) ИС . . . abcd dab d ded deas lklj kjy uuus t ИР ПО . . . bcdabcddabdzxcwzxdljjkehdlkjhhbhdlkjjjh tn б) ПО в) ИС abcd abcd zx Е abcd dab cw . . .bcdsdbcddabded sdadffabcdwzwjh ИС tn 18 В рамках рассматриваемого комплекса: ПО -- ИК -- ИС, задача ИС заключается в: 1. Воспринимать текстовую форму 2. Хранить информацию 3. Преобразовывать (качественно) информацию 4. Оценивать информацию 5. Выдавать информацию (текстовую форму) 6. Иметь положительный эволюционный потенциал ПО F ИС ak aj ИК … dhdgdgsg ... shlhllb.. + - ai t m 0 L t "Генетич . программа" 19 АВТОСТРУКТУРИЗАЦИЯ НЕПРЕРЫВНОГО ТЕКСТОВОГО ПОТОКА ПО ИК . . . . bcdddabdzxcwzxdljkehkjhhbhdlkjjh ИС ПОЧЕМУ ВСЕ ОРГАНИЗМЫ "ЕДИНОДУШНЫ" В КЛАСТЕРИЗАЦИИ ОКРУЖАЮЩЕГО НАС МИРА НА ОТДЕЛЬНЫЕ ОБРАЗЫ ? Предметная область ..1010010… 010101010101001001001110110101 010101010101010101010100101010 101010101010101010000010101010 101001010101010101010101001010 …0100101… 100101010101010101010100101010 101010101001010100101010101010 101010010101010100100110101010 101010101010101010101010101010 101010101010100110010101010101 010101010101010101010100101010 101010101010101010010101010101 010100110101010101010101001010 …0100101… Традиционный способ структуризации в системах ИИ Предметная область Пользователь Программист систем ИИ ПО ak aj Информационный 01001 – apll 001111 … канал ai 010101010... 01010101.. t … Программа ИИ 00111001 - . 101010 22 Задача: в непрерывном потоке ТФ необходимо выделить образы, соответствующие процессам любой ПО ПО МАКРИСРИСМАКДУБЛЕН t01 t02 t03 АКР ИСМ КД УБЛ ЕНД … R1 РИС ДУБ МАК ЛЕН ИС Rm Метод: построение в ИС множества различных словарей и выбор минимального (Ri) Результат: Минимальный словарь ИС ПО) (гомоморфен процессам Инструментарий: нейросемантические структуры Демонстрационный пример (четыре равновероятных процесса формируют непрерывный поток ТФ) aj ПО ЛЕН МАК ДУБ ai РИС ИС Текстовой поток ____ СМАКРИСРИСМАКДУБЛЕН ak Закрашенный поток "Генетич. программа" Необходимо построить словарь в N образов, полностью покрывающий ТФ. Примем что: Энергетические затраты на обработку одного образа в ИС равна 1Е-. Время обработки символа и образа один такт Т, Энергетические затраты на хранение одного образа в памяти 1/24 Е-. Энергетика каждого прогнозируемого ИС символа равна 1Е+, Усредненный на 12 тактов энергетический баланс ИС = -N(обработка) -1/2N(хранение) + (12-N)(прогнозирование) = (12 - 5/2N)*E Результаты эксперимента Первая структуризация словаря ИС Форма словаря: (наибольший размер образа один символ): <М><А><К><Р><И><С><Л><Е><Н><Д><У><Б>, R(ИС)=12R*(0,5Е-/R) = 6E-, прогнозирование (Т) = 0Т (т.к. у образа только один символ), затраты энергии на распознавание = 12E контролирование потенциальной энергии ТФ = 0E+. Итог: для односимвольного словаря усредненный энергетический баланс = 18E- . Усредненный энергетический баланс ИС назовем эволюционным потенциалом ИС Эволюционный потенциал ИС численно характеризует жизнеспособность ИС потенциал Эволюционный ЭП = Э * И Информационная компонента И (в битах) Информационноуправляющая система Материальная компонента (энергия – Э, в джоулях) Вторая структуризация словаря ИС (наибольший размер образа два символа): а) Минимальная форма словаря: <МА><К><РИ><С><ЛЕ><Н><ДУ><Б>: R(ИС)=8R =4Е-, прогнозирование = 0,5Т (на образ), затраты энергии на распознавание = 8E-, контролирование потенциальной энергии ТФ = 4E+. Итог а) 4Е- + (0,5Т * 8(образов на ТФ=12) = 4E+) + 8E- = 8E- . б) Максимальная форма (без полного пересечения): <МА><КЛ><КР><КД><КМ> <ЛЕ>…<БД>: R(ИС)= 20R=10Е-, прогнозирование = 0,2Т (на образ), затраты энергии на распознавание = 20E-, контролирование потенциальной энергии ТФ = 4E+. Итог б) 10Е- + (0,2Т * 20(образов на ТФ=12) = 4E+) + 20E- = 26E- . Итоговый лучший эволюционный потенциал = 8E- . 26 Третья структуризация словаря (наибольший размер образа в три символа). а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>: R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ), затраты энергии на распознавание = 4E-, контролирование потенциальной энергии ТФ = 8E+. Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+. б) Максимальная форма (без дублирования, т.е. без полного пересечения): <АКР><ИСР><ИСМ><АКД> <УБЛ><ЕНД> … <АКМ>: R(ИС)= 36R=18Е-, прогнозирование (Т) =+4E , затраты энергии на распознавание = 36E-, контролирование потенциальной энергии ТФ = 0E+. Итог б) = 50E- . Лучший итоговый эволюционный потенциал = 2E+ , 50E- 2E+(!!). 27 Четвертая структуризация словаря (наибольший размер образа в четыре символа) а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>: R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ), затраты энергии на распознавание = 4E-, контролирование потенциальной энергии ТФ = 8E+. Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+. б) Максимальная форма (без дублирования): <АКРИ><ИСРИ><ИСМА> <АКДУ><УБЛЕ><ЕНДУ> … <АКМА>: R(ИС)= 48R=24Е-, прогнозирование (Т) = 0Т (на образ), затраты энергии на распознавание = 48E-, контролирование потенциальной энергии ТФ = 0,5E+. Итог б) = 78E- . Лучший итоговый эволюционный потенциал = 2E+ , 78E- 2E+ 28 Пятая и другие структуризации словаря Лучший итоговый эволюционный потенциал = 2E+ , 204E- 2E+ Шестая структуризация словаря, седьмая … и т.д. 2E+ !!! Худший - E Теоретический анализ результатов эксперимента показывает, что эволюционный потенциал ИС обратно пропорционален размеру словаря, Размеры минимальных и максимальных словарей ИС соотносятся минимум как: o(N) и o(N3) !!! O(n); ??? где: N – максимальное число процессов в ПО Автоструктуризация информации в ИС МАКРИСРИСМАКДУБЛЕН… ПО МАК РИС ЛЕН ДУБ £ t01 t02 t03 N Минимальный словарь ИС -----> ! ! ! Образы ИС = процессам ПО ИС АКР ИСР ИСМ АКД УБЛ ЕНД … АКМ РИС ДУБ МАК ЛЕН min N2(L-1)=32 СN [L/£] L=3 N=4 2+ [L/£] =N max o(N3) >> o(N) !!! max min O(n); ??? 30 Автоструктуризация сложных иерархических процессов ПО …ДА КОЛЯ ЛОВИТ РЫБУ СА… Подл. Сказ. Обст. {…}{…}{…} иерархические процессы Подл. Сказ. Обст. ИС {…}{…}{…} иерархическая структура словарей образов При минимизации словаря на нейросемантических структурах, его топология гомоморфна структуре исходных процессов ПО Теорема: минимальная форма словаря ИС может достигаться только при ее гомоморфности исходной структуре процессов ПО Доказательство: Если представить формирование текстовой формы двумя независимыми и непересекающимися процессами А и Б, то становится очевидным, проц. А проц. Б 010010 УКЛОН ЭРМИТАЖ 101010010 образ А образ Б что минимальным словарем образов закрашивающим эти два процесса могут быть только образы совпадающие по текстовой форме с генерирующих их процессами. На вопрос: "Почему все организмы 'единодушны' в кластеризации окружающего нас мира на отдельные образы ?" Вытекает ответ: "Т.к. минимальный словарь, дает эволюционные преимущества, то все ИС данной ПО выбирают его, а соответственно, и его образы". Из минимизации отображения в ИС гомоморфность структуры образов в НСС структуре процессов ПО НСС ПО F ~ ################## …######## Теорема: максимальное значение компрессии достижимо только при гомоморфном отображении структуры процессов ПО в структуре образов НСС Нейросемантическая форма представления информации НСС Номера слоев Предметная область 6 N-элементы 5 Связи 4 3 2 1 Алгоритм НСС 11011010001101101001- 0 "0" "1" Семантика, тексты ПО, содержание процессов 1 2 3 4 5 6 Номера элементов в слоях Автоматическое выделение образов-процессов из предметной области в нейроподобные элементы НСС при минимизации ресурсных затрат (памяти) N-элемент (образ НСС) процесс предметной области Автоструктуризация на нейросемантических структурах RИС = f(число N-элементов, число связей)в битах 1/P (компрессия) = --------------------------------------------------------- 0 при t TФИС = объем текстовой информации в ИС в битах или RИС / TФИС 0 и RИС const, при t M при t Примеры: а) <RISMAKDUBLENLENDUBMAKMAKLENRISRISLENMAKRISDUBRIS> правильно выделяются все процессы: <MAK><RIS><MAK><DUB>; б)<ДОМЗЕБРЫСКИТНАДОМДОМВНАДОМВСКИТВНАСКИТВВЗЕБРЫНАВНА>, правильно выделяются все процессы:<ЗЕБРЫ><СКИТ><ДОМ><НА> <В>. сдвиг алфавита А в кодах ASCII в примере б) <ЕПНИЖВСЬТЛЙУОБЕПНЕПНГОБЕПНГТЛЙУГОБТЛЙУГЖВСЬОБГОБ> на +1 <?IGB@<KVLECMH;?IG?IG=H;?IG=LECM =H;LECM==B<KVH;=H;{> на -133. 35 Структуру памяти ИС, в которой выполняется свойство гомоморфного отображения ЭСЕ ПО и их структуры в образы ИС и обратно: N-элемент (образ ИС) ЭСЕ (ПО) будем называть – нейросемантической структурой (НСС) НСС – это готовая структура данных (процессов и объектов) произвольной ПО для любой ИС. Понятно, что ее автоматическое формирование открывает широкие горизонты для инженерии ИС. 36 НСС – это пример 1-го формального преобразования количественной текстовой формы представления информации в качественно новую форму – структуру образов ИС 1— Автоструктуризация 0 "с учителем" – "школа" "без учителя" "игра" log (tn) (в битах) Критерии достаточности: а) все пространство состояний; б) если человек может правильно структурировать данный текстовой материал в непривычной, но взаимнооднозначной нотации, в) наличие характерных особенностей динамического процесса при минимизации ресурса RИС 37 Расширив свойства формального нейрона введением в него относительности времени активации входов, получим нейроподобный N-элемент. U(t) Выход Параметры ИС Набор функционалов сходства Fi t U(t) / U max U(t) x1 t0 x2 dt2 x3 dt3 * * * * ... Входы Umax * Входящие N-элементы xk dtk ... Пространство образов Х U(t)= P1*X1(t0) + P2*X2+T2*(t2- t0) + … + Pk*Xk+Tk*(tk- t0) Fi (P,T) 1 1 1 … U(t+1)= U(t)/a 0 1 1 k 0 1 k 0 1 k 0 1 k 38 Объединив N-элементы в потенциальный многодольный иерархический граф, удалось получить структуру аналогичную естественно-языковым. k слоя № слоя 5 2 5 1 ... ... . . . ... . ... ... ... ... 1 2 ... ... ... ... ... ... ... ... ... ... Номер N-элемента 39 Структурное описание НСС можно представить в виде многодольного графа: k Номера входов слоев 01100101011011011010001101101001 2 6 2 5 2 4 2 3 2 2 2 1 1 0 Алгоритм А1 Текстовая форма N-элементы Связи "0" "1" 1 2 3 4 5 Номера элементов в слоях 6 Форма НСС Алгоритм обратного преобразования НСС в текстовую форму осуществляется уже за меньшее число операций и идет "сверху-вниз". 40 Первый слой (доля графа) N-элементов – терминальный, фактически отображает алфавит А ЭСЕ, второй слой – "псевдослоги" и строится на пространственновременных ссылках на предыдущий (терминальный) слой - информационное содержание N-элемента, слой "псевдослов" – ссылается на "псевдослоги" и т.д., до самого верхнего N-элемента, отображающего в себе через связи всю ПО. Номер слоя k - в х одов "В с я П О" n 7 "Р а з д е л ы" n-1 7 ... ... "Ф р а з ы" 4 5 "С л о в а" 3 5 "С л о г и" 2 3 "А л ф а в и т" 1 1 Номер межслойной среды связи ИС \\\\\\ n-1 \\\\\\\\\\\\\\\\\\\\\\ n-2 ... \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ 3 - N-э л е м е н т ы \\\\\\\\\\\\\\\\\\\\\\\ 2 \\ - с в я з и \\\\\\\\ 1 ПО abcklltfdbababafgkdkediejjdjchhc Текстовой поток 41 Следует также отметить, что все технические характеристики ассоциативной памяти на базе НСС: - время доступа, - коэффициент компрессии-сжатия, - надежность хранения информации и др.) имеют тенденцию к улучшению, как в среднем, так и в абсолютных значениях, по мере роста объема вводимой информации из ПО. Коэффициент сжатия Р раз 1 Время Надеждоступа ность ИС T сек. Q % q элемента Q T P 1 0 log (tn) (в битах) Величина компрессии отражает потенциальную интеллектуальность ИС. Псевдофрактальные файлы. Сжатие Зависимость степени сжатия от размера файла, как Log 2(X) байт 800 700 600 500 400 300 200 100 0 NSS RAR ZIP 10 11 12 13 14 15 16 17 18 19 20 43 Адаптивные регуляторы на базе НСС Примеры объектов управления Fn 1 2 ` Xn Xn 3 4 5 6 7 Fn Xn -3 -2 -1 0 1 2 3 б) "Обратный маятник" а) "Наклонная плоскость" а2 -2 -1 0 1 2 3 с) "Неизвестный объект" X0 X0 а1 -3 Fn аа3 1 а4 а5 а6 а7 Xn Xn+1 = 1+ Xn + Fn + Zn аQ ` -3 -2 -1 0 1 2 3 Q Xn Xn+1 = 2*Xn + Fn + Zn Xn+1 = f(Xn) + Fn + Zn 44 Таблица пространства состояний f(Xn) и Fn Форма задания объекта N= 7 - число состояний объекта. (1 2)(2 3)(3 4)(4 5)(5 6)(6 7)(7 8) -пары (Xn Xn+1) отражают f(Xn) перехода состояний объекта Область нормальных состояний объекта S – первый элемент пары (Xn Xn+1) = {1,2,3,4,5,6,7}. F= -1, -2, -3, -4, -5, -6, -7, - возможные управляющие воздействия регулятора Xn+1 = f(Xn) + Fn + Zn 45 Адаптивный регулятор №1 на базе НСС. е) д) 4-3 2-7 4-3 г) в) 1 2-7 2 7-4 4-1 4-1 4-6 7-4 3 4-1 4 4-6 5 5-2 … … 5-2 6 7 1 2 X б) 4 5 max F0 -F 4-3 2-7 7-4 4-1 4-1 4-6 5 2 … t0 tn F S а) 3 Q Xn+1 = f (Xn) + Fn + Zn X0 t 6 7 Запоминая пары <X><Y> и их оценку <E> для любого априорно неизвестного объекта управления (f(Xn)), регулятор №1, фактически полным перебором, проходит все возможное пространство его состояний (N*M ). 60 50 Настроенный регулятор 40 30 Обуче ние 20 10 0 1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 101 47 Адаптивный регулятор №2 е) д) 4-3 2-7 7-4 4-3 4-1 2-7 4-1 7-4 4-6 5-2 … 4-1 4-6 … 5-2 … г) в) 1 2 3 4 5 6 7 x> x= =4 4-3 2-7 7-4 4-1 4-1 4-6 5 2 F 3 t Q Xn+1 = f (Xn) + Fn + Zn X0 2 … tn S 1 4 max F0 -F t0 а) … =+1 R(X,F) X б) x< 5 6 7 Скорость обучения регулятора №2 почти не зависит от размерностей N и M (N – число состояний объекта, M – число состояний возможного управления, в эксперименте для простоты принималось N = M = 7, 15, 17,19, 21), Т.е., пример регулятора №2 демонстрирует возможность практического преодоления "проклятия размерности". 150 регулятор №2 100 регулятор №1 50 0 1 250 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 101 106 111 116 121 регулятор №2 200 регулятор №1 150 100 50 0 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199 210 221 49 Формирование понятия абстрактного числа в ИС (задача неразрешимая для классического ИИ, и легко решаемая биологическими ИС, как высшими животными, так и человеком). Одно из физических свойств N-элемента состоит в экспоненциальном падении величины U(t+1) = ( U(t) + 1* ) / . после его активации (напр., при =2) U(t) 2 1 0 TL Это пример сведения семантических характеристик ПО к физическим параметрам элементной базы ИС, т.е. сводимым к: См.-Бит-Сек – Система СБС 50 Адаптивный регулятор №3 <больше> <меньше> Fn Xn U(t) =1.0 U(t) =1.5 1 2 3 4 5 6 7 |; ||; |||; ||||; |||||; … |||||||; U(t) 2 U(t) =1.75 N-эл. "1" N-эл. "2" N-эл. "3" t t U(t) … U(t) =1.96 N-эл. "7" Upor, Fi U(t) =1.5 1 0 TL <3; 4><число><+t><больше> <1; 4><число><+2t><больше> … <3; 2><число>< -t><меньше> <4; 1><число><-3t><меньше> 51 На базе нейросемантического регулятора №3 формально показано, как на основе вышеописанных физических свойств N-элементов возможно естественное самоформирование R-отношений, представленных в регуляторе №2. Тем самым, подведено теоретическое основание для инженерного построения ИР, т.е.: теоретически решить проблему построения ИИ. Как и вычислительная техника начала развиваться с теоретических моделей "машин Тьюринга и Поста", так и анализ работы нейросемантического регулятора будет способствовать формированию широкого фронта научных работ по разработке ИР. Таким образом, на НСС-регуляторах можно продемонстрировать: - №1 – "адаптационность", как возможность адаптироваться в любой ПО; - №2 – "интеллектуальность", как возможность существенного сокращения перебора; - №3 – "креативность", как целенаправленное порождение нового знания. Пространство №1 >> №2 >> №3 : полного перебора >> пространство отношений >> энтропийное пространство Функционирование примитивных ИС В ИС отображается только объективная информация. При этом, на каждое конкретное раздражение (Хi) – конкретная реакция (Уj), с "эмоциональной" оценкой ее полезности для ИС. Fi(P,T) ПО Max(U(t)) + -- ИС Оценка (Е+) Вход (Хi) (Yj) Выход 53 Память "сложных" ИС строится как иерархическая структура из НСС. На фактографическую НСС1, настраивается НСС2 ("ортогональная"), которая функционально воспринимает НСС1, также как НСС1 воспринимает ПО. НСС 2 НСС 3 . . . НСС 1 ПО По нашим оценкам, структуры из 4-5-ти иерархических НСС вполне достаточно, чтобы моделировать основные психические функции человека 54 ЗНАНИЕ (например, "логические высказывания") в текстовой форме обязательно содержат ритмические п о в т о р е н и я ! |ВСЕ| |ВОЛК|И| |СЕР|Ы||А||ЕСТЬ| |ВОЛК|,||ЗНАЧИТ|,|А||ЕСТЬ| СЕР|ЫЙ|<E+> |ВСЕ||ПЕТУХ|И||КРАСИВ|Ы||В||ЕСТЬ||ПЕТУХ|,||ЗНАЧИТ|,|В||ЕСТЬ|КРАСИВ|ЫЙ|<E+> НСС1 в НСС2 автоматически строится структура: |ВСЕ| |X1 |И| | X2 |Ы|, |X3| |ЕСТЬ| |X1 |, | |ЗНАЧИТ|, |X3| |ЕСТЬ| X2 |Ы|Й|<E+> t1 t3 t2 <ВСЕ ПЛЮКИ КАНЫ, ОН ЕСТЬ ПЛЮК, ЗНАЧИТ, ОН ЕСТЬ >t2+Ы|Й<КАНЫЙ> <ВСЕ ЛЮДИ СМЕРТНЫ, СОКРАТ ЕСТЬ ЛЮД, ЗНАЧИТ, СОКРАТ ЕСТЬ >, ИС в своей грамматике выдаст: <СМЕРТНЫЙ>. Таким образом, все типы логических высказываний произвольной ПО покрываются одним механизмом НСС 55 Информационный ресурс: "сигнал – информация – знание" При TФ = const (t), "линейный – сигнал", RИС = f (SИС(t)) RИС= K*t +b1 RИС (бит) Память ИС Сигнал - простая суперпозиция ЭСЕ ПО; "логарифмический – информация” RИС= log(t) +b2 t TИС (бит) RИС Информация – знаковая последовательность на языке системы, соответствующая целому числу причинносвязанных процессов ПО, т.е. ЭСЕ Данные – форматированная под ПО информация "const - знание". t TИС RИС RИС= const +b3 Знание – совокупность ЭСЕ, отражающих одновременно процессы ПО и процессы в самой ИС t TИС 56 Отображение информационного ресурса тремя классами ИС Автомат БШ ПО ПС Сигнал Сигнал Сигнал Сигнал Информация Информация Сигнал Информация Знание bsejgr… abcabc... "Телесериал" Реальный "животн." "ИС-человек" Mather… 57 Текстовая энтропия = p(s), при p(s) 1 ТЭ(s) = 1 - (p(s) - 1) / (m-1), p(s) - частота на интервале L*AL, 1 ТЭ при p(s) > 1 0 0 p(s) m; 1 p(s) m p(s)L / m = 1 m (условие нормировки) 1 s - некоторое слово длиной в L символов; m - размер потенциального S-словаря в m=AL S-слов информационное пространство в L*m = L*AL символов m ТЭL = ТЭ(s)L / m 1 L m=A 2 . . . L …kksxkdkdfjfjgh… . . . Т=L*AL Например, p(dkd)L=3 bb c b a 3 c a b c . .. ca cb cc ba bb bc aa ab ac a b А c 1 ... 58 Текстовая энтропия 1— ТЭL 0 Периодический сигнал 1 5 Идеальный случайный сигнал Реальный текст 10 15 Псевдо случайный 20 L Относительная текстовая энтропия Случайный сигнал 1— OТЭ Реальный текст 0 1 5 10 15 20 L Таким образом, числовые значения ТЭ и ОТЭ являются эффективными параметрами-индикаторами, которые характеризуют возможность семантического анализа конкретной ПО (например, при поиске сигналов от внеземных цивилизаций). 59 Решение Проекты: - Искусственный разум ИР ИРМИ - Информоград - Восхождение разума 60 Проект - Искусственный разум Прототипы компьютерного интерфейса: “ человек-ИP “ с а м о р е ф л е к с и я Параллельные каналы Л П "Моти- Л вация оценка" Е=+0,3 "Глаз" "Ухо" Последовательные каналы П "Рука" "Речь" "эмоции" <машина> обработка информации Входная информация - "рецепторы" Оценка Выходная соответствия информация адекватности - "эффекторы" выхода на вход ПО 61 По нашим оценкам через 12 месяцев возможно получить программную реализацию описанного ИP. за 18 и 24 месяца, на базе многопроцессорных ЭВМ (2561024 RISC процессоров), сформировать многопроцессорный кластер и чисто аппаратную реализации ИP, реализуя естественную параллельность процессов в НСС. ИP - это на 6-9 порядков ускорение решения любых "интеллектуальных" задач с одновременным повышением их сложности (числа компонент) на 5-6 порядков. Для цивилизации, появление ИP, это как реальный шанс ее будущего, особенно в сегодняшнее неуправляемое время "технологий глобального (воз)действия" (биотехнологий, информационных, ядерных, финансовых), которые, в руках террористов, превращаются в орудие ада. Без ИP человечеству в 21 веке практически не выжить и в подтверждение этого тезиса можно привести множество доводов Человек и искусственный разум * 10 6-10 = ИР ИРМИ ... Объем памяти 1012-1016 образов (1024 текста, графики, …) Режим работы on-line: 50 пользователей - станция Sun; 1000 пользователей – многопроцессорная супер ЭВМ; 100 000 пользователей – аппаратная реализация ИРМИ. Язык диалога - естественный для каждого пользователяисследователя. Когнитивные функции ИРМИ не уступают человеческим Проблемы решаемые только с помощью ИР - on-line структуризация и формирование глобальных БЗ; - "Госплан" Планеты; - Глобальный Университет (обучение); - Промышленная разработка информационного ресурса; - Безопасность Планеты; … Человек и Машина (ИР) Страхи что ИР поработит человечество – типичный пример широко распространившегося шаманизма от киноиндустрии. Для человека более опасен другой человек, т.к. у них одна ниша потребления. Генетически же ИР нацелен на космос – именно там широкое поле для его деятельности. Неограниченное количество любых материальных ресурсов вселенной не дает даже теоретических основ для конфликта между ИР с земным человеком. С точки же зрения сотрудничества, ИР для человека представляется идеальным партнером, т.к. у них одна область производства легко тиражируемого результата. Где в итоге, каждый получает весь конечный продукт – новое знание (пример ИРМИ). Так что, никаких естественных оснований для конфликта между человеком и ИР нет. Сотрудничество же человека с ИР станет мощным стимулом для заключительного экспоненциального этапа научно-технического прогресса нашей цивилизации. Работы над созданием ИР должны проводиться только в рамках нового гуманистического мировоззрения и специализированной международной академической инфраструктуры. Это необходимо, чтобы такой фактор, как ИР не стал "информационной дубиной" в руках какой-либо эгоистической группировки. В качестве такой начальной социально-экономической структуры по разработке ИP предлагается проект "Информоград". Российский центр поддержки инноваций (проект "Информоград") ИРМИ в рамках Российского центра поддержки инноваций (проект "Информоград") каждому исследователю даст в свое распоряжение колоссальные материальные и интеллектуальные возможности, о которых до этого не могли мечтать и целые государства. В процессе взаимодействия при решении задачи, ИРМИ помогает человеку получить новое решение, человек при этом обучает ИР, представляя ему уже известные знания. Новое же знание, полученное в ходе сотрудничества ИРМИ и человека, становится их общим знанием, взаимообогащая их обоих, как бы более интеллектуально ИР не превосходил человека. 65 $1500-3000 2006-2007 г $300-500 2006-2007 г "Информоград" Российский информационно-аналитический центр поддержки инновационных работ $1500-3000 Молодой российский выпускник за границей : -Материальный достаток и хорошие бытовые условия -Новейшее оборудование -Иная культурная среда -Работа на вторых ролях (мах post-doctor = м.н.с.) -Малая перспектива роста -2004 г число возвращающихся высококлассных специалистов (МФТИ, МГУ, МГТУ, МИФИ) сравнялось с числом отъезжающих за рубеж 67 ТНК Аутсорсинг $500-1000 "Чем больше работаешь – тем больше остаешься должен" ! Российский рынок информационной безопасности в прошлом году составил $170 млн. и по предварительным прогнозам, в 2005 году вырастет до $230 млн., мировой рынок составит ~ $200 млрд. В этой области работает ~ 1 000 программистов из России. Они получают ~ $1000, сумма = $12 млн./год $230 млн. - $12 млн. = $220 млн. ??! (выплаты из России) В $200 млрд. (общ. объем $1 трлн.) ~ 10% труда россиян, а получают 0,5% или 1/200 от прибыли, принесенной ТНК Пример: 10 чел. за 12 мес. для ТНК делают ПО ИИС (цена ПО $1000) Получают по $1200/мес. Семьи по 5 человек. Прож. минимум $200. Доход семьи (страны) = $2400/год. Семья разработчика ПО не может купить свой ПО (2400 << 5*1000 ) !!! Нет более ценного товара, чем ИНФОРМАЦИЯ (знание) Инновационная экономика - стратегическое направление развития России в XXI веке Создание единого информационного пространства (информационной инфраструктуры) технологии разработки знаний Как не богата Росси я природными ресурсами, но основное её "богатство в мозгах, а не в недрах" Смена социально-экономической философии Не догонять, а упреждать !!! Не ЭВМ, а Искусственный разум !!! 69 "И н ф о р м о г р а д" это: - Повышение производительности труда в 1000 раз = 10 (этап постановки) *10 (НИР) *10 (НИОКР) - Экспериментально-опытное производство (ЧПУ,…) = готовые изделия (патент, самолет, …) - Новые социально-экономические отношения = Ноосфера (социальный организм) - 2012 год Россия мировой лидер социальноэкономического развития (русский космизм) $300 000 - 500 000 Проект - Восхождение разума 71 Характеристики эволюционного процесса высокоорганизованной материи Цель – пролонгация лидирующего вида до горизонта прогнозирования будущего ( n(t), t∞). – экспансия свободы вида ( n(t)=f(at), t∞, Q). Мера – эволюционный потенциал (Э(Е) – НЭ(Е)), доступный ресурс ( n(t) max(E) Q), компрессия ( Pmax Q). Механизмы – законы экспоненциальности (f(at), и сверхаддитивности f(s1,…,sn)>>f(s1)+,,,+f(sn) и алгоритмы НСС (C++, …) 72 Фазы эволюции высокоорганизованной материи Пространственная 1-я фаза Пространственновременная 2-я фаза Временная 3-я фаза Довещественная Вещественная Надвещественная Б Мы Антропный принцип (Разума) В О С Флуктуация, Большой взрыв Х О Ж Д е г р а Д д 2006г. Е а Разум Н ц И Е и я Эволюция форм материи и ее пространственно-временных фаз 73 СПАСИБО ЗА ВНИМАНИЕ По всем вопросам Проекта (национального) ИСКУССТВЕННЫЙ РАЗУМ обращаться к Бодякину Владимиру E-mail: [email protected] www.informograd.narod.ru/ тел. (095)334-92-39 в ИПУ тел 1-346 74 Свойство доминирования "внутренних" информационных процессов (от НСС5 > НСС1) над "внешними" информационными процессами идущими от НСС1, назовем сознанием ИС. Особенностью нейросемантической ИС является то, что в N-элементе происходит слияние общепринятых понятий данных и алгоритма, как неделимого пространственнофункционального элемента – образа. "Метаалгоритмом" поведения ИС является асимптотическая минимизация отображения (при t), всех значимых для неё текстовых потоков. Формальная схема иерархического построения памяти ИС приводит к расширению языка, что позволяет "обойти" запрет теоремы Гёделя о неполноте формальных систем. Так, если язык фактографической ИС (НСС1) представляет только <X><Y><E> (<стимул><реакция><оценка>), то иерархическая схема в НСС2 позволяет дополнительно описывать различные отношения R(<X><Y>) физических характеристик активируемых N-элементов и объединять все это с оценкой <E>. <X><Y><E> < (<X><Y>) >< R(<X><Y>) >< E> <… Алгоритм (А1) преобразования текстовой формы в иерархическую структуру словарей (НСС) L = {01100101011011011010001101101001}. Исходный текст 1-й шаг k1=2 l0 01100101011011011010001101101001 Последовательность индексов (ссылок) l1 1 2 1 1 1 2 3 1 2 2 4 3 1 2 2 1 + Номера цепочек в словаре 1 2 3 4 "01"10"11"00“ L1 77 2-й шаг k2=2 l1 1211123122431221 l2 12134516 Номера цепочек в словарях 1 2 3 4 5 6 + 12 11 31 22 43 21 "01"10“ 11"00" L2 L1 78 3-й шаг k3=2 l2 12134516 Номера цепочек в словарях 1 l3 1234 2 3 4 5 6 12 13 45 16 L3 12 11 31 22 43 21 + "01"10“ 11“ 00" L2 L1 79 4-й шаг k4=2 l3 1234 l4 12 Номера цепочек в словарях 1 + 2 3 4 5 6 12 34 L4 12 13 45 16 L3 12 11 31 22 43 21 L2 "01"10"11"00" L1 80 5-й шаг k5=2 и исходная последовательность символов полностью переходит в НСС. Номера Ссылки словарей 6 1 на предыдущие (слоев) 5 12 словари 4 12 34 и "алфавит" 3 12 13 45 16 2 12 11 31 22 43 21 1 "01"10“ 11“ 00" 1 2 3 4 5 6 Номера элементов в словаре 81 Номера словарей (слоев) Включение в НСС алфавита А 6 5 4 3 2 1 0 6 5 4 3 2 1 А 1 Ссылки 12 на предыдущие 12 34 словари 12 13 45 16 и "алфавит" 12 11 31 22 43 21 12 21 22 11 "0" "1" 1 2 3 4 5 6 Номера элементов в словаре 82 Структурное описание НСС можно представить в виде многодольного графа: Номера слоев 6 N-элементы 5 Связи 4 3 2 1 0 "0" "1" 1 2 3 4 5 6 Номера элементов в слоях Алгоритм обратного преобразования НСС в текстовую форму осуществляется уже за меньшее число операций и идет "сверху-вниз". 83