Системы управления знаниями В.З. Ямпольский, д.т.н., профессор Институт “Кибернетический центр” ТПУ, г.Томск Вместо введения Создание, накопление и распространение знаний от поколения к поколению определяет темпы развития человеческой цивилизации. НТП и прогрессу вообще свойственен сегодня: - лавинообразный рост объемов и источников информации; - слабая структуризация информации и знаний; - лавинообразный рост производителей и потребителей знаний (WWW содержит > 170 млн. компьютерных хостов); - глобализация различных сфер человеческой деятельности. Управление знаниями (КМ) – многообещающее направление в разрешении такого рода проблем. Управление знаниями (КМ) Направление КМ начало активно разрабатываться с середины 90-х годов. Создаются НИИ, специальные подразделения Компаний во главе с CKO – Chief of Knowledge Office. КМ- крупная подпрограмма IST в EU. Знания рассматриваются как основной источник конкурентных преимуществ Компании. Рост числа публикаций по управлению знаниями Source: Gordon & Grant 2000 700 600 20000000 500 400 300 200 Количество документов в Интернет 15000000 Системы управления знаниями(KMS) Управление знаниями (KM) 10000000 5000000 0 2002 2003 Год 2004 100 0 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 Год публикации Основной стимул управления знаниями Организация, которая быстрее других находит новые знания, организует их усвоение сотрудниками, внедряет в практическую деятельность, получает конкурентное преимущество. Университет* - интеллектуальноориентированная культура, приобретающая, создающая, накапливающая и распространяющая знания. * с точки зрения знаниевого подхода Интеллектуальный капитал – новый источник богатства К0 Интеллектуальный капитал (нематериальные активы) 1 человеческие активы – знания, опыт, мастерство, творчество 2 интеллектуальные активы – информация, стратегии, программы, публикации 3 интеллектуальная собственность – патенты, секреты, торговые марки, издательские права и т.п. 4 Структурные активы – К0 культура, орг. модели., процессы и процедуры производства и маркетинга 5 Бренд – активы – известность, репутация, гудвил К0 Интеллектуальные К0 движутся налегке Билл Гейтс $85 млрд Самуэль Пальмисано $70,7 млрд $0,9 млрд Microsoft Нематериальные активы $16,6 млрд IBM Материальные активы Microsoft: 99% инвестирует в нематериальные активы. IBM: лишь 77% Интеллектуальные К0 освобождаются от основных фондов Благосостояние от нематериальных активов? 180 1996 160 140 120 US$bn Net Assets 100 80 Profits 60 Revenue 40 Market value 20 0 GE CocaCola 82% 96% Exxon 66% Microsoft 94% Intel 85% % ‘нематериальные активы’ Data source: Roos et al 1997 Дисциплины, участвующие в управлении знаниями Корпоративная культура (CorporateCulture) Организация управления (Organizational behaviour) Управление персоналом (Human resource management) Профессиональное обучение и повышение квалификации (Professional training and developement) Информационные технологии (Information Technologies) Слагаемые КМ OB KM IT HR Что такое знания? «Знания - это проверенные практикой результаты познания действительности и верное их отражение в мышлении человека» (БСЭ). «Знания - это умение сотрудников K0 решать стоящие перед ними проблемы и задачи». «Знание – это сложная сеть понятий и многообразных отношений между ними, которая сознательно (логически) или бессознательно используется нейронной сетью головного мозга при необходимости выработки новых суждений или принятия разнообразных решений»(В.Ф. Турчин). Явные знания – описание теорий, методов, алгоритмов, методик, технологий, машин и систем. Неявные знания – культура мышления, опыт, мастерство, навыки, интуиция специалистов, хранящихся в нейронных структурах головного мозга. Носители знаний в компаниях USA (результаты исследования Delphi Group, 2000г.) Бумажные документы, 26% В головах специалистов, 42% Другие, 12% Электронные документы, 20% Знания особый вид интеллектуальных ресурсов Свойства знаний: Знания долговечны ибо они нематериальны Знания инвариантны к пространству и чувствительны к фактору времени Знания можно продавать многократно ибо они не отчуждаемы Знания постоянно увеличивающийся ресурс Знания орудие конкуренции Данные, информация, знания Данные это все, что регистрируется, описывается и воспринимается человеком. Знания Информация Данные Информация – данные в определенном контексте. Информация = Данные + МетаДанные Знания – информация, полезная для решения задачи. Знания = Информация + МетаИнформация Модели представления знаний Семантические сети Сети фреймов Продукционные системы Нейронные сети Онтологический подход Онтология – формализованное описание предметной области Онтология = (классификаторы, тезаурусы, понятия, отношения) : Описание множества терминов и связей между ними; Мета описания, связывающие информационные ресурсы с понятиями онтологии; Структуры хранения и процедуры извлечения описаний ресурсов и данных; Интеллектуальный интерфейс пользователя; Технология работы с базой знаний для решения задачи. Формальное определение онтологии O C, R, L, PC , PLC , PLR , I , где C c1 ,..., c n – конечное множество понятий в онтологии, R r1 ,..., rm – конечное множество бинарных отношений между понятиями, L l1 ,..., l k – конечное множество лексических меток (словарь онтологии), PC C C, PC R – антисимметричное, транзитивное, нерефлексивное бинарное отношение, являющееся отношением частичного порядка на множестве понятий C, – бинарное отношение инцидентности между PLC L C множествами L и C, – бинарное отношение инцидентности между PLR L R множествами L и R. I - множество экземпляров понятий. Knowledge Space Ontology Concept 4 Concept1 Concept 3 MetaData Object1 MetaData Object2 Concept N Concept2 Взаимосвязь между онтологиями онтологической системы Метаонтология Онтология задач Онтология ПО Пример онтологии задачи Проект разработки имеет экземпляр имеет экземпляр АД с короткозамкнутым ротором заказчик имеет экземпляр исполнитель имеет отношение к НИИ «ЭлеСи-ТУСУР» продукт Арматура запорная и запорно-регулирующая Софт-стартер 1 Электропривод 1 ЗАО «ЭлеСи» Проект «Разработка блока плавного пуска» имеет экземпляр Электродвигатель 1 Организация входит в состав имеет экземпляр имеет экземпляр использует Арматура магистрального нефтепровода 1 имеет экземпляр Блок плавного пуска входит в состав ЭП переменного тока Магистральный трубопровод имеет экземпляр Нефтепровод 1 Типы метаданных Семантические метаданные (Region; Upper Abdomen; Organ) Структурные метаданные (структура документа; результат категоризации, выделение понятий) Синтаксические метаданные (язык, формат, размер документа, дата создания, audio bit rate) Данные (структурированные, полуструктурированные, неструктурированные) Дескриптивные логики Семейство логических формализмов для представления и рассуждения (логического вывода) о концептуальных знаниях Это разрешимое подмножество логики предикатов первого порядка Основным видом логического вывода в ДЛ является установление родовидовых отношений (subsumption), обычно записываемых как C D (т.е., понятие С является подвидом понятия D). Конструкторы классов DAML+OIL Пример Конструкция Синтаксис в ДЛ intersectionOf C1 ⊓ . . . ⊓ Cn человек ⊓ мужчина unionOf C1 ⊔ . . . ⊔ Cn доктор ⊔ адвокат complementOf ¬С ¬мужской oneOf {x1 . . . Xn} {Иван, Маша} toClass ∀P.C ∀ имеет ребенка.доктор hasClass ∃P.C ∃имеет ребенка.адвокат hasValue ∃P.{x} ∃гражданин.{US} minCardinalityQ ≥nP.C ≥2 ребенка.адвокат maxCardinalityQ ≤nP.C ≤1ребенок.мужского пола cardinalityQ =nP.C =1 родитель.женского пола Временная диаграмма развития данных Данные более важны, чем приложения Эпоха программ Эпоха закрытых данных (офисные данные) «Данные менее важны,чем код» 1945-1970 1970-1994 Эпоха открытых данных Эпоха открытых метаданных (HTML) (XML) (OWL) «Данные также важны, как код» 1994-2000 Эпоха семантических моделей «Данные более важны, чем код» 2000-2003 Временная диаграмма развития данных 2003 - … Иерархия языков описания онтологий OWL (Ontology Web Language) RDF/RDFS (Resource Description Framework) XML (eXtended Markup Language) Дерево языков описания онтологий Структура системы управления знаниями Система Управления Знаниями Инженерная среда для работы с неявными знаниями Подсистемы для работы с явными знаниями Управление интеллектуальной собственностью WEBСемантик Репозитарий знаний Сеть экспертов Группы обсуждений Проектные группы (корпоративное хранилище) (Expert Net) (Communities of Practice) (Virtual Teams) Онтологии (классификаторы, термины, понятия) Структура и состав корпоративного хранилища ДАННЫЕ ИНФОРМАЦИЯ ЗНАНИЯ Метаданные Структура архивов Онтологии Справочники, каталоги Отчеты, методики, технологии Правила выбора БД, файлы, Webстраницы Электронные документы, чертежи Базы знаний Классификация Web порталов на основе используемых технологий Информационные технологии KW SW SKW Технологии управления знаниями Семантические технологии Z Применение онтологии и семантических метаданных в порталах Онтология Запрос бл из о ст ь Категоризация ст о из бл ь Рубрика Документ близость Рекомендации Документ Поиск Вычисление семантической близости метаданных n SM FO MD DL (q i ), MD DL (q j ) max smd ix MD DL ( q i ) smd jy MD DL ( q j ) (k ix * k jy * SE F (smd ix , smd jy )) n n SM CO MD DL (q i ), MD DL (q j ) m smd ix MD DL ( q i ) m max smd jy MD DL ( q j ) (k ix * k jy * SE C (smd ix , smd jy )) n SMCO MD DL (qi ), MD DL (q j ) , если max (SE C (smd ix , smd jy )) 0 SMCS MD DL (qi ), MD DL (q j ) 0, иначе Вычисления близости семантических метаданных Пользовательс кий Интерфейс Поиска Запрос (тройки Субъект – Отнощение - Объект) Приблизитель ный Поиск по Онтологии Список кандидатов ((сущности) Фильтрация и Ранжирование Результатов uses uses uses Частичное описание Упорядоченные сущности (по близости к запросу) Полученные результаты Детальное описание показывает Ontology Server Сущности СУЗ (Экземпляры) Metadata Server показывает IT , используемые в управлении знаниями Управление документами Intranet Semantic Analysis Knowledge Maps White Boarding Structured Document Repositories Full Text Retrieval Push Technology Real Time Messaging Automatic Profiling Net Conferencing Discussion Groups File Management System E-mail Shared Files Управление сотрудничеством Европейское представление жизненного цикла знаний (ЖЦЗ) выявление знаний использовани е знаний клиенты клиенты создание знаний Бизнес Процесс распространен ие знаний потребители партнеры хранение знаний Состав основных этапов жизненного цикла знаний Выявление и идентификация знаний. Стимулирование процессов создания нового знания. Совершенствование корпоративной системы хранения и извлечения знаний. Распространение и обмен знаниями. Повышение эффективности использования знаний и интеллектуальной собственности. Повышение эффективности использования знаний и интеллектуальной собственности Коммерциализация патентов, изобретений, разработок компании. Коммерциализация бренда ЭлеСи. Обеспечение эффективности доступа к знаниям в DOKB (Distributed Organizational Knowledge Base) с рабочих мест основных бизнес-процессов. Использование метаописаний и онтологии «Автоматизация» для семантического поиска знаний. Расширение функциональности и сферы применения универсальных и специализированных инструментальных систем проектирования, разработки, конструирования производства и тестирования (Applied Co. Tools). Создание в интранет и использование проектных зон для реализации комплексных проектов виртуальными командами (Virtual Teams). Повышение эффективности использования знаний и интеллектуальной собственности* Использование БД «Профили компетентности специалистов и экспертов» для обмена знаниями. Выделение экспертов из числа наиболее квалифицированных сотрудников компании определение их статуса и стимулов. Ротация носителей знаний между подразделениями компании. Стимулирование генерации и внедрения рационализаторских предложений. Выделение брокеров (антрепренеров) знаний в компании. Программные системы для КМ AskMe Enterprise (AskMe Co.) Hyperwave eKnowledge Portal (HyperWave Ltd.) Knowledge Discovery System (IBM,Lotus) Deskartes Universal Knowledge (Knowledge Management Software Co.) Know-Net (European Consortium) myLivelink KM Portal (Open Text Corp.) Exsys CORVID (expert shell software) SharePoint Portal Server 2003 (Microsoft) Разрабатываемые в ИКЦ программные системы Система управления результатами научно технической деятельности “ЮКОС ЭП” 20022003гг. (внедрена в 3 объединениях). Petroleum Engineers Virtual Network ЦППС НД (внедрена в ТПУ – HWU центре) 2003 г. Грант по программе «Интеграция». Подготовка монографии «Системы управления знаниями» 2004 г. Разработка проекта и базовых элементов системы управления знаниями компании «ЭлеСи» 2005 г. Функции системы управления результатами НТД Запросы на получение прав по использованию РНТД Общение с коллегами Доступ к описаниям, документам Подписка на новости системы Занесение комментарий об использовании Специалисты компании и дочерних обществ Консультация у эксперта Дискуссии по проблемам НТД Поиск информации по проблемным ситуациям Архитектура семантического портала Семантический портал Портал Приложение-обозреватель Специфические приложения Digest, NTLM, ... Безопасность HTTP(S) Представление SS Профилирование Категоризация Интеграция приложений и сервисов Индексирование и поиск Сервер приложений (Веб-сервер) Оповещение SM TP ,R Интеграция данных Редактор онтологий HTML-страница Уровень интерфейса Семантическое ядро Сервер семантических метаданных Сервер онтологий Модуль логического вывода Внешние источники данных OLEDB, ODBC, JDBC, ... LDAP DCOM, CORBA, ... Уровень данных Unified Content API Уровень бизнес-логики База данных портала LDAPкаталог Хранилище семантических метаданных Хранилище онтологий КМS Schlumberger КМS Schlumberger КМS Schlumberger КМS Schlumberger Приложения СУЗ Знание это сила! Френсис Бэкон (1597) Спасибо за внимание!