УДК 004.89 СИСТЕМНЫЙ АНАЛИЗ ПРИ АВТОМАТИЗАЦИИ ИНТЕЛЛЕКТУАЛЬНОЙ ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ

advertisement
УДК 004.89
СИСТЕМНЫЙ АНАЛИЗ ПРИ АВТОМАТИЗАЦИИ
ИНТЕЛЛЕКТУАЛЬНОЙ ПРОФЕССИОНАЛЬНОЙ
ДЕЯТЕЛЬНОСТИ
А.С. Клещев (kleschev@iacp.dvo.ru),
Е.А. Шалфеева (shalf@ iacp.dvo.ru)
Институт автоматики и процессов управления РАН,
Владивосток
Автоматизация
деятельности
специалистов,
решающих
интеллектуальные задачи, является частным случаем автоматизации
профессиональной деятельности, но интеллектуальные задачи
требуют тщательного анализа данных и использования знаний,
формируемых экспертами. Предлагаемое уточнение этапа
системного анализа обеспечивает высокую вероятность получения
управляемой долгоживущей системы поддержки интеллектуальной
профессиональной деятельности.
Введение
В области методов системного анализа при разработке
информационных и других систем для более эффективного управления
бизнесом достигнуты значительные успехи [Martin 1989, Бородин 2003].
Однако эти методы недостаточны для интеллектуальных видов
деятельности, когда решаются задачи повышенного класса сложности,
традиционно считающиеся творческими, подразумевающие разумные
рассуждения и действия на основе знаний в конкретной предметной
области. При этом, чем обширнее знания, тем более качественным
становится результат, но и получение его более трудоемко. Примерами
таких интеллектуальных видов деятельности являются: медицинское
обслуживание населения, оборонная деятельность, обеспечение
безопасности на автомобильных и железных дорогах, в авиации,
судоходстве, моделирование и планирование экспериментов в науке.
Целью автоматизации такой интеллектуальной деятельности является
повышение качества результата за счет информационной поддержки в
принятии
ответственных
решений.
Технологии
создания
интеллектуальных программных систем, в частности, экспертных,
посвящено много публикаций. Она включает шесть этапов, первые три из
которых [Муромцев 2005] содержат действия, типичные для системного
анализа. Однако эта технология не универсальна. Используемые способы
взаимодействия с экспертами ограничивают возможность создания и
сопровождения больших баз знаний. Зачастую при доведении объема
знаний до близкого к реальному (существующему у специалистов
предметной области) система перестает быть работоспособной версией.
Целью настоящей работы является уточнение задач и результатов
системного
анализа
при
автоматизации
интеллектуальной
профессиональной деятельности (ИПД), обеспечивающего высокую
вероятность получения управляемого долгоживущего программного
обеспечения,
повышающего
качество
работы
специалистов,
принимающих ответственные решения.
Под предметной областью будем понимать совокупность реальных
объектов и связей между ними в конкретной сфере человеческой
деятельности, к которой может применяться автоматизация. А под
проблемной областью совокупность взаимосвязанных сведений,
необходимых для решения некоторой задачи, стоящей в предметной
области.
1. Системный анализ при разработке программных средств и
при автоматизации профессиональной деятельности
Согласно [ГОСТ 2003] в процесс разработки программного обеспечения
включаются работы «системного уровня» (анализ требований к системе и
проектирование системной архитектуры), если это оговорено
контрактом. В зависимости от степени сложности проекта, типичности
или нетривиальности стоящих задач, роль и содержание процесса
системного анализа могут значительно варьироваться.
Типичный жизненный цикл и методика проектирования систем
управления предприятием учитывает необходимость анализа области
бизнеса [Martin 1989] и деятельности различных специалистов.
Содержание системного анализа расширяется, поскольку, во-первых,
задачи, решаемые специалистами, взаимосвязаны, а, во-вторых, требуются
средства (называемые часто онтологической моделью предприятия или
онтологией корпоративного знания) для накопления и структурирования
знаний и собственного опыта предприятия [Гаврилова 2003, Гладун и др.
2006].
Системный анализ начинается с исследования деятельности, изучения
спектра решаемых задач и связей между ними, определения исполнителей
процессов, идентификации терминологии, специфичной для каждой
задачи. Декомпозиция деятельности на задачи - путь к упрощению
сложного анализа и проектирования. Таким образом, первый этап
системного анализа сводится к идентификации объектов автоматизации
и связанных с ними задач (рис.1).
Далее требуется проведение математических исследований объекта
автоматизации и связанных с ним задач. Получаемая для каждой задачи
модель (онтология проблемной области) содержит совокупность базовых
структурированных понятий и отношений между ними – в виде
формально-логических, математических или других отношений.
Количественные зависимости между рассматриваемыми величинами
устанавливаются обычно системами уравнений. Для представления
структуры сложно устроенных объектов используют теорию графов
[Шведин 2010].
Знание профессиональной деятельности
Идентификация объектов автоматизации
и связанных с ними задач
Схема бизнеспроцессов
Объекты\понятия
автоматизируемой
деятельности
Разработка онтологий
задач предприятия
Модели информационных
компонентов и их связей
Постановка задач профессиональной деятельности
Формирование
базы знаний
Математические
модели задач
База знаний
предприятия
Выбор или разработка
алгоритмов решения
задач
Методы и алгоритмы решения
Интеграция задач
Высокоуровневая
архитектура
системы
Исследование реализуемости
Нефункциональ
ные требования
пользователей и
ограничения
отчет
Документирование требований на
разработку
Рис. 1. Этап системного анализа при разработке систем, автоматизирующих
профессиональную деятельность
Постановка каждой задачи - формулировка реальной задачи как
математической (при этом редко математическую модель можно
"подобрать" из числа имеющихся) [Данилов 2006].
На этапе выбора алгоритма решения, исходя из характера задачи и
построенной модели, либо выбирают известный метод, либо
приспосабливают таковой, либо разрабатывают новый [Данилов 2006].
Поскольку на первом этапе сложную деятельность предприятия
представляют в виде совокупности более простых задач, для каждой из
которых на третьем этапе делается математическая постановка, требуется
дополнительный
этап
системного
анализа
–
интеграция
автоматизируемых задач (в виде системы) с учетом связей по общим
обрабатываемым информационным компонентам. Кроме того, при
автоматизации предприятий часто требуется интеграция по информации с
ранее автоматизированными задачами.
Исследование целесообразности автоматизации начинается с
оценивания сложности формализованных алгоритмов, после чего
исследуется техническая и экономическая реализуемости.
Связь этапов системного анализа и получаемые результаты
представлены на рис. 1. Формирование реальной базы знаний до начала
«проектных» (design) работ при традиционной автоматизации не является
обязательным.
2. Особенность интеллектуальной деятельности и ее
автоматизации
Жизненный цикл и методика проектирования систем для
автоматизации деятельности специалистов, решающих интеллектуальные
задачи, является частным случаем автоматизации профессиональной
деятельности. Специфичным является наличие этих интеллектуальных
задач, т.е. требующих принятия ответственных решений на основе
обширных знаний (когда выполнение известного алгоритма применения
знаний людьми невозможно в силу временных или других ограничений).
В настоящей работе рассматриваются ИПД, состоящие из
взаимосвязанной совокупности интеллектуальных задач и, возможно,
множества не-интеллектуальных задач1. При этом:
- цена ошибки принятия решения высока, а риск ошибочного решения
имеется;
- обрабатываемая информация сложно устроена, данные об объекте
могут быть не полны;
1 Не-интеллектуальными будем считать задачи, имеющие алгоритм решения,
реализуемый людьми без ошибок и в приемлемые сроки.
- исходная и результирующая информация в каждой интеллектуальной
задаче имеет вербальный характер, при этом обрабатываемая информация
регламентирована и требует документирования (см. рис 2);
- существуют и могут быть формализованы знания (см. рис 2),
необходимые для профессиональной деятельности;
- знания время от времени пополняются или модифицируются путем
научной деятельности (см. рис 2).
Архив решений
Решения совпавшие
Оценивание прецедентов и
включение в обучающую
выборку
случаи несовпадения решения
специалиста с решением
системы
случаи альтернативных
решений системы и
отказов
Обучающая
выборка
Управление
знаниями
Принятие
решений
Объяснение
Поддержка
принятия
решений
Входные
данные
Знания
Обновление
знаний
Новые
знания
Индуктивное
формирование
знаний
Оценивание знаний на возможность добавления
Рис. 2. Использование обновляемых знаний при поддержке принятия решений
некоторой задачи
Подразумевается, что итогом автоматизации ИПД является
интегрированный (и наращиваемый) интернет-комплекс средств
поддержки принятия решения для требуемых задач. При этом:
- результатом поддержки принятия решений является объяснение (см.
рис 2), а формирование объяснений основывается на вычислительной
модели решаемой задачи [Жернаков 2010];
- могут накапливаться архивы ранее решенных задач информационные хранилища; архив решенных специалистами задач
может стать источником индуктивного формирования новых знаний;
- интегрированный комплекс должен быть управляемым: должны быть
инструменты поддержки актуальности знаний системы (см. рис 2),
улучшения эксплуатационных характеристик, а также средства
возможного расширения функциональности в интересах «общего дела».
Поэтому системный анализ, как и весь жизненный цикл автоматизации
деятельности специалистов, решающих интеллектуальные задачи, имеет
ряд особенностей по сравнению с автоматизацией произвольной
деятельности.
3. Содержание системного анализа при разработке систем
автоматизации интеллектуальной профессиональной
деятельности
С учетом представленных особенностей этапы системного анализа
при автоматизации ИПД уточняются следующим образом:
(1) идентификация взаимосвязанных задач ИПД включает
идентификацию связанных с ИПД информационных объектов (и
сопутствующей профессиональной терминологии) и декомпозиция ИПД
на задачи, решаемые специалистами области; здесь обязательно
появляются задачи, для решения которых нужна поддержка, и, как
правило, будут задачи, автоматизируемые в традиционном смысле (т.е.
производящие решение вместо человека);
(2) разработка онтологии проблемной области (для каждой
интеллектуальной задачи) подразумевает оформление знаний для решения
задачи в виде совокупности онтологии данных (структуры сущностей из
действительности), онтологии знаний (причинно-следственные и другие
связи между реальными и абстрактными сущностями, необходимые для
решения задачи специалистом), онтологии объяснения результата (часть
онтологии знаний, связывающая полученный результат с входными
данными) для каждой задачи. Здесь для представления структуры
сложных объектов используют теорию графов или семантических сетей, а
онтологию объяснения и онтологические соглашения о связи знаний и
действительности (неструктурная часть онтологии знаний) представляют в
виде математических, логических, продукционных или других отношений;
(3) постановка задач в терминах онтологии проблемной области
специфична лишь тем, что в постановках задач поддержки принятия
решений дополнительным входным данным является знание, а выходным
– объяснение решения;
(4) разработка алгоритмов решения задач осуществляется
традиционным способом для каждой задачи (но в основе алгоритма,
скорее всего, будут лежать онтологические соглашения о связи знаний и
действительности);
(5) формирование базы знаний осуществляется одним из двух способов
– с помощью специализированных редакторов знаний и с привлечением
индуктивного формирования знаний; специфичность этапа в том, что для
ИПД знания должны быть сформированы уже на этапе системного
анализа, поскольку от успеха этой деятельности зависит реализуемость;
(6) «интегрирование» задач и информационных компонентов имеет
целью исключение избыточности в случаях совместно используемых
знаний в разных задачах, интеграцию «проблемных онтологий» в единую
онтологию предметной области2 и построение высокоуровневой
архитектуры, учитывающей, что генерируемое решателем задачи
объяснение получает специалист, а не решатель другой задачи;
(7) исследование реализуемости отличается от традиций в бизнеспроектах отношением к экономической реализуемости, а для технической:
если не была сформирована полная база знаний для каждой задачи,
требуется оценка ее реализуемости с точки зрения возможности извлечь
все знания, проверить полную базу и эксплуатировать ее.
Результатом этапа 1 являются:
схема описания информационного объекта - абстракция множества
сущностей в этой ИПД и связанная с ними
профессиональная
терминология;
перечень формируемых документов (в том числе архивных данных),
схема решаемых задач - взаимосвязанная совокупность задач.
Результатом этапа 2 (для каждой интеллектуальной задачи) являются:
онтология входных данных,
онтология знаний (для поддержки решения одной задачи),
онтология объяснения решения задачи,
онтология архивных данных.
Результатом этапа 3 (для каждой интеллектуальной задачи) является
постановка задачи.
Результатом этапа 4 является набор формализованных алгоритмов
применения знаний.
Результатом этапа 5 становятся, по возможности, реальные
формализованные знания.
Результатом этапа 6 являются: единая онтология предметной области
и высокоуровневая архитектура системы.
Результатом этапа 7 является отчет с обоснованием выбранного
подхода к автоматизации и доказательство его технической
реализуемости.
Содержание системного анализа и его результаты для ИПД шире, чем
предлагаются для автоматизации решения отдельных интеллектуальных
задач, например, только для мониторинга [Жернаков 2010].
2 Онтология должна обеспечивать единую систему знаний для всей отрасли
(такой как медицинская деятельность по всей стране).
Заключение
Системный анализ с учетом предложенных уточнений всех
производимых в его рамках результатов существенно снижает риск
получения системы, которая не сможет удовлетворить потребность
специалистов в адекватной поддержке при принятии ими ответственных
решений, поскольку вырабатываемая онтология предметной области
ориентирована не только на реализуемость масштабной системы, но и на
развитие ее вслед за развитием самой профессиональной деятельности.
Системный анализ такого уровня и следующие за ним процессы
технологии разработки программных систем нацелены на получение
интеллектуальной интернет-системы поддержки принятия решения,
управления знаниями которой осуществляется «на уровне отрасли», а не
отдельного учреждения. Предлагаемое уточнение системного анализа
обеспечивает эффективную модификацию знаний и продолжительное
сопровождение интеллектуальной программной системы в целом.
Благодарности. Работа выполнена при финансовой поддержке РФФИ
(проект № 10-07-00089-а) и ДВО РАН (проект № 12-III-А-01И-019).
Список литературы
[Бородин 2003] Бородин А.И. Методология и инструментальные средства для
проведения реинжиниринга // Менеджмент в России и за рубежом, 2003. №3.
[Гаврилова 2003] Гаврилова Т.А. Онтологический подход к управлению
знаниями при разработке корпоративных систем автоматизации // Новости
искусственного интеллекта, 2003. № 2. С. 24-30.
[Гладун и др. 2006] Гладун А.Я., Рогушина Ю.В. Онтологии в корпоративных
системах // Корпоративные системы, 2006. № 1. С. 41-47.
[ГОСТ 2003] ГОСТ Р ИСО/МЭК 12207-99. Информационная технология.
Процессы жизненного цикла программных средств. Дата введения 01.07.2003.
[Данилов 2006] Данилов Н. Н. Курс математической экономики. М.: Высшая
школа, 2006 г. 408 с.
[Жернаков 2010] Жернаков С.В. Методология системного анализа для решения
проблемы информационного мониторинга состояния авиационного двигателя
// Вестник УГАТУ, Уфимский государственный авиационный технический
университет, Уфа, 2010, Т. 14, № 3 (38). С. 84–100.
[Муромцев 2005] Муромцев Д.И. Введение в технологию экспертных систем.
СПб: ГУ ИТМО, 2005. 93 с.
[Шведин 2010] Шведин Б.Я. Онтология предприятия: экспириентологический
подход: Технология построения онтологической модели предприятия. М:
Ленанд, 2010. 240 с.
[Martin 1989] Martin, J. Information Engineering: Book I - Introduction. Englewood,
NJ: Prentice Hall, 1989.
Download