ПРЕДСТАВЛЕНИЕ И ОБСЛУЖИВАНИЕ РЕГУЛЯРНЫХ ИНФОРМАЦИОННЫХ ЗАПРОСОВ В ХРАНИЛИЩАХ ДОКУМЕНТОВ НА БАЗЕ СИСТЕМЫ VEDA М.М.Денисов, К.И.Костенко Кубанский государственный университет, Краснодар Тел.: (8612) 69-95-50, e-mail: [email protected] Краткое представление о системе VEDA Система VEDA предназначена для работы с информацией, содержащей профессиональные знания специалистов, и ориентирована на использование технологий обработки знаний при решении задач пользователей. Данные в системе представляются документами, структурированными на основе иерархических шаблонов или форм, разрабатываемых с учетом предметной области. Компонентами форм могут быть формы (элементарные и сложные), варианты выбора, итерации форм или ссылки на другие документы. Значения полей документов соответствуют диаграммам структур значений: таблиц решений, записей правил, предложений заданной конструкции, отдельных терминов. Определение регулярной информационной потребности Информационные задания пользователей информации, размещенной на базе системы VEDA, могут быть разовыми или регулярными. Информационная потребность является регулярной, если представляющие ее запросы предполагают обработку как размещенных, так и размещаемых материалов в течение определенного времени. Параметры информационных потребностей С каждым регулярным клиентом в системе VEDA связан специальный паспорт, который состоит из информационных заданий, содержащих несколько запросов к хранилищу документов вместе с описанием параметров информационного обслуживания. Специальными параметрами информационных заданий являются: регулярность обслуживания, режим работы с модифицируемыми документами, формат предоставления найденных материалов, учет внешних параметров, продолжительность существования. Ассоциативный подход к поиску информации Поддержка обязательного для материалов, размещаемых на базе VEDA, структурного описания информации, делает возможной обработку данных, основанную на понимании смысла содержимого поля знаний предметной области, представленного отдельными полями, документами и группами документов. В основе механизмов поиска и обработки информации хранилищ документов лежит построение ассоциаций, состоящее в сопоставлении задания на обработку с материалами профессионального поля знаний. Величина ассоциации оценивается на основе критериев совпадения, аналогии, сходства и подобия. Для построения информационного образа, соответствующего описанию задачи или запроса используются механизмы унификации, обобщения и синтеза. Поисковые запросы Поисковый запрос является элементом информационного задания клиента. Он создается для отдельной формы, и исполняется для документов в этой форме или ее продолжениях. Структура запроса представляет собой иерархию, на каждом уровне которой указаны: имена, веса и признаки обязательности выполнения подзапросов, пороговое значение суммарного веса выполненных подзапросов. Листья иерархии запроса соответствуют элементарным запросам, содержащим шаблоны полей документов или условия на значения этих полей. Заказы, которые не сопоставлены ни одной форме, называются неопределенными. Они содержат только условия на значения полей определенных типов и выполняются для всех документов, включающих поля с заданными типами значений. Логические запросы, составляемые из сравнений с помощью логических связок, являются частным случаем поисковых запросов. Структуры хранения запросов Задания пользователей создаются специальным клиентским приложением и размещаются в базе хранилища запросов для модуля информационного обслуживания системы VEDA. Структуры представления заданий и их компонент организованы так, чтобы оптимизировать процесс обработки потока входных документов хранилища за счет уменьшения числа проверок. Для этого в системе VEDA предусмотрена возможность учета таких зависимостей между запросами как: следование, несовместимость, наличие общих фрагментов в разных запросах. Схемы обработки потоков документов Информационное обслуживание системы заданий пользователей состоит в выделении из входного потока документов, размещаемых в хранилище, таких материалов, которые соответствуют запросам пользователям. При этом новые задания клиентов могут включать дополнительный режим предварительной обработки уже имеющихся документов. Модуль документов хранилища формирует списки размещаемых документов в специальных структурах модуля информационного обслуживания. Каждый такой документ обрабатывает информационное пространство размещенных запросов, выделяя те из них, которые являются выполнимыми. Процесс выделения запросов, соответствующих заданному документу, начинается с определения выполнимости всех независимых элементарных условий, После этого начинает исполняться механизм сборки подзапросов в запросы верхних уровней, который заканчивается созданием списка всех запросов, выполнимых для документа.