Методы и средства организации документального поиска в

advertisement
УДК 001(06) Телекоммуникации и новые информационные технологии…
А.Е. ОКРОПИШИН
Национальный исследовательский ядерный университет «МИФИ»
МЕТОДЫ И СРЕДСТВА ОРГАНИЗАЦИИ ДОКУМЕНТАЛЬНОГО ПОИСКА В РАСПРЕДЕЛЕННЫХ ГЕТЕРОГЕННЫХ ИНФОРМАЦИОННЫХ РЕСУРСАХ
Рассматриваются методы и средства оптимизации процесса взаимодействия пользователя с распределенными гетерогенными информационными ресурсами, в основу которых положено построение описаний информационных ресурсов, представляющих их на уровне содержания и средств доступа. Возможность создания подобных описаний достигается за счет рассмотрения поискового ресурса с точки зрения классификации и описания средств и интерфейсов доступа к нему, используемого информационно-поискового языка.
Также рассматривается обобщенная модель информационно-поискового ресурса. Описывается разработанный программно-информационный комплекс, обеспечивающий унификацию пользовательского доступа к
гетерогенным информационным ресурсам с использованием единого интерфейса и языка поисковых запросов.
Для разработки программно-информационного комплекса, обеспечивающего унификацию пользовательского доступа к гетерогенным информационным ресурсам, была решена задача построения обобщенной
модели информационно-поискового ресурса с учетом особенностей его внутреннего устройства и особенностей доступа к нему и задача построения алгоритма трансляции поисковых запросов с исходного языка на
язык целевого информационного ресурса.
Возможность трансляции запроса для общего случая, с указанной точностью, была показана в математической модели трансляции запроса. Ее построение производилось с учетом природы поискового запроса
происходящей из свойств машинной логики фон-неймановской архитектуры. На основе этого, для запроса
было принято обобщенное представление, включающее ограниченный набор элементов (область поиска,
критерий сравнения, поисковый термин) и операторов булевой логики. В рамках математической модели
была построена функция трансляции запроса, включающая параметр, характеризующий точность трансляции, с точки зрения преобразования имен элементов метаданных. Для практического обеспечения интероперабельности на уровне метаданных предлагается использовать открытую глобальную таблицу соответствия
элементов метаданных различных форматов, имеющую механизмы добавления в нее своих наборов метаданных. Таблица имеет древовидную структуру, в которой все элементы метаданных вне зависимости от
формата объединены в семантические группы разного уровня детализации.
Основываясь на представленных данных о структуре запроса и виде функции трансляции запроса с исходного языка на язык целевого информационного ресурса, в составе информационно-аналитической системы xIRBIS был разработан модуль централизованного доступа к распределенным гетерогенным информационным ресурсам, обладающий унифицированным интерфейсом, независимо от конкретного ресурса, к
которому в данный момент осуществляется доступ, и унифицированным языком запросов для документального поиска; а также средствами трансляции поисковых запросов с исходного языка на язык целевого ресурса; в котором также была реализована функция каталогизации информационных ресурсов, позволяющая
пользователю добавлять описания информационного ресурса, указывая его основные параметры, включая
сведения о языке поисковых запросов, именах элементов данных, способах доступа и т.д.
Таким образом, представленные модели и средства обеспечивают переадресацию и адаптацию запроса
для проведения поиска в других ресурсах с учетом особенностей их ИПЯ.
Удобство и простота поиска в ресурсах, различающихся как по типу и средствам доступа, так и по внутренней структуре и набору элементов данных, достигается путем создания средств, включающих в себя
унифицированный интерфейс поиска, представляющий максимальное количество возможностей для работы
с распределенными ресурсами через собственный язык поисковых запросов. При этом обращение к внешним ресурсам происходит с учетом заранее каталогизированной информации о них и использованием методов трансляции поискового запроса на языки внешних ресурсов. Данные методы основываются на унифицированном описании языка информационного ресурса, позволяющем проводить однозначные преобразования операторов исходного языка в операторы целевого. Для преобразования имен элементов метаданных,
отражающих состав и структуру целевого ресурса, используется таблица соответствия элементов метаданных, имеющая древовидную структуру и представляющая на различных уровнях детализации описания
элементов данных, принадлежащих различным группам (автор, заглавие, дата и т.п.).
В дальнейшем разработанные подходы смогут также использоваться в целях развития единой научноинформационной среды для обеспечения эффективности проведения исследований на основе обращения к
уже созданным разработкам.
_______________________________________________________________________
ISBN 978-5-7262-1230-2. XIV выставка-конференция
1
Download