МНОГОФУНКЦИОНАЛЬНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА T–LIBRA С МУЛЬТИМОДАЛЬНЫМ РАСШИРЕНИЕМ ДЛЯ ГУМАНИТАРНОГО ОБРАЗОВАНИЯ И ГУМАНИТАРНЫХ ИССЛЕДОВАНИЙ С.Х. Ляпин, А.В. Куковякин Некоммерческое партнерство «Центроконцепт» г. Архангельск ВВЕДЕНИЕ: О МЕСТЕ И РОЛИ ЭЛЕКТРОННОЙ БИБЛИОТЕКИ Электронная библиотека может стать эффективным инструментом по информационной поддержке гуманитарного образования и гуманитарного исследования, основой которых является многоплановая работа с различными «текстами»: первоисточниками, монографиями, учебниками, статьями, справочниками и т.д. Для этого она должна быть ориентирована на автоматизированные интеллектуальные сервисы по гибкой тематической обработке полнотекстовой и связанной с ней нетекстовой информации, на различные формы репрезентации результатов поиска, приспособленные к функциональному назначению ее подсистем (обучение, исследование, создание тематической экспозиции и т.д.). Именно наличием такого рода интеллектуальных сервисов (а не электронной формой первичных ресурсов) электронная библиотека принципиально отличается от традиционной «бумажной». Два момента важны для реализации этого подхода. Во-первых, для осуществления гибкой многофункциональной тематизации запроса поисковая система библиотеки должна «доставать» до отдельного предложения или авторского абзаца первичного ресурса (книги, статьи и т.п.), а также предоставлять пользователю возможность произвольной компоновки результатов запроса. Во-вторых, архитектура электронной библиотека должна обладать возможностями ее мультимодального расширения — то есть включения в ее ресурсную базу нетекстовых модальностей информации (графика, звук, видео и т.д.), а в ее функционал — унифицированного поиска по гетерогенным базам данных. Такая библиотека de facto берет на себя существенную часть образовательных, исследовательских и презентационных функций, которые находятся за пределами традиционной библиотеки. Она становится многофункциональной информационной средой, архитектура и функционал которой позволяет использовать ее как в рамках традиционной («аудиторной»), так и дистанционной технологии обучения, как в качестве простого поставщика первичных ресурсов для гуманитарных исследований, проводимых традиционными методами, так и в качестве нового эффективного инструмента таких исследований [1]. ЭБ T–LIBRA: АРХИТЕКТУРА И ФУНКЦИОНАЛ Вышеназванным требованиям отвечает электронная библиотека T-Libra (разработка ООО «Константа» и НП «Центроконцепт», Архангельск, Россия), созданная в архитектуре «клиент-сервер» (Web-browser / Web-server / SQL-server) и работающая под управлением СУБД Sybase ASA v.7.0. [2]. Выбранная архитектура позволяет достичь оптимального сочетания, с одной стороны, универсальности и эффективности обработки информации (за счет мощной реляционной СУБД, а также специально разработанной объектно-ориентированной среды Х-Taurus) и, с другой стороны, удобства для конечного пользователя — за счет использования на стороне клиента стандартного Web-браузера. Версии ЭБ T-Libra 5.0. и 5.1. с 2003 года используются в ННОУ «Институт управления» (г. Архангельск) и в его филиалах в рамках как аудиторной, так и дистанционной технологий обучения. В настоящее время на платформе T-Libra ведется разработка нескольких специализированных библиотек (для медицины, экологии, культуры). При этом их архитектура проектируется с использованием различных СУБД (Sybase ASA, MS SQL Server, Oracle SQL Server, MySQL) и двух вариантов бизнес-логики приложений (внутренней логики, использующей особенности этих СУБД и реализуемой на языке SQL, и внешней логики, встроенной в СGIрасширение Веб-сервера и реализуемой на объектно-ориентированном языке C++). В варианте ЭБ T-Libra v.5.2. имеются следующие основные функциональные разделы и подразделы. Административный раздел включает в себя пять функциональных рабочих мест: 1) администратора системы; 2) оператора каталога; 3) оператора электронного словаря; 4) оператора депозитария; 5) оператора полнотекстовой базы данных. Опубликовано: Ляпин С.Х., Куковякин А.В. Многофункциональная электронная библиотека T-LIBRA с мультимодальным расширением для гуманитарного образования и гуманитарных исследований // Технологии информационного общества — Интернет и современное общество: труды VII Всероссийской объединенной конференции. Санкт-Петербург, 10 – 12 ноября 2004 г. — СПб.: Изд-во Филологического ф-та СПбГУ, 2004. С. 132 – 134. ISBN 5-8465-0294-6 Пользовательский раздел включает в себя три функциональные подсистемы, предназначенные для эффективного поиска и презентации информации: БД Каталог, БД Депозитарий, БД Полнотекстовый поиск. Каталог. Подсистема предназначена для поиска по библиографической информации, организованной в виде SQL-базы данных, и последующей презентации в среде Веб-браузера всех ресурсов, имеющихся в электронной библиотеке (как в файловых, так и в реляционных базах данных). Поиск осуществляется с учетом морфологии по 8-ми полям: «Автор», «Заглавие», «Ключевые слова», «Аннотация», «Год издания», «Предметная область», «Библиотечные фонды», «Носитель информации». Булева алгебра включена в функционал соответствующих полей и структуру формы поиска. Поле «Предметная область» фактически представляет собой настраиваемый мультирубрикатор, включающий набор стандартных классификаторов (ББК, УДК, ВАК, ГРНТИ). Депозитарий. Подсистема содержит файловые ресурсы различного формата и информационной модальности (символьный текст, текст в виде графических файлов, собственно графика, аудио, видео и т.д.), соотнесенные с теми или иными предметными областями: учебными дисциплинами, научными направлениями, тематикой выставок и т.д.). Она имеет собственный рубрикатор ресурсов, настраиваемый пользовательский интерфейс, и является принципиально важной для мультимодального расширения ЭБ T-Libra с целью создания на ее основе специализированных оболочек для образования, исследований, виртуального музея и архива. Полнотекстовый поиск. Подсистема организована как совокупность гибких параметризируемых запросов к полнотекстовой SQL-базе данных. Именно она ориентирована на компьютерную поддержку тех видов деятельности пользователя, в основе которой лежит многоплановая работа с текстом первоисточника. В архитектуре подсистемы предусмотрены: а) блок электронных словарей с программой автоматической генерации словоформ естественного языка (в версии 5.2. имеется около 1 млн. словоформ русского языка); б) блок гибких параметризируемых поисковых запросов (в версии 5.2. представлены 2 типа и 6 видов таких запросов); в) блок функциональных моделей смыслового (концепт-ориентированного) поиска (в версии 5.2. не представлен). Методологически и технически в системе запросов выделяются: а) единицы поиска (в зависимости от вида запроса это могут быть термины, цепочки терминов, многослойные терминологические структуры и т.д.), б) единицы результатов поиска (произвольное предложение или авторский абзац, частотноранжированная совокупность терминов и т.д.), в) единицы представления результатов поиска (авторский абзац, таблица частотно-ранжированных терминов и т.д.). В версии 5.2. реализованы 2 типа запросов: «Абзацно-ориентированный поиск» и «Частотноориентированный поиск», каждый из которых представлен тремя видами. Первый тип запросов ориентирован на экспликацию терминологических полей в пределах естественной смысловой единицы текста — авторского абзаца. Второй тип — на частотный анализ текста и построение частотноранжированных таблиц терминов, «терминограмм» произведения или совокупности произведений. ОТ T–LIBRA К T–EDUCATION: ЭКСПЛИКАЦИЯ УЧЕБНОЙ «ТЕМЫ» НА ОСНОВЕ ГИБКОГО ПАРАМЕТРИЗИРУЕМОГО ПОЛНОТЕКСТОВОГО ПОИСКА Экспликация учебной «темы» (проблемы, аспекта) может быть произведена с помощью одного из запросов или их сочетания (каскадный запрос). Пример одного из абзацно-ориентированных запросов: многослойный терминологический поиск. Производится по нескольким терминам, которые одновременно: а) принадлежат разным условным тематическим «слоям» терминов, при этом количество слоев в форме запроса варьируется (от 2 до 9) и б) находятся на определенном «расстоянии» между собой (которое также варьируется пользователем). Запрос позволяет на некотором терминологическом поле, определяемом всеми терминами запроса, фиксировать смысловую связь между терминами, относящимися к разным слоям. Результатом запроса является совокупность авторских абзацев из выбранного произведения (или произведений), содержащих указанную многослойную терминологическую структуру, а тем самым опосредованно, через содержание множества абзацев — экспликацию темы (проблемы), определяемую структурой пользовательского запроса. Изменяя пять параметров запроса: 1) содержание списков терминов в каждом из слоев, 2) количество терминов, включаемых в каждый из слоев, 3) количество слоев, включаемых в запрос, 4) количество слоев, реально учитываемых при поиске, 5) расстояние между терминами, принадлежащими разным слоям, можно производить своеобразную смысловую фокусировку поиска, — варьировать смысловую плотность и тематическое содержание эксплицированного материала. Опубликовано: Ляпин С.Х., Куковякин А.В. Многофункциональная электронная библиотека T-LIBRA с мультимодальным расширением для гуманитарного образования и гуманитарных исследований // Технологии информационного общества — Интернет и современное общество: труды VII Всероссийской объединенной конференции. Санкт-Петербург, 10 – 12 ноября 2004 г. — СПб.: Изд-во Филологического ф-та СПбГУ, 2004. С. 132 – 134. ISBN 5-8465-0294-6 Образовательный функционал T-Libra существенно расширяется за счет специализированной оболочки Educator, включающей в себя инструментарий для более тонкой настройки тематического поиска и презентации его результатов. ОТ T–LIBRA К T–RESEARCH: ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ДЛЯ ГУМАНИТАРНЫХ ИССЛЕДОВАНИЙ НА ОСНОВЕ ГИБКОГО ПАРАМЕТРИЗИРУЕМОГО ПОЛНОТЕКСТОВОГО ПОИСКА Для широкого спектра гуманитарных исследований (лингвистика, история, философия, культурология, юриспруденция, экономика и т.д.), в том числе междисциплинарных, принципиально важной является возможность компьютерной обработки «текста», — различных по содержанию полнотекстовых ресурсов, существующих в виде SQL-базы данных. Эта возможность реализуется как в собственной поисковой системе T-Libra, так и в ее расширении с помощью программной оболочки Researcher. Это расширение (над ресурсной и поисковой базой T-Libra) позволяет создать совокупность виртуальных экспериментальных установок (ВЭУ), представляющих собой программные комплексы, каждый из которых предназначен для решения исследовательских задач определенного типа [3]. В действующей версии библиотеки с вышеназванным расширением имеются четыре ВЭУ, каждая из которых снабжена собственным интерфейсом для организации поиска и презентации результатов: «Анализ и моделирование словообразования»; «Анализ и моделирование микроконтекста»; «Анализ и моделирование макроконтекста»; «Экспликация культурных концептов». ЛИТЕРАТУРА 1. Ляпин С.Х., Куковякин А.В. Многофункциональная информационная среда T-System в архитектуре Web-browser / Web-server / SQL-server для гуманитарных исследований и гуманитарного образования //Материалы межд. конф. «Гуманитарные исследования и гуманитарное образование на Европейском Севере». — Архангельск: Изд. Поморского ун-та, 2002. С. 424–433. 2. Ляпин С.Х., Куковякин А.В. Многофункциональная электронная библиотека T-Libra: WWSархитектура, интегрированный каталог, настраиваемый мультирубрикатор, гибкий параметризируемый полнотекстовый поиск //Труды 5-й Всеросс. науч. конф. «Электронные библиотеки: перспективные методы и технологии, электронные коллекции», RCDL’03, СанктПетербург, 29–31 октября 2003 г. — СПб, Изд-во СпбГУ, 2003. С. 292–299 [http://rcdl2003.spbu.ru/proceedings/J4.pdf]. 3. Ляпин С.Х., Куковякин А.В. Виртуальная лаборатория для гуманитарных исследований на основе электронной библиотеки с гибким полнотекстовым поиском //Труды 6-й Всеросс. конф. «Научный сервис в сети ИНТЕРНЕТ», г. Новороссийск (п. Дюрсо), 20–25 сент. 2004 года. — М.: Изд-во Московского государственного университета, 2004 (в печати). Опубликовано: Ляпин С.Х., Куковякин А.В. Многофункциональная электронная библиотека T-LIBRA с мультимодальным расширением для гуманитарного образования и гуманитарных исследований // Технологии информационного общества — Интернет и современное общество: труды VII Всероссийской объединенной конференции. Санкт-Петербург, 10 – 12 ноября 2004 г. — СПб.: Изд-во Филологического ф-та СПбГУ, 2004. С. 132 – 134. ISBN 5-8465-0294-6