Коорпоративная Информационная система Сибирского отделения РАН Шокин Ю.И., Федотов А.М. Объединенный институт информатики СО РАН “Многие вещи нам не понятны не потому, что наши понятия слабы: но потому, что сии вещи не входят в круг наших понятий”. К.П.Прутков Информационные ресурсы Современные информационные технологии и широкое развитие сети Интернет вызвало к жизни принципиально новые виды информационных ресурсов - электронные публикации и коллекции, обличенные в форму электронных библиотек. Важнейшей частью Информационной среды Сибирского отделения РАН является информационная поддержка научных исследований и организационных мероприятий, проводимых в Отделении, а также создание и развитие собственных информационных ресурсов, управление этими ресурсами. А также обеспечение использования информационных ресурсов мирового научного сообщества, представляемых сетью Internet и распространение своих достижений в виде электронных коллекций, атласов и информационных систем и электронных публикаций. Информационные ресурсы В Отделении накоплена и постоянно собирается уникальная научная информация как по различным отраслям наук, так и по природному комплексу. Но к сожалению пока отсутствует единая технология сбора информации, разобщенность ее как по месту хранения, так и по форме представления и что самое главное отсутствует информация об информации. Все это не позволяют широко использовать информационные ресурсы для интенсификации и кооперации междисциплинарных фундаментальных и прикладных исследований. В силу не зависящих от нас причин, происходит непрерывное уменьшение внешних контактов сотрудников Отделения (особенно молодых), уменьшается число командировок, поездок на конференции, количество приходящих в библиотеки журналов и т.д., а это в свою очередь приводит к дальнейшему уменьшению количества информации об информации. Информационные ресурсы Существенной проблемой, связанной с информационными ресурсами Отделения, является факт "гибели" информации, вызванный постоянным оттоком кадров исследователей и технического персонала, ответственного за ее хранение. Отсутствие основной информации (или отсутствие информации об этой информации), необходимой для научных сотрудников приводит к чрезмерной перегрузке внешних каналов сети Интернет ННЦ. Для решения проблемы информационной недостаточности необходимо создание собственной универсальной информационной системы Отделения, в которой бы аккумулировалась большая часть необходимой для сотрудников информации (как собственной, так и внешней), включая создание полнофункциональной системы об интеллектуальном потенциале Отделения (информационную систему об институтах и сотрудниках Отделения) и создание и поддержку "Электронной библиотеки Сибирского отделения РАН". Информационная система СО РАН Информационная система Сибирского отделения призвана обеспечить: Единую информационную среду Отделения, основанную на современных сетевых средствах и перспективных информационных технологиях. Информационную поддержку проведения исследований по фундаментальным и прикладным направлениям, проводимым в институтах Отделения, а также межинститутских междисциплинарных научных исследований. Информационная система СО РАН Поддержку профессиональноориентированных систем подготовки и обмена научных документов с элементами удаленной совместной работы. Поддержку профессиональноориентированных систем доступа и интерфейсов с банками данных и автоматизированными библиотеками. Поддержку перспективных систем телекооперации исследователей на базе современных телекоммуникационных и информационных технологий. Информационная система СО РАН Коллективное использование приобретаемой электронной литературы, реферативных журналов и т.п. Ведение электронных каталогов и оглавлений научных периодических изданий, выходящих в мире. Поддержку электронных версий научных журналов, издаваемых институтами Отделения. Издание собственных электронных журналов, книг, препринтов и дайджестов по различным направлениям научных исследований. Поддержку принятия и реализации организационных и управленческих решений в Отделении и документооборота. Информационная система СО РАН Организационно-технологическое обеспечение процесса создания полнофункциональной информационной системы Отделения включает в себя большой спектр работ, связанных с организацией системы доступа пользователей к информационно-вычислительным ресурсам и к базам данных, сохранение, поддержку и создание информационных ресурсов Отделения и «Электронной Библиотеки Отделения». Самое главное воспитание нового пользователя, способного жить и работать в современном информационном мире. Электронные библиотеки В той или иной форме идея электронной библиотеки уже работает во многих университетах и крупных библиотеках ведущих стран мира. Например, электронная "библиотека XXI века" создается в Японии путем соединения усилий Агентства по внедрению новых технологий, Национальной парламентской библиотеки, целого ряда министерств, более 20 библиотек и культурных центров. Электронные библиотеки Несколько лет назад Библиотека Конгресса США начала реализацию национальной программы создания электронной библиотеки; примерно в это же время по инициативе NSF, DARPA и NASA в США была развернута исследовательская программа Digital Library Initiative (DLI) по электронным библиотекам. На второй стадии развития в начале 1998 года эти программы были объединены в единую межведомственную программу DLI - Phase 2, в которой, кроме того, участвуют Национальная медицинская библиотека, Агентство по статистике США, Национальный гуманитарный фонд, Национальный архив США и другие федеральные агентства. Электронные библиотеки Начиная с 1995 года осуществляется проект создания электронных библиотек для стран G7. В Англии начиная с 1998 года работает национальная программа UKOLIN, по созданию национальной сети электронных библиотек. В последние годы многочисленные разрозненные проекты стали превращаться как в национальные программы создания электронных библиотек, так и в международные программы. Электронные библиотеки Создание распределенной сети электронных библиотек требует вложения значительных ресурсов и координации усилий различных федеральных, региональных и местных органов власти, общественных и коммерческих структур, действующих в области формирования и использования электронных информационных ресурсов. Необходимы проведение полномасштабных научных исследований и разработка программно-технологических средств обработки информации нового поколения, создание современной телекоммуникационной инфраструктуры и сети компьютерных центров для проведения высокопроизводительных вычислений. Электронные библиотеки Основное различие традиционной библиотеки и электронной библиотеки заключается в том, что пользователь обращается к сервисам последней за необходимой информацией, а не просто за отсылками к документу и/или самими документами. Отличительной чертой электронной библиотеки является возможность параллельного использования различных поисковых механизмов и средств доступа к гетерогенным банкам электронных данных. Так как в качестве ответа на запрос к электронной библиотеке пользователю может быть представлен далеко не единственный электронный документ (или его фрагмент) и совсем не обязательно в текстовой форме, необходимы такие информационные системы, которые обеспечат эффективный комплексный поиск и анализ информации в коллекциях гетерогенных объектов. Электронные библиотеки Не менее важным является решение проблемы представления разнородной информации в удобном виде для конечного пользователя, что требует новых исследований и разработок в области человекомашинных интерфейсов. Другой особой задачей при создании электронных библиотек являеться согласование используемых стандартов (в первую очередь - выполнению требований интероперабельности), технологических решений, юридических аспектов их использования (включая вопросы интеллектуальной собственности). Электронные библиотеки В начальной стадии электронные библиотеки представляют собой сеть распределенных депозитариев (коллекций), где объекты любого типа могут быть отысканы в индексированных коллекциях электронных документов. Технологии создания библиотек должны развиться так, чтобы можно было осуществить прозрачный поиск непосредственно в самих депозитариях с учетом различных используемых протоколов и форматов представления данных. Электронные библиотеки Технологии информационного поиска должны позволить осуществлять прозрачный поиск, учитывающий изменения как в содержании, так и в смысле накопленной информации. Это - последовательные шаги на пути удовлетворения запросов пользователей по отысканию информации: документ - данные - знание. Электронные библиотеки Множественный взгляд на распределенные депозитарии электронных документов означает, что различные механизмы информационного поиска могут и должны быть одновременно использованы для поиска в сети. Среди них - словари тезаурусы предметных областей, частотные списки, контекстный поиск, поиск по фрагменту образа и т.п. Так, например, для работы с полнотекстовыми базами данных пользователи должны иметь возможность применять любой из подходящих механизмов, чтобы в интерактивном режиме получать оптимальный результат. Электронные библиотеки Необходимо отметить, что для работы с большими объемами полнотекстовой информации особое значение имеют средства поиска по свободной лексике естественных языков. Русский язык обладает существенными особенностями, не позволяющими эффективно использовать для этой цели зарубежные программные средства, ориентированные, например, на английский язык. Электронные библиотеки Последние годы, несмотря на социальноэкономический кризис в России, наблюдается заметный прогресс в использовании современных информационных технологий. В стране выщело несколько сотен электронных изданий на компактных оптических дисках, возникли сотни российских Web-серверов в глобальной сети Internet, содержащих разнообразную научную, культурную, образовательную, массовую и другую некоммерческую информацию. Тысячи исследовательских и учебных организаций, библиотеки, музеи, архивы имеют компьютерное оснащение и подключены к Internet. Электронные библиотеки Основные направления деятельности: создание средств организации хранения больших и сверхбольших объемов информации; создание средств средств поиска разнородной информации; разработка интероперабельных систем; разработка пользовательских средств и интерфейсов. Электронная библиотека Для обесперчения работ в этом направлении необходимо: создание средств хранения, доступа и обработки больших массивов распределенной информации; создание системы поддержки интеллектуального интерфейса; создание системы формирования и эксплуатации корпоративных информационных ресурсов и информационного обеспечения; создание системы защиты информации; лицензионная поддержка; обеспечение нормативно-правовой базы создания и использования информационных ресурсов; создание и поддержка интегрированной системы предоставления фактографической информации. Электронная библиотека Основные направления работ: создание информационных систем, обеспечивающих эффективный комплексный поиск и анализ информации в коллекциях разнородных объектов; представление разнородной информации в удобном виде для конечного пользователя; разработка удобных человеко-машинных интерфейсов, направленных в том числе на поиск и актуализацию данных; согласование используемых стандартов и технологических решений (выполнение требований интероперабельности); решение вопросов защиты информации и авторизации доступа к информации; решение юридических вопросов использования электронных информационных ресурсов, включая вопросы авторского права и интеллектуальной собственности. Основной принцип построения информационной системы заключается в организации доступа к информации через WWW сервис Internet. Web Сервер Хранилище данных СУБД Сервер данных Internet/Intranet Сервер метаданных Web клиент Web клиент Web клиент Web клиент Internet/Intranet технологии Использование Internet/Intranet технологии при построении информационных систем как общего назначения так и специализированных в ближайшее время станет доминирующим в мировом информационном пространстве по следующим простым причинам: Минимальные требования к рабочему месту клиента. Организация с достаточной системы поиска информации. Поддержка распределенной системы хранения информации и множественных методов ее хранения. Работа с практически объемом разноплановых графика, изображение, векторные карты и др.). Технологически простой способ администрирования информационных систем с одного рабочего места. Поддержка удаленных методов редактирования и пополнения информации. простотой неограниченным данных (текст, звук, видео, Информационные ресурсы WWW сервер СО РАН Сервер содержит разнообразную информацию о деятельности Сибирского Отделения: институты и сотрудники, основные даты, конференции, годовые отчеты, Сеть Интернет ННЦ, информационные ресурсы, доска, объявлений, электронная библиотека СО РАН Информационные ресурсы Информационный WWW сервер Сибирского Отделения РАН http://www-sbras.nsc.ru/ содержит разнообразную информацию о деятельности Сибирского Отделения: научноисследовательские и конструкторскотехнологические институты; основные результаты исследований; интеллектуальный (научный) потенциал Сибири и СО РАН; конференции СО РАН; поддержка исследований в области математики; важнейшие разработки Институтов СО РАН, предлагаемые для широкого использования; "Сеть Internet Новосибирского научного центра'', а также справочные материалы по информационным ресурсам, правовой базе науки, информатизации и др. Сибирское отделение РАН В Отделения состоит из Научных центров, расположенных в разных городах Сибири, в состав которых входят от 8 до 60 научных или констукторскотехнологических институтов и других организаций. В этой связи информационная система спроектирована, как распределенная система с многими информационными центрами и многоуровневым доступом. В настящий момент работают следующие: • публичный, • внутренний, • служебный, • административный уровни доступа. Сибирское отделение РАН Информационные ресурсы Информационная система СО РАН Электронная Библиотека СО РАН Хранилище данных (центральный диспетчер) Сервер обработки запросов SQL для доверительных БД В основу технологических решений заложены принципы обработки метаописаний данных на основе сервера метаданных. Для СУБД не имеющих средсв сетевого доступа используется «стандартный» HTTP-SQL шлюза для организации доступа к данным . Сервер Z39.50 Серверы метаданных Серверы каталогов HTTP(FTP)-SQL шлюз БД БД SQL-БД SQL-БД ODBC Локальные HTTP БД БД Взаимодействие БД Организация доверительных БД - организуется через машину-посредник (шлюз) Internet Шлюз SQL Z39.50 Шлюз БД БД БД БД БД БД SQL Z39.50 Взаимодействие с БД внутри сети Использование сервера. API интерфейса Клиент CGI или API программа WWW JDBC DBI База данных ODBC СУБД WWW Взаимодействие с БД внутри сети Использование сервера. API интерфейса HTML документ Клиент WWW сервер запрос Сервер приложений Appl ГИС система (сервер) БД WWW Информационные ресурсы Средства хранения, доступа и обработки больших массивов распределенной информации; Системы интеллектуального интерфейса; Развитие информационных технологий (ГИС-технологий, Интернет-технологий); Системы формирования и эксплуатации корпоративных информационных ресурсов; Системы защиты информации; Лицензионная деятельность; Обеспечение нормативно-правовой базы создания и использования информационных ресурсов; Создание и поддержка интегрированной системы предоставления фактографической информации. Поддержка и формирование системы информационного обеспечения СО РАН. Информационные ресурсы Электронная Библиотека СО РАН Разработанная технология была использована при реализации целевой программы Сибирского Оделения «Электронная библиотека Сибирского Отделения РАН». Технология позволяет оперативно управлять информацией и актуализировать данные, хранящиеся в разнородных и распределенных по сети базах данных. Электронная библиотека Динамическая система формирования документов Объектная модель документа Поиск информации Формирование документа SGML HTML PS(PDF) TeX PTF Документ Объект Список объектов: Объект -> Типы объектов: простые type сложные meta Простой объект: echo строка link текст таблица Сложный объект: объект документ ссылка Информационные ресурсы Динамическая система электронных публикаций Разработана концепция динамической системы формирования электронных документов с среде Интернет, в основе которой лежит представление документа, содержащего информацию о конкретных фактах, в виде набора объектов со своими характеристиками и атрибутами. При реализации используется трехуровневая модель представления данных и метаданных, поддерживаемая стандартом CORBA. Информационные ресурсы Динамическая система электронных публикаций Разработаная система использована при создании информационных ресурсов Отделения, в том числе при разработке «Публичной доски объявлений СО РАН», информационого сервера «Геоинформационные технологии в СО РАН», Информационной системы «Конференции» и др. В частности ИС «Конференции» активно используется институтами ННЦ (ИК СО РАН, ЦСБС СО РАН, ИЦиГ СО РАН и др.). Электронная библиотека Электронная библиотека Электронная библиотека Электронная библиотека Информационные ресурсы Научный Потенциал Сибири Информационная система “Интеллектуальный потенциал Сибирского Отделения РАН”, является составной частью информационной системы научный потенциал Сибири. Система состоит из двух связанных между собой баз данных: научные центры СО РАН и научно-исследовательские организации и научные сотрудники. Доступ к базам данных, а также их актуализация осуществляется серез сеть Интернет с помощью стандартных средств просмотра WWW страниц. Электронная библиотека Электронная библиотека Электронная библиотека Золотые пояса Якутии Электронная библиотека Золотые пояса Якутии Электронная библиотека Золотые пояса Якутии Электронная библиотека СО РАН Электронная библиотека СО РАН ГИС и технологии Internet Автомобильные дороги Новосибирской области ГИС и технологии Internet Автомобильные дороги Новосибирской области ГИС и технологии Internet Автомобильные дороги Новосибирской области Электронная библиотека Электронная библиотека Электронная библиотека Электронная библиотека Электронная библиотека Информационные ресурсы Принцип динамической системы формирования электронных коллекций Разработаны основные технологические принципы формирования распределенных электронных коллекций в среде Интернет, базирующиеся на объектной модели электронных документов. Разработанная технология была использована при разработке «Электронного атласа Биоразнообразие животного и растительного мира Сибири» и применяется при создании и поддержки электронных ресурсов Отделения в рамках программы «Электронная библиотека Сибирского отделения РАН» Коллекция: метаинформация, стиль Документ: метаинформация, стиль ОБЪЕКТ: метаинформация Технологические решения Электронная коллекция в нашем понимании - это набор документов, которые содержат фактографическую информацию имеющую одинаковое формальное описание структуры. Работа с любой электронной коллекцией разделяется на две части: работа с описаниями коллекции и документов (работа с метаинформацией) и работа с содержательной частью коллекции (работа с фактографической информацией). Коллекция: набор однотипных документов -- характеризуется своим описанием и стилем коллекции, а также описанием структуры, входящих в нее документов. Документ: характеризуется своим описанием и стилем документа, а также описанием характеристик (атрибутов, свойств и функций) объектов его составляющих. Объект: определяется заданием типа объекта и описанием его атрибутов, свойств и функций. Технологические решения Структура информационного объекта представлена в следующей таблице: атрибут Тип Значение Свойства Функции назначение тип объекта информационная (фактографическая) часть объекта метаописание объекта характеристика определяет способ работы с объектом может отсутствовать название, способ выдачи, и т.п (см. ниже) использование исполняемых способ поиска, навигация, модулей связи, статистика и т.п. Динамическая система формирования документов Документооборот Отчеты Постановления Распоряжения Письма Проекты Конкурсы Разработки E-mail анкета Web форма Поступление документа Разбор докумета Шаблоны документов администратор Корректировка публикация рассылка Индексация и запись в каталог и БД Технологические решения Функции объектов Функции объекта, определяются клиентом, и связаны с включения информационной части в поиск (контекстный или специальный), в навигацию (индексацию), экспорта и импорта информации. Функции специального (квалифицированного) поиска информации позволяют: оперативно составлять списки типов сообществ необходимые для инвентаризации биоразнообразия определенных территорий; получать карты распространения (точечные и контурные) типов сообществ различного ранга на любые территории; получать списки видов (с весовыми характеристиками каждого вида) определенных экосистем; Технологические решения Функции объектов оценивать ресурсную значимость определенных типов экосистем; получать списки и ареалы редких и находящихся под угрозой исчезновения сообществ на любой территории; получать разностороннюю информацию об экологических условиях, фитосреде и распространении редких, исчезающих, декоративных, ценных ресурсных видов (по поиску их в составе определенных типах экосистем). Информационные ресурсы Электронные коллекции На базе данной технологии разработана автоматизированная система проектирования электронных коллекций и администрирования СУБД “АТЛАС”, предназначеная организации разнородной информации в удобном для конечного пользователя виде, стандартизации данных (прежде всего соблюдение требований интероперабельности). Отличительной чертой создаваемой системы (электронной библиотеки) является возможность параллельного использования различных поисковых механизмов и средств доступа к разнородным банкам электронных данных Информационные ресурсы Электронные коллекции Созданная система позволяет использовать принципиально новые возможности которые предоставляют современные информационные технологии по накоплению, оперативному управлению большими объемами биологических данных и решения задач по сохране-нию биоразнообразия. Позволяет осуществлять комплексные исследования, научный прогноз и принятие обоснованных управленческих решений для рационального использования природных ресурсов.