БИБЛИОМЕТРИЧЕСКИЙ АНАЛИЗ ИНФОРМАЦИИ В БАЗАХ ДАННЫХ И ЭЛЕКТРОННЫХ КАТАЛОГАХ БИБЛИОТЕК С ИСПОЛЬЗОВАНИЕМ УДК И ГРНТИ Ефременкова В.М., Крючкова Е.А., Старцева О.Б. (ВИНИТИ РАН) 1. Введение Для библиотечной и информационной науки особую актуальность в настоящее время приобретает возможность анализа содержания и структуры классификационных систем, которая зависит от состояния технических и технологических возможностей. Одним из важнейших качественных признаков классификационной системы является стабильность на протяжении длительного времени без существенных изменений структуры и содержания. Это позволяет организовать процесс ее изучения на уровне общих принципов и устойчивых базовых характеристик, применяя библиометрические методы исследования. До сих пор библиометрические методы тематического анализа публикаций использовались лишь информационными системами разных стран, каждая из которых имеет в различной степени развитую систему классификации. УДК – единственный международный инфомационно-поисковый язык, используемый различными субъектами информационного рынка. По УДК работают крупнейшие библиотеки, его широко используют издатели, менеджеры при определении объемов и ассортимента книжного рынка. УДК может служить универсальным навигатором для поиска нужной литературы в книжных магазинах и книжных ярмарках в силу простоты построения основной классификационной таблицы УДК по отраслям знания. Все ведущие информационные центры мира имеют свои системы классификации не связанные друг с другом. Сопоставление различных классификационных систем представляет огромные трудности. Здесь УДК может помочь пониманию особенностей тематического содержания различных БД, используя таблицы соответствия классификаторов БД и УДК. 2. Практика индексирования документов с помощью таблиц УДК в международных БД Практика использования УДК информационными центрами принята лишь Японским информационным центром – Japanese Information Center of Science and Technology (JICST) и Российским информационным центром – ВИНИТИ. По УДК индексируются все публикации, отражаемые в 5 фрагментах БД ВИНИТИ: Информатика, Математика Издательское дело и полиграфия, География, Геология. В Государственном рубрикаторе научно-технической информации (ГРНТИ) для всех рубрик 1-3 уровней приводятся индексы УДК, которые могут использоваться как справочные при индексировании документов. С 1969 г. при формировании РЖ/БД «Математика» стала использоваться классификация УДК, при всех последующих изменениях классификатора РЖ/БД ВИНИТИ «Математика» разрабатывались таблицы соответствия между УДК и Рубрикатором информационных изданий ВИНИТИ. 3. Индексирование документов с помощью таблиц УДК в ВИНИТИ 3.1 Поиск документов в БД ВИНИТИ по рубрикам ГРНТИ и кодам УДК Для индексирования содержания документа по рубрикатору ГРНТИ используется одна рубрика, если публикация посвящена одной проблеме; для отражения многоаспектности указывается несколько кодов, каждый из которых соответствует различным узко-тематическим направлениям данной работы. Поиск по кодам УДК значительно сложнее из-за присутствия в многопрофильных кодах различных определителей и знаков, уточняющих содержание документа. В поисковой системе ВИНИТИ, к сожалению, не предусмотрен поиск по сложным индексам, типа определителей места, формы и др. Приведем пример поиска документов по кодам УДК в БД ВИНИТИ «Информатика» 2009 гг. Была поставлена задача найти документы, в которых присутствовала бы информация по следующим тематическим направлениям: - Центры документации (код УДК 002) - Системы управления БД (код УДК 004) - Теоретические проблемы информатики (код УДК 007). Для построения поискового предписания уточним содержание кодов и свяжем эти три кода с помощью : (знака отношения) ‘002.6:004.65:007.51’ После проведения поиска по этому поисковому предписанию находим документы, один их которых соответствует потребности пользователя: ‘002.6:004.65:007.51’ Аникин М. А., Брейман А. Д. Гибридная модель интеграции информации для корпоративных информационных систем с сервисно-ориентированной архитектурой Кл. слова: Информационные системы, сервисно-ориентированная архитектура, интеграция информации, гибридные модели, распределенная кэш-память Рубрики ГРНТИ, ВИНИТИ:20.23.21; 201.23.21.03 - «Разработка систем и банков данных» УДК 002.6:004.658:007.51 Центры документации Системы управления БД Общая теория связи и управления 3.2 Анализ документов в БД ВИНИТИ по рубрикам ГРНТИ и кодам УДК В режиме «анализа» поисковой системы ВИНИТИ можно выявить весь репертуар кодов УДК и их сочетаний, отражающих содержание публикаций в БД «Информатика». Ранжирование кодов и последующее суммирование количеств каждого из наиболее информативных кодов, отвечающих определенной тематике позволило построить диаграмму качественного и количественного распределения массива публикаций по всем рассматриваемым тематикам, охватываемым информатикой (рис.1). Как видно из рис.1 основная доля публикаций относится к библиотечному делу, системам НТИ и видам документов, представляющих библиотечное дело (около 86%). Из наиболее важных направлений, относящихся к работе библиотек с древнейших времен и до наших дней, связано с каталогами и составлением библиографий. Большое внимание в информатике всегда уделялось систематизации знания и различных отраслей техники и технологии, при этом не забывая о развитии образования, в частности информационного. В век информационных технологий получили развитие не только системы поиска, анализа; изменилась техника размножения документов на бумажных носителях; новые системы сканирования позволили обеспечить доступ широкому кругу читателей к редким старинным изданиям; системы интернета дали возможность «увидеть» работы, представленные авторами только в электронном виде. Именно поэтому мы видим рост публикаций по информационным технологиям (рис. 1) Библиотечное дело 43,94% Юридические науки 1,36% Образование 0,45% Библиография. Каталоги 2,13% Документация. НТИ 42,89% Информационные технологии 2,20% Наука и знание 7,03% Рис. 1. Распределение потока публикаций, проиндексированных по УДК, в БД «Информатика» по различным тематическим направлениям 1982–2009 гг. Библиометрический анализ, проведенный в БД «Информатика» 1982–2009 гг. по кодам УДК, отражает состояние и перспективы развития отдельных направлений. В рассматриваемый период времени поток публикаций достаточно стабилен по основным направлениям, рост отмечается только по тематическому направлению «информационные технологии» (Рис.2). 3.3. Сопоставление массивов публикаций, выделенных с помощью кодов УДК и рубрик ГРНТИ Объемы потоков публикаций отвечающих одному тематическому направлению близки по величине независимо от систематизации их по разным классификаторам. Сопоставление динамики распределения потоков публикаций, проиндексированных по классификаторам УДК и ГРНТИ, было проведено для одной из важных тем информатики: «Документация. Научно-техническая информация». 2500 Количество публикаций 2000 1500 1000 500 2007 2008 2009 2005 2006 2002 2003 2004 2000 2001 1997 1998 1999 1995 1996 1992 1993 1994 1990 1991 1987 1988 1989 1985 1986 1982 1983 1984 0 Год генерации БД Библиография. Каталоги Наука и знание Документация. НТИ Информационные технологии Юридические науки Библиотечное дело Образование Рис. 2. Динамика потока публикаций по основным направлениям, отражаемым в БД «Информатика» 1982–2009 гг. 2400 УДК 2200 Количество публикаций 2000 1800 1600 1400 ГРНТИ 1200 1000 2009 2006 2003 2000 1997 1994 1991 1988 1985 1982 800 Год генерации БД Рис. 3. Динамика распределения потоков публикаций, проиндексированных по ГРНТИ и УДК На рис. 3 видно, что динамика потоков публикаций проиндексированных по ГРНТИ и УДК подобны. Это говорит о том, что в равной степени можно пользоваться и УДК и ГРНТИ для поиска и анализа документов. Выводы 1. Объем публикаций в РЖ/БД позволяет выявить основные направления исследований, отражающиеся в РЖ/БД. 2. Приведенные примеры иллюстрируют проблемы, которые необходимо решать, используя УДК и ГРНТИ в современных поисковых системах.