препринт

advertisement
АНАЛИЗ НАУЧНО-ИНФОРМАЦИОННОЙ ДЕЯТЕЛЬНОСТИ
(ЧТЕНИЕ, ПУБЛИКАЦИИ, ЦИТИРОВАНИЕ)
УЧЕНЫХ ИНСТИТУТА КАТАЛИЗА
ИМ. Г. К. БОРЕСКОВА СО РАН
В. В. Писляков, Е. Э. Любушко
В работе исследована научно-информационная деятельность ученых
Института катализа Сибирского отделения РАН. На материале
использования ими электронной базы данных периодических изданий
получено распределение статистических показателей чтения по журналам.
Для соответствующих изданий также посчитано количество статей,
опубликованных сотрудниками ИК, и число цитирований этих журналов.
Проводится анализ полученных показателей чтения, цитирования и
публикационной деятельности. Обнаруживается, что эти данные связаны
между собой статистически значимым образом.
Введение
В настоящее время библиометрический анализ показателей потребления (чтения,
цитирования) и производства (публикации) знания прочно вошел в инструментарий аудита
различных научно-информационных единиц. Распространены исследования публикаций и
цитирований на уровне отдельного ученого [1], журнала [2, 3], научного направления в
отдельном регионе [4] и целых государств [5, 6, 7].
Возможен в подобном анализе и фокус на одном или нескольких исследовательских
коллективах, работающих в определенной области знания. Например, в работе [8]
приводятся статистические данные по публикациям ученых химического факультета
Сеульского национального университета, а также по цитируемости этих работ.
Отечественное исследование [9] охватывает шесть научно-исследовательских институтов
СО РАН, специализирующихся на различных отраслях химии. В анализ вовлечены не
только данные о публикациях и их цитируемости, но также и сведения о цитировании
учеными указанных институтов других источников. Работа [10] включает в себя обзор
публикационной активности сотрудников Пущинского научного центра РАН и анализ
цитируемых ими журналов.
В последние годы также стали появляться работы, посвященные анализу чтения
научных статей и связи этого процесса с цитированием тех же публикаций. Показатели
чтения сложнее всего собрать (особенно в ситуации открытого доступа к фондам изданий),
и данное направление получило развитие благодаря возникновению коллекций
электронных научных документов, размещенных в сети Интернет, что сделало доступной
подробную статистику по обращению пользователей к публикациям.
Так, в [11] в рамках одного журнала («British Medical Journal») была найдена
корреляция между количеством загрузок полного текста в течение одной недели после
онлайновой публикации статьи с числом цитирований, полученных работой в течение
последующих пяти лет. Аналогичная связь прослеживается в результатах работы [12],
Владимир Владимирович Писляков, нач. отдела информационных систем и электронных ресурсов
библиотеки Государственного университета – Высшей школы экономики, г. Москва, Россия. E-mail:
pislyakov@hse.ru; Екатерина Эдуардовна Любушко, директор библиотеки Института катализа
им. Г. К. Борескова СО РАН, г. Новосибирск, Россия. E-mail: katia@catalysis.nsk.su.
1
изучающей чтение и цитирование электронных публикаций из ведущего научного
Интернет-архива открытого доступа arXiv.org. Исследование [13] пытается найти не
только влияние загрузок статей на их цитирование, но и обратный эффект: цитирование
той или иной электронной публикации может сказаться на увеличении активности ее
чтения. Здесь автор ограничивается одним журналом издательства Эльзевир —
«Tetrahedron Letters». Наконец, имеются примеры еще более тонких экспериментов — так,
в [14] на данных Лос-Аламосской национальной библиотеки отслеживается
последовательность открытия пользователями электронных статей, на основе чего
строится «журнальная сеть, порожденная читателями», которая впоследствии
сопоставляется с базирующейся на цитированиях «сетью, порожденной авторами».
Настоящая работа посвящена комплексному изучению «информационного поведения»
сотрудников одного из институтов СО РАН — Института катализа (ИК)
им. Г. К. Борескова. Выбор этого института объясняется двумя основными причинами.
Прежде всего, это один из ведущих российских центров химических исследований. Из
картины, обрисованной в [9], следует, что среди шести химических институтов
Новосибирского научного центра СО РАН Институт катализа занимает лидирующие
позиции по числу публикаций, патентов, докладов на конференциях, полученных
цитирований; здесь самый крупный штат сотрудников и больше всего публикующихся
авторов. Кроме того, в ИК хорошо развита электронная подписка и имеются необходимые
условия для анализа спроса на электронные документы. Это также является обязательным
для того, чтобы наше библиометрическое исследование имело силу.
Мы ставим себе целью изучить три аспекта информационной деятельности ученых ИК.
Это чтение, цитирование других документов и публикации в научных изданиях.
Мониторинг ограничивается журналами, представленными в коллекции «Chemical
Engineering» онлайновой платформы ScienceDirect издательства Эльзевир. Это позволит
зафиксировать самый «трудноуловимый» показатель — чтение (загрузки статей).
Конечно, имеется также обращение к печатным версиям тех же журналов (в библиотеке
представлены 9 наименований из данной коллекции), однако оно останется за скобками
настоящего исследования.
В отличие от работ [11, 12, 13] наш анализ проводится не на уровне отдельных статей,
а на уровне журналов: для каждого периодического издания из коллекции «Chemical
Engineering» будет посчитано число прочитанных из него статей, число опубликованных в
нем сотрудниками ИК работ и количество цитирований ими этого журнала.
Три аспекта, включенных в настоящий анализ, сложным образом связаны между собой.
Чтение статей побуждает ученых цитировать их и в некоторых случаях публиковаться в
тех же журналах. В свою очередь ссылка, найденная у коллеги, часто приводит к
прочтению соответствующей статьи. При отправке рукописи в то или иное издание автор
нередко старается прочесть и даже процитировать больше публикаций из данного
журнала. Механизм, отвечающий за связи трех исследуемых аспектов информационного
поведения, достаточно сложен и запутан, однако интуитивно ясно, что этот скрытый
процесс должен выливаться в понятные наблюдаемые проявления. Показатели чтения,
цитирования и публикационной деятельности ученых, работающих в некоторой
ограниченной области знания, должны быть каким-то образом связаны друг с другом, в
том числе на уровне отдельных наименований журналов. Иными словами, ожидается, что
не только существует сфера научных интересов как целое — проявляющаяся в чтении,
публикациях, цитировании, — но и акценты в этой сфере на те или иные источники
распределены сходным образом для всех трех составляющих информационной
деятельности. Поэтому целью настоящего исследования является не только рассмотрение
каждого из трех показателей в отдельности, но и поиск взаимосвязи между ними.
2
Условия исследования и методика
Институт катализа был основан в 1958 г. и на сегодня является одним из крупнейших в
мире научно-исследовательских центров в области катализа. Область работ ИК включает в
себя задачи фундаментального характера в области катализа, создание новых
катализаторов, опытно-промышленное их производство. Персонал Института насчитывает
около 1000 человек, в том числе более 350 научных сотрудников. Ежегодно из стен
Института выходит более 300 публикаций в рецензируемых изданиях.
В 1997 г. в ИК был создан Информационный центр, объединивший в себе лабораторию
информационных систем и программного обеспечения и научную библиотеку. Объем
печатных фондов библиотеки в настоящее время составляет более 85 тыс. единиц
хранения. Электронные ресурсы впервые появились в ИК в 1998 г., когда был открыт
доступ к «Научной электронной библиотеке» (НЭБ, eLibrary.Ru). Лишь несколько лет
спустя, в конце 2003 г., была приобретена подписка на новый информационный продукт
— базу данных электронных журналов издательства Эльзевир «Chemical Engineering» на
платформе ScienceDirect. Эта тематическая коллекция, содержащая 95 изданий, отобрана
из всех эльзевировских баз после тестового доступа к полной версии платформы (1800
журналов), который показал ее наибольшую востребованность. Именно она попадает в
центр нашего внимания в рамках настоящего исследования.
В конце 2004 г. был проведен еще один тестовый доступ ко всем изданиям Эльзевира,
после чего к стандартной пятилетней ретроспективе доступных номеров на ScienceDirect
были дополнительно приобретены архивы коллекции «Chemical Engineering» — номера
журналов с самого первого выпуска по 1994 г. включительно.
Кроме того, в 2005 г. Институт катализа имел доступ к 450 изданиям на ScienceDirect в
рамках программы РФФИ по предоставлению информации для отечественных научных
организаций. Часть изданий пересекалась с коллекцией «Chemical Engineering» (ок. 30
журналов), что, впрочем, никак не отразится на нашем исследовании: обращения «через
программу РФФИ» и «через самостоятельную подписку» с точки зрения статистики и
метода доступа к журналам из данной коллекции неразличимы.
С 2005 г. электронная подписка института постоянно расширялась, и в настоящий
момент она включает в себя также журналы, публикуемые Американским химическим
обществом (ACS), Королевским химическим обществом (RCS), Американским институтом
физики (AIP), Американским физическим обществом (APS), Институтом физики (IoP),
издательствами Springer, Oxford University Press, World Scientific Publishing. С 2006 г.
также получен доступ к электронным книгам издательства Springer. Электронная подписка
во всей ее совокупности пользуется высоким спросом, причем в ИК созданы необходимые
для этого условия: компьютерная сеть объединяет более 600 персональных компьютеров и
насчитывает 700 зарегистрированных пользователей.
Стандартным параметром оценки активности использования онлайновой журнальной
коллекции является число открытых полнотекстовых статей. Этот показатель
присутствует в статистических сведениях, предоставляемых практически каждой
электронной библиотекой, и является наиболее значимым и поддающимся корректной
интерпретации (в отличие от, например, числа обращений к аннотациям). В частности,
именно на него рекомендуют опираться эксперты «Project COUNTER», выработавшие для
производителей баз данных периодики правила по представлению статистики
использования их ресурсов [15]. Говоря об анализе обращений к различным электронным
журналам, мы также будем подразумевать этот показатель. Необходимо, однако, иметь в
виду, что статистика учитывает не «уникальные» открытые статьи, а число самих актов
загрузки: в информации «открыто N полнотекстовых статей» не делается разницы, было
3
ли загружено N разных публикаций или, скажем, пользователями N раз открывалась одна
и та же статья.
В качестве временнóго промежутка, на котором снимаются показатели использования
онлайновых журналов, взят отрезок с января 2004 г. по июнь 2005 г. включительно.
Доступ к различным электронным изданиям в ИК варьировался на протяжении данного
времени (программа РФФИ, тестовые доступы), однако журналы Эльзевира,
представленные на ScienceDirect в предметной коллекции «Chemical Engineering», были
доступны для сотрудников института в течение всего отрезка наблюдения. Таким образом
обеспечивается неизменность состава анализируемой подписки (единственное изменение
— это добавление с 2005 г. архивных номеров тех же журналов из «Chemical
Engineering»).
Как показывает статистика, именно эта коллекция журналов является первоочередным
источником информации для ученых ИК. За период наблюдения, т. е. в течение полутора
лет, было открыто более 19 тыс. полнотекстовых статей из данного ресурса. Кроме того,
объективные «внешние» показатели также говорят о высоком авторитете этого набора
журналов на фоне всей мировой периодики: в десятке наиболее цитируемых
периодических изданий среди отнесенных к рубрике «Engineering, Chemical» (по данным
Journal Citation Reports, 2003 г.) находятся восемь наименований из данной коллекции
Эльзевира.
Из числа 95 журналов, номинально присутствующих в коллекции «Chemical
Engineering», были исключены 13 наименований, которые либо сменили
название/прекратили свое существование до начала периода наблюдения, либо поменяли
владельца и отошли от Эльзевира к другим издателям (что повлекло смену режима
доступа к онлайновым версиям на ScienceDirect). В первом случае авторы не могут
публиковаться в прекратившем существование издании, во втором — не могут читать
электронные версии на платформе Эльзевира. Необходимо уточнить, что для 10 из 13
исключенных журналов показатели чтения, цитирования и публикационной деятельности
всё равно были строго нулевыми.
Если журнал в течение своей истории менял заглавие, объединение данных не
проводилось: он рассматривался как два (или более) различных периодических издания.
Отметим, что ряд изданий из исследуемой коллекции также представлены в Научной
электронной библиотеке, однако данные по их использованию в НЭБ не учитывались: это
разрушило бы целостность поля наблюдения и дало крен в пользу журналов, имеющихся в
обоих ресурсах.
Для снятия показателей публикационной активности ученых Института катализа
использовался продукт Scopus — реферативная база данных и индекс цитирования.
Данный ресурс также производится компанией Эльзевир, поэтому можно предположить,
что в нем наиболее полно представлены статьи, опубликованные специалистами ИК в
эльзевировских журналах.
Для получения списка публикаций задавался поиск по ключевому слову «Boreskov» в
сведениях о месте работы автора (поле «Affiliation» базы Scopus). Далее проводилась
фильтрация по списку охваченных нашим исследованием изданий и по дате выхода
статьи. Здесь для получения более обширных данных по публикационной деятельности
сотрудников ИК брался больший временной интервал — с 2000 г. до времени проведения
запроса (начало августа 2005 г.). Это позволило получить 250 статей, что уже достаточно
репрезентативно. Нет принципиального несовершенства методики в несовпадении двух
временных интервалов исследования или в эффекте запаздывания между опубликованием
работы и размещением ее в базе данных Scopus. Нас интересует общая структура
читательского спроса и публикационной/цитатной деятельности, а не конкретные данные
4
на конкретный момент времени. Отметим также, что использованный нами метод поиска
публикаций находит все статьи с авторством ученых ИК, вне зависимости от того,
является сотрудник ИК первым автором или нет.
Для полученных таким образом 250 статей также были сняты данные по цитированию
в них журналов из коллекции «Chemical Engineering». Это делалось вручную — открытием
списков цитируемой литературы каждой статьи в базе данных Scopus и поиском ссылок на
соответствующие издания. Подчеркнем, что в настоящей работе учитываются только
цитирования из тех же 250 статей: цитаты на журналы коллекции «Chemical Engineering»
из публикаций, не входящих в данную коллекцию, не фиксировались.
Все данные по чтению, публикациям и цитированию для 82-х журналов, входящих в
коллекцию издательства Эльзевир «Chemical Engineering», были сведены в единую
таблицу в программе Excel, а также импортированы в пакет SPSS 12.0. При помощи этих
двух программных средств проводился дальнейший анализ данных и построение
графиков/диаграмм.
Результаты
1. Чтение. Всего за исследуемый промежуток времени сотрудники ИК СО РАН
обращались к 72 из 82 рассматриваемых в настоящем исследовании электронных
журналов (88%, напомним, что «обращением» считается открытие полного текста статьи
из соответствующего журнала). Не следует удивляться отсутствию обращений к 10
изданиям, это обычный эффект «пакетной» подписки, когда наряду с остро необходимыми
журналами библиотека по правилам издательства обязана подписать и «дополнительные»,
менее актуальные издания из той же тематической коллекции. Чем больше объем пакета
— тем, как правило, меньше процент востребованных изданий: см., например,
исследование [16], в котором при использовании трех тематических коллекций Эльзевира
(310 наименований) наблюдалось обращение к 76% журналов за год.
Из рассматриваемого множества журналов были открыты 19674 электронные статьи,
что составляет 63% от суммарного количества прочитанных за исследуемое время
публикаций на ScienceDirect (включая статьи из журналов других тематических
коллекций, доступные через РФФИ или во время тестового доступа ко всему ресурсу). С
одной стороны, показатель достаточно хорош, чтобы оправдать выбор библиотеки купить
подписку именно на этот дисциплинарный срез. С другой стороны, цифра не
приближается к 100%, что может означать потребность сотрудников и в иных
тематических коллекциях — это стало особенно актуальным, после того как программа
сотрудничества РФФИ с Эльзевиром приостановилась с 2006 г. и теперь необходимо
рассчитывать только на свою подписку.
2. Публикации. За заданный период времени сотрудники ИК опубликовали 250 статей в
18 из 82 рассматриваемых журналов. Все эти издания расписываются в цитатных базах
данных ISI и имеют импакт-фактор. Распределение статей, опубликованных в журналах с
тем или иным импакт-фактором, показано на рис. 1. Данные по импакт-факторам за 2004 г.
брались из описаний журналов на сайте издательства Эльзевир.
Как видно из диаграммы, чаще всего сотрудники ИК СО РАН публикуются в
эльзевировских изданиях с импакт-фактором в пределах от 2 до 2,5. Только одна
публикация пришлась на журнал с импактом менее единицы. Средний импакт-фактор
журналов рассматриваемой коллекции, в которых публиковался институт (взвешенный с
коэффициентами, равными числу напечатанных статей в каждом издании), равен 2,49. Это
очень неплохие показатели: например, в 2003 г. средний импакт-фактор по всей категории
«Engineering, Chemical» в базе данных ISI составил только 0,88, а половина журналов этой
5
рубрики имели импакт менее 0,56 (данные взяты из продукта Journal Citation Reports.
Science Edition. 2003 г.). Следует, однако, помнить, что мы ограничились рассмотрением
публикаций только в эльзевировских журналах, которые сами по себе обладают, как
правило, высоким импактом. Впрочем, если посчитать средний импакт-фактор тех 18
изданий, в которые попали статьи сотрудников, получим значение 2,15: следовательно,
даже внутри заданного множества журналов ученые ИК в среднем публикуют свои статьи
в более престижных изданиях.
Рис. 1. Распределение статей по диапазонам импакт-факторов
опубликовавших их журналов
3. Цитирование. В 250 статьях, опубликованных в 18-ти журналах, сотрудниками ИК СО
РАН было сделано 1659 цитирований, пришедшихся на 39 эльзевировских журналов из
тематической коллекции «Chemical Engineering», в среднем 6,6 цитирований на статью.
При этом, конечно, следует иметь в виду, что есть еще немало цитирований иных
источников, не входящих в рассматриваемую коллекцию. В рамках настоящего
исследования не ставилось цели подсчитать суммарное количество пунктов в списках
литературы статей, опубликованных сотрудниками ИК. Однако этот параметр можно
оценить, взяв показатель среднего числа библиографических ссылок в статье в каждом из
18 журналов (эти данные доступны в базе данных ISI «Journal Citation Reports», брался
срез за 2003 г.), умножив его на соответствующее число публикаций сотрудников ИК в
данном издании и сложив результаты по всем изданиям. Оценка дает суммарное число
ссылок ок. 7270, или 29 пунктов в списке библиографии к одной статье. Из них 6,6 (23%)
ведут на издания из той же тематической коллекции, остальные — на другие источники
(прежде всего на журналы иных издательств, книги, а также издания Эльзевира из иных
коллекций). Интересно заметить, что это отношение хорошо совпадает с другим
исследованием т. н. «коэффициента интрацитирования» журнальной платформы
издательства Эльзевир [17]. Там для трех экономических изданий Эльзевира было
получено, что в среднем ок. 20% ссылок в этих журналах также ведут на эльзевировские
источники.
6
4. Сопоставление различных характеристик. Сравнительный анализ показателей
чтения, публикации и цитирования начнем с самого простого этапа, рассмотрев пятерки
изданий, которые сотрудники ИК РАН наиболее активно читают, в которых наиболее
активно публикуются и которые наиболее активно цитируют. Эти пятерки приведены в
таб. 1.
В целом все три пятерки достаточно монолитны и на 80% состоят из одних и тех же
журналов. Издания-«варяги», представленные только в одной пятерке, показаны в таблице
выделением. Интересно обратить внимание на то, какие места занимают они в других
списках. Так, «Applied Catalysis B», вышедший на пятое место в списках читаемости,
занимает шестое место как в списке журналов для публикации, так и в списке цитируемых
изданий. Таким образом, присутствие журнала в первой пятерке чтения вполне оправдано.
То же касается и «Chemical Engineering Science», вышедшего на пятое место по числу
цитирований и при этом находящегося на шестом и восьмом местах в списках чтения и
публикации соответственно. Единственный яркий выброс — «Chemical Engineering
Journal», который делит второе-третье места по числу публикаций сотрудников ИК СО
РАН с «Catalysis Today» (опубликовано по 34 статьи), однако находится на восьмом месте
в рейтинге чтения и на тринадцатом — в рейтинге цитирования. Мы видим, что в этом
издании сотрудники института любят публиковаться, его электронную версию читают
умеренно (открыто 768 статей), при этом журнал практически не цитируют: 16
цитирований, единственный случай, когда число публикаций в издании превышает число
ссылок на него.
Applied Catalysis A:
General
издания, в которых
больше всего
публикуются
Journal of Molecular
Catalysis A: Chemical
Journal of Catalysis
Catalysis Today
наиболее читаемые
издания
Catalysis Today
Journal of Molecular
Catalysis A: Chemical
Applied Catalysis B:
Environmental
Chemical Engineering
Journal
Applied Catalysis A:
General
Journal of Catalysis
наиболее цитируемые
издания
Journal of Catalysis
Applied Catalysis A:
General
Catalysis Today
Journal of Molecular
Catalysis A: Chemical
Chemical Engineering
Science
Таб. 1. «Популярные» журналы
Теперь взглянем на показатели чтения, публикационной и цитатной активности в
целом. Прежде всего можно отметить, что каждый журнал, который цитировался или в
котором публиковались ученые ИК, был также как минимум один раз востребован в
электронном виде для чтения. Также практически каждое издание, в котором была
опубликована хотя бы одна работа, цитировалось не менее двух раз (исключение
составляет не цитировавшийся журнал «Colloids and Surfaces B», однако имеются ссылки
на его предшественника, «Colloids and Surfaces»). Это вполне логичная картина
распределения «потребления» (чтения и цитирования) и «производства» (публикации)
академического знания. Для создания нового научного материала ученый, как правило,
должен значительное время возрастать, опираясь на уже существующее знание, причем
7
нередко содержащееся в тех же источниках, которые впоследствии он будет обогащать
своим вкладом.
Наконец, обратимся к совокупной картине взаимной зависимости чтения, публикации
и цитирования. Возьмем в качестве независимой переменной показатель чтения, в качестве
зависимой — публикационные и цитатные данные. Это органично ложится в
информетрическую парадигму «sources/items»: «источники/продукты». Чтение статей в
данном случае является «источником» — источником для цитирования или публикации
новых статей.
При построении диаграмм рассеяния будем использовать логарифмическую шкалу,
т. к. мы имеем дело с сильно асимметричным распределением, далеким от нормального.
Логарифмирование позволяет приблизить его к Гауссову: критерий КолмогороваСмирнова для нормального распределения, не выполняющийся в нашем случае для самих
показателей чтения, цитирования и публикации, выполняется для логарифмов каждой из
трех величин. Это важно в связи с тем, что при определении коэффициента корреляции
Пирсона условием является нормальное распределение переменных. Аналогичный метод
«нормализации» применяется авторами [11] и [12].
Рис. 2. Диаграмма рассеяния для чтения и цитирования
На рис. 2 приведена диаграмма рассеяния чтение/цитирование. Каждая точка на
диаграмме — это отдельный журнал. Абсцисса соответствует логарифму количества
прочитанных из журнала статей, ордината — логарифму числа ссылок в работах
сотрудников ИК на публикации в данном издании (учитываются лишь те журналы, для
которых оба этих показателя ненулевые). Как видно, зависимость между изображенными
величинами имеется, при этом численные данные дают значение коэффициента
8
корреляции Пирсона (для логарифмов) 0,78 — высокая корреляция. Также показана
регрессионная прямая, определенная методом наименьших квадратов.
Рис. 3. Диаграмма рассеяния для чтения и публикаций
Как видно из рис. 3, показатели чтения и публикационной активности тоже ощутимо
связаны друг с другом. Коэффициент корреляции этих величин даже немного выше и
равен 0,80.
Также можно построить еще одну диаграмму рассеяния — зависимости цитирований
того или иного издания от числа публикаций в нем. Эта диаграмма показана на рис. 4 и
может считаться отражающей склонность преимущественно цитировать те же издания, в
которых публикуются статьи (эффект самоцитирования журналов). Коэффициент
корреляции для данной пары величин равен 0,76.
Отметим, что ранговые коэффициенты корреляции Спирмена для пар
чтение/цитирование,
чтение/публикации
и
публикации/цитирование
равны,
соответственно, 0,75; 0,83; 0,74 — т. е. совпадают как по степени «силы» корреляции, так
и по взаимному расположению друг относительно друга с коэффициентами Пирсона для
логарифмов. Это дополнительное подтверждение того, что переход к логарифмическим
шкалам был корректен.
Таким образом, подводя итоги совместного сопоставления показателей чтения,
цитирования и публикационной активности, можно сказать, что, как мы и предполагали во
введении, заметная связь прослеживается между всеми тремя параметрами.
Заключение
В настоящей работе были исследованы процессы чтения, цитирования и
публикационной деятельности сотрудников Института катализа СО РАН. Распространение
9
новых технологий онлайнового чтения и хорошая готовность библиотеки и сотрудников
ИК к их восприятию позволили провести глубокий анализ информационного поведения
ученых.
Рис. 4. Диаграмма рассеяния для публикаций и цитирования
Обнаружено, что в рамках одной электронной коллекции «Chemical Engineering»
издательства Эльзевир сотрудниками ИК было за полтора года прочитано 19674 статей
(более 50 документов на одного научного сотрудника), а за 5,5 лет — опубликовано 250
работ, в которых 1659 раз процитированы журналы из той же коллекции. Высокие
показатели для всех трех процессов свидетельствуют о значительной степени
монолитности научных интересов ученых института, которые проявляются как в чтении
источников, так и в цитировании и опубликовании своих исследований в них.
Наиболее интересным результатом, полученным в настоящем исследовании, является
демонстрация консолидированности трех аспектов научно-информационной деятельности
на уровне отдельных журналов. Так, пятерки наиболее «популярных» изданий в плане
чтения, цитирования и публикации на 80% состоят из одних и тех же наименований. Более
того, при анализе показателей по всем журналам обнаруживается сильная степень
корреляции (на уровне 0,76–0,80) для любой пары переменных: чтение/цитирование,
чтение/публикации и публикации/цитирование.
Поиск конкретного механизма, который обеспечивает подобную консолидацию,
выходит за рамки настоящей работы. На полученных данных невозможно сказать,
наблюдаем ли мы влияние прочтения журнала на последующую отправку рукописи в него,
или публикация в журнале, наоборот, «подогревает интерес» к этому изданию у научных
сотрудников, начинающих с большей частотой его читать; высокая активность чтения
10
журнала обеспечивает его цитируемость, или, наоборот, цитирование коллегами приводит
к более массовому обращению к его электронной версии и т. д. Вероятно, это
взаимосвязанный процесс и каждая его составляющая в той или иной мере проявлена. Но
по крайней мере можно говорить о том, что консолидация трех аспектов научноинформационной деятельности имеет место. В частности, такой результат позволяет в
будущем прогнозировать динамику информационного поведения ученых ИК. На
основании показателей чтения (которые могут быть получены из онлайновых баз данных с
минимальной задержкой по времени) возможно предсказать, в каких изданиях вероятнее
всего будут публиковаться сотрудники, а на основании, например, публикационных и
цитатных показателей можно, наоборот, прогнозировать спрос на онлайновые издания и
строить политику комплектования библиотеки электронными информационными
источниками.
* * *
Авторы благодарят Тима Броди за полезный обмен мнениями, состоявшийся во время
написания статьи.
ЛИТЕРАТУРА
1.
Bar-Ilan J. An ego-centric citation analysis of the works of Michael O. Rabin based on
multiple citation indexes // Information Processing and Management. 2006. Vol. 42, Iss. 6.
P. 1553–1566.
2. Schoepflin U., Glänzel W. Two decades of «Scientometrics». An interdisciplinary field
represented by its leading journal // Scientometrics. 2001. Vol. 50, No. 2. P. 301–312.
3. Przyłuska J. International Journal of Occupational Medicine and Environmental Health in
world documentation services: The Scopus based analysis of citation // International Journal
of Occupational Medicine and Environmental Health. 2006. Vol. 19, No. 1. P. 1–5.
4. Patterson M. G. Development of ecological economics in Australia and New Zealand //
Ecological Economics. Vol. 56, Issue 3. P. 312–331.
5. Glänzel W., Leta J., Thijs B. Science in Brazil. Part 1: A macro-level comparative study //
Scientometrics. 2006. Vol. 67, No. 1. P. 67–86.
6. Leta J., Glänzel W., Thijs B. Science in Brazil. Part 2: Sectoral and institutional research
profiles // Scientometrics. 2006. Vol. 67, No. 1. P. 87–105.
7. Маршакова-Шайкевич И. В. Вклад России в развитие науки: библиометрический
анализ. М.: Янус, 1995.
8. Kim M.-J., Kim B.-J. Bibliometric analysis of publications by the chemistry department,
Seoul National University, Korea, 1992–1998 // Journal of Information Science. 2000.
Vol. 26, Iss. 2. P. 111–119.
9. Бузник В. М. и др. Совместное использование баз данных Chemical Abstracts и Science
Citation Index в наукометрическом анализе публикаций химических институтов
Новосибирского научного центра СО РАН // Научно-техническая информация. Сер. 1.
2006. № 4. С. 28–37.
10. Мохначева Ю. В. Ресурсы Web of Knowledge в наукометрических исследованиях (на
примере Пущинского научного центра РАН). Доклад на Пятой международной
конференции «SCIENCE ONLINE: электронные информационные ресурсы для науки
и
образования».
Май,
2005.
Турция
//
http://elibrary.ru/projects/conference/egypt2005/presentations/WoK_resources.rar
11
11. Perneger T. V. Relation between online «hit counts» and subsequent citations: Prospective
study of research papers in the BMJ // British Medical Journal. 2004. Vol. 329. P. 546–547.
12. Brody T., Harnad S., Carr L. Earlier web usage statistics as predictors of later citation
impact // Journal of the American Society for Information Science and Technology. 2006.
Vol. 57, Iss. 8. P. 1060–1072.
13. Moed H. F. Statistical relationships between downloads and citations at the level of
individual documents within a single journal // Journal of the American Society for
Information Science and Technology. 2005. Vol. 56, Iss. 10. P. 1088–1097.
14. Bollen J. e. a. Toward alternative metrics of journal impact: A comparison of download and
citation data // Information Processing and Management. 2005. Vol. 41, Iss. 6. P. 1419–
1440.
15. The Counter Code of Practice. Journals and Databases: Release 2 //
http://www.projectcounter.org/r2/COUNTER_COP_Release_2.pdf, секция 4.1.
16. Писляков В. В. Спрос на электронные журналы в университетской библиотеке:
работает ли правило Парето? // Научно-техническая информация. Сер. 1. 2005. № 12.
С. 27–32.
17. Писляков В. В. Кросс-ссылки в электронных информационных ресурсах // Кiтапхана
элемi - Мир библиотеки. 2006. № 2. С. 4–8.
12
Download