Сравнительный анализ программного обеспечения для библиометрических исследований и построения карт науки

реклама
Сравнительный анализ программного
обеспечения для библиометрических
исследований и построения карт науки
Мазов Н.А., ИНГГ СО РАН
Гуреев В.Н., ГНЦ ВБТ «Вектор»
Новосибирск
Предисловие …
В последние годы в информационной
практике наблюдается возрастающий
интерес, привлекаемый к инфометрическим
исследованиям
Отчасти это связано с тем, что накоплены
колоссальные объемы библиографической
информации различного вида, требующей
качественно новых форм аналитикосинтетической обработки, а с другой стороны
это связано с более открытым и публичным
доступом к наукометрическим базам данных
07.05.2016
Крым - 2013
2
Предисловие …
Динамика роста публикаций по инфометрическому
анализу, отобранных по запросу «Topic=((bibliometric*
or informetric* or webometic* or scientometric*) and
(stud* or analys*))» в базе данных WoS компании
Thomson Reuters
07.05.2016
Крым - 2013
3
Предисловие …
•
•
•
•
•
•
•
•
•
•
•
IN-SPIRE (Wise, 1999)
VantagePoint (Porter & Cunningham, 2004)
HistCite (Eugene Garfield, 2004)
Bibexcel (Persson et al., 2009)
CiteSpace II (Chen, 2004, 2006)
Sci2 Tool (Sci2 Team, 2009)
Leydesdorff’s Software
Publish or Perish (Harzing, A.W.)
VOSViewer (van Eck & Waltman, 2010)
Network Workbench Tool (Börner et al., 2010)
SciMAT (M.J. Cobo at al., 2011)
07.05.2016
Крым - 2013
4
Предисловие …
Для проведения сравнительных
исследований проанализировано девять
программ, во внимание принимались
следующие аспекты:
• а) методы предварительной обработки,
• б) доступные библиометрические сети,
• в) используемые методы нормирования,
• г) виды анализа, прочие второстепенные
аспекты.
07.05.2016
Крым - 2013
5
1. HistCite (Thomson Reuters)
HistСite® Version 12.03.17 (20.05.2012 г.)
• Доступно подписчикам WoS
http://www.histcite.com/
• Анализ результатов поиска в WoS
 вид документа, язык, журналы
 страны, организации, авторы
 ссылки цитирования
 ключевые слова, др.
07.05.2016
Крым - 2013
6
HistCite
Текст …
07.05.2016
Крым - 2013
7
HistCite
Текст …
07.05.2016
Крым - 2013
8
HistCite
Текст …
07.05.2016
Крым - 2013
9
2. BibExcel (by Olle Persson, Sweden)
Программа для анализа данных из WoS,
Scopus и др. систем по различным
полям данных, отформатированных
соответствующим образом.
Позволяет подготовить файлы данных,
которые могут быть импортированы в
Excel, или любую программу,
работающую с табличными данными,
для дальнейшей обработки.
07.05.2016
Крым - 2013
10
BibExcel
BibExel Version 2009 XP (20.05.2012 г.)
• Доступно по адресу
http://www8.umu.se/inforsk/Bibexcel/
• Анализ результатов поисков в WoS,
Scopus, WinSpirs, Compendex и др.
 авторы, соавторство, индекс Хирша
 журналы
 ссылки цитирования
 ключевые слова, др.
07.05.2016
Крым - 2013
11
BibExcel
Текст …
07.05.2016
Крым - 2013
12
BibExcel
Текст …
07.05.2016
Крым - 2013
13
3. CiteSpace (by Chaomei Chen)
СiteSpace Version 3.1 R3 (24.05.2012 г.)
• Доступно по адресу
http://cluster.cis.drexel.edu/~cchen/citespace/
• Визуализация направлений и тенденций
в научной литературе по данным WoS
 построение кластеров соавторства
 построение кластеров социтирования
 частотные списки цитирования
генерации слоя географической карты,
основанного на местоположениях авторов,
который в дальнейшем можно посмотреть в
Google Earth
07.05.2016
Крым - 2013
14
CiteSpace (…/current/citespace.jnlp)
Текст …
07.05.2016
Крым - 2013
15
CiteSpace
Текст …
07.05.2016
Крым - 2013
16
CiteSpace
Текст …
07.05.2016
Крым - 2013
17
CiteSpace
Текст …
07.05.2016
Крым - 2013
18
4.
2
Sci Tool
(Indiana University)
Sci2Tool Version 0.5.2 Alpha (09.04.2012 г.)
Модульный набор инструментов для изучения науки
• Доступно по адресу https://sci2.cns.iu.edu/
• Анализ результатов поисков в WoS, Scopus и др., а также
собственные данные
 Выполнение различных типов анализа с
использованием наиболее эффективных алгоритмов
на микро- и макро уровне
 Использование различных визуализаций для
интерактивного изучения и понимания конкретных
данных
 Обмен данными и алгоритмами
07.05.2016
Крым - 2013
19
Sci2 Tool
Текст …
07.05.2016
Крым - 2013
20
Sci2 Tool
Текст …
07.05.2016
Крым - 2013
21
Sci2 Tool
Текст …
07.05.2016
Крым - 2013
22
Sci2 Tool
Основные виды и уровни анализа
07.05.2016
Крым - 2013
23
5. Сайт Loet Leydesdorff
• Доступно по адресу
http://www.leydesdorff.net/
• Набор ДОС программ для разбора,
преобразования и анализа данных,
полученных из различных БД: Scopus, WoS и
Google Scholar
преобразование данных различных БД
страны, организации, авторы, соавторы
 цитирование, социтирование
 ключевые слова, др.
07.05.2016
Крым - 2013
24
Сайт Loet Leydesdorff
Текст …
07.05.2016
Крым - 2013
25
Сайт Loet Leydesdorff
• Dynamic Visone (CREEN) for the animation of network
• Mapping the Geography of Science (Leydesdorff & Persson,
2010)
• TI.exe software for co-word mapping of texts (lines)
• Fulltext.exe software for co-word mapping of full texts
• ISI.EXE for organizing a set downloaded from the WoS into
databases for relational database management
• CoAuth.EXE for visualization of the coauthorship network
using a WoS set
• BibCoupl.EXE for visualization of the bibliographic coupling
among authors using a WoS set
• BibJourn.EXE for visualization of the bibliographic coupling
in terms of cited journals
07.05.2016
Крым - 2013
26
Сайт Loet Leydesdorff
• IntColl.EXE for visualization of international collaboration
• InstColl.Exe for the analysis and visualization of institutional
collaboration
• Scop2ISI.EXE for reorganizing Scopus output files into the tagged
format of the Web-of-Science. (Note that the CR-field is
differently organized!)
• Scopus.Exe for the organization of Scopus output into files for
relational database management (MS Access, dBase)
• GScholar.Exe for the organization of Google Scholar files into files
for relational database management (MS Access, dBase)
• Google.Exe for the organization of Google files into files for
relational database management (MS Access, dBase)
• Acc2ISI.exe for the reverse route of turning databases (exported
from MS Access) into the «tagged» format of the WoS
07.05.2016
Крым - 2013
27
Сайт Loet Leydesdorff
Текст …
07.05.2016
Крым - 2013
28
Сайт Loet Leydesdorff
Текст …
07.05.2016
Крым - 2013
29
6. Publish or Perish (Harzing, A.W.)
PoP Version 3.6.4520 (16.05.2012 г.)
• Доступно по адресу
http://www.harzing.com/pop.htm/
• Анализ результатов поисков в Google
Scholar для получения статистических
данных:
общее число статей, цитирований
среднее число цитирований на статью,
цитирований на автора, статей на автора,
цитирований в год
индексы Хирша, Эгга и др.
07.05.2016
Крым - 2013
30
Publish or Perish
Текст …
07.05.2016
Крым - 2013
31
Publish or Perish
Текст …
07.05.2016
Крым - 2013
32
7. VOSviewer (Leiden University)
VOSviewer Version 1.5.0 (24.05.2012 г.)
• Доступно по адресу
http://www.vosviewer.com/
• Предназначена для анализа
библиометрических сетей.
• Программа может использоваться для
создания карт по публикациям, статьям или
журналам, основанных на сети
социтирования или для создания карт
авторов, ключевых слов, основанных на их
одновременном появлении в сети
07.05.2016
Крым - 2013
33
VOSviewer
Текст …
07.05.2016
Крым - 2013
34
VOSviewer
Текст …
07.05.2016
Крым - 2013
35
8. Network Workbench (NSF)
NWB Version 1.0.0 (17.09.2009 г.)
• Доступно по адресу http://nwb.cns.iu.edu/
• Программа дает возможность представить сетевой
анализ посредством наиболее эффективных доступных
алгоритмов.
• Используя NWB имеется возможность онлайнового
доступа к большинству сетевых наборов данных, а
также возможно загружать собственные сети.
• NWB предоставляет продвинутый инструментарий для
визуализации, позволяющий интерактивно исследовать
и понимать специфические сети, а также их
взаимодействие с другими сетями.
07.05.2016
Крым - 2013
36
Network Workbench
Текст …
07.05.2016
Крым - 2013
37
Network Workbench
Текст …
07.05.2016
Крым - 2013
38
Network Workbench
Текст …
07.05.2016
Крым - 2013
39
9. SciMAT
SciMAT (Science Mapping Analysis Software Tool)
• Доступно по адресу http://sci2s.ugr.es/scimat/
• Предназначено для проведения картографического анализа
науки за многолетний период.
• Предусмотрены модули, позволяющие вести работу на
различных этапах процесса составления карт науки.
• Имеет три особенности, выгодно отличающие его от других
аналогичных инструментов:
• а) мощный модуль предварительной обработки, который
прореживает необработанные библиографические данные;
• б) использование библиометрических показателей для
изучения влияния каждого анализируемого элемента и
• в) мастер настроек анализа
07.05.2016
Крым - 2013
40
SciMAT
07.05.2016
Крым - 2013
41
SciMAT
Текст …
07.05.2016
Крым - 2013
42
SciMAT
Текст …
07.05.2016
Крым - 2013
43
SciMAT
Текст …
07.05.2016
Крым - 2013
44
Заключение …
• Закрытое и платное программное обеспечение ограничивает
пользователя-исследователя в творчестве рамками доступа и
соответствующих лицензионных соглашений
• Представленный список программного обеспечения является
практически исчерпывающим
• На основе вышеописанных свободно распространяемых
программ возможно проведение качественного
информетрического исследования
• Рассмотренное программное обеспечение может быть
рекомендовано специалистам в областях, связанных с
информетрическими исследованиями
• Открывает путь для самостоятельной работы специалистов в
рамках активно развивающихся информетрических
исследований и позволяет им вносить вклад в дальнейшее
развитие программного обеспечения
07.05.2016
Крым - 2013
45
Спасибо за внимание!
Мазов Николай Алексеевич,
зав. ИБЦ ИНГГ СО РАН
E-mail [email protected]
Тел.
+7 383 333 22 16
SciMAT (основные характеристики)
•
•
•
•
•
•
•
•
Загрузчики: форматы WoS и RIS.
Библиометрия: слово, цитирование автора, цитирование журнала,
библиографическую связи.
Предварительная обработка: удаление дублей (руководство, множественным
числом или расстоянием Levenshtein, или импортированием из файла XML),
квантование времени, уплотнение данных и сетевое сокращение.
Нормализация: Сила Ассоциации, Эквивалентный Индекс, Индекс Включения,
Индекс Jaccard’s и Косинус Salton’s.
Отображение (через кластеризацию): Простой Алгоритм Центров, Единственное
редактирование, Законченное редактирование, Среднее редактирование и
алгоритмы кластеризации Редактирования суммы.
Анализ: сетевой анализ (плотность Callon's и центрированность),
производительность и качественный анализ (сумма, минимум, максимальные и
средние цитаты, и сложные меры, такие как h-индекс, индекс г, индекс
гектограмма или q2-индекс), и временный анализ.
Визуализация: стратегическая диаграмма, кластерная сеть, накладываясь на
карту, карту развития.
Отчет: в HTML и формате LaTeX.
07.05.2016
Крым - 2013
47
SciMAT (основные характеристики)
•
•
•
•
•
•
•
•
Loaders: ISI Web of Knowledge format and RIS format.
Bibliometric networks: co-word, author co-citation, journal co-citation, author
co-citation, bibliographic coupling, journal bibliographic coupling and author
bibliographic coupling.
Preprocessing: de-duplicating (manual, by plural or by Levenshtein distance, or
importing from a XML file), time-slicing, data reduction and network reduction.
Normalization: Association Strength, Equivalence Index, Inclusion Index, Jaccard’s
Index and Salton’s Cosine.
Mapping (through clustering): Simple Centers Algorithm, Single-linkage,
Complete-linkage, Average-linkage and Sum-linkage clustering algorithms.
Analysis: network analysis (Callon's density and centrality), performance and
quality analysis (sum, minimum, maximum and average citations, and complex
measures such as the h-index, g-index, hg-index or q2-index), and temporal
analysis.
Visualization: strategic diagram, cluster network, overlapping map, evolution
map.
Report: in HTML and LaTeX format.
07.05.2016
Крым - 2013
48
Заголовок слайда …
Текст …
07.05.2016
Крым - 2013
49
Заголовок слайда …
Текст …
07.05.2016
Крым - 2013
50
Скачать