Сравнительный анализ программного обеспечения для библиометрических исследований и построения карт науки Мазов Н.А., ИНГГ СО РАН Гуреев В.Н., ГНЦ ВБТ «Вектор» Новосибирск Предисловие … В последние годы в информационной практике наблюдается возрастающий интерес, привлекаемый к инфометрическим исследованиям Отчасти это связано с тем, что накоплены колоссальные объемы библиографической информации различного вида, требующей качественно новых форм аналитикосинтетической обработки, а с другой стороны это связано с более открытым и публичным доступом к наукометрическим базам данных 07.05.2016 Крым - 2013 2 Предисловие … Динамика роста публикаций по инфометрическому анализу, отобранных по запросу «Topic=((bibliometric* or informetric* or webometic* or scientometric*) and (stud* or analys*))» в базе данных WoS компании Thomson Reuters 07.05.2016 Крым - 2013 3 Предисловие … • • • • • • • • • • • IN-SPIRE (Wise, 1999) VantagePoint (Porter & Cunningham, 2004) HistCite (Eugene Garfield, 2004) Bibexcel (Persson et al., 2009) CiteSpace II (Chen, 2004, 2006) Sci2 Tool (Sci2 Team, 2009) Leydesdorff’s Software Publish or Perish (Harzing, A.W.) VOSViewer (van Eck & Waltman, 2010) Network Workbench Tool (Börner et al., 2010) SciMAT (M.J. Cobo at al., 2011) 07.05.2016 Крым - 2013 4 Предисловие … Для проведения сравнительных исследований проанализировано девять программ, во внимание принимались следующие аспекты: • а) методы предварительной обработки, • б) доступные библиометрические сети, • в) используемые методы нормирования, • г) виды анализа, прочие второстепенные аспекты. 07.05.2016 Крым - 2013 5 1. HistCite (Thomson Reuters) HistСite® Version 12.03.17 (20.05.2012 г.) • Доступно подписчикам WoS http://www.histcite.com/ • Анализ результатов поиска в WoS вид документа, язык, журналы страны, организации, авторы ссылки цитирования ключевые слова, др. 07.05.2016 Крым - 2013 6 HistCite Текст … 07.05.2016 Крым - 2013 7 HistCite Текст … 07.05.2016 Крым - 2013 8 HistCite Текст … 07.05.2016 Крым - 2013 9 2. BibExcel (by Olle Persson, Sweden) Программа для анализа данных из WoS, Scopus и др. систем по различным полям данных, отформатированных соответствующим образом. Позволяет подготовить файлы данных, которые могут быть импортированы в Excel, или любую программу, работающую с табличными данными, для дальнейшей обработки. 07.05.2016 Крым - 2013 10 BibExcel BibExel Version 2009 XP (20.05.2012 г.) • Доступно по адресу http://www8.umu.se/inforsk/Bibexcel/ • Анализ результатов поисков в WoS, Scopus, WinSpirs, Compendex и др. авторы, соавторство, индекс Хирша журналы ссылки цитирования ключевые слова, др. 07.05.2016 Крым - 2013 11 BibExcel Текст … 07.05.2016 Крым - 2013 12 BibExcel Текст … 07.05.2016 Крым - 2013 13 3. CiteSpace (by Chaomei Chen) СiteSpace Version 3.1 R3 (24.05.2012 г.) • Доступно по адресу http://cluster.cis.drexel.edu/~cchen/citespace/ • Визуализация направлений и тенденций в научной литературе по данным WoS построение кластеров соавторства построение кластеров социтирования частотные списки цитирования генерации слоя географической карты, основанного на местоположениях авторов, который в дальнейшем можно посмотреть в Google Earth 07.05.2016 Крым - 2013 14 CiteSpace (…/current/citespace.jnlp) Текст … 07.05.2016 Крым - 2013 15 CiteSpace Текст … 07.05.2016 Крым - 2013 16 CiteSpace Текст … 07.05.2016 Крым - 2013 17 CiteSpace Текст … 07.05.2016 Крым - 2013 18 4. 2 Sci Tool (Indiana University) Sci2Tool Version 0.5.2 Alpha (09.04.2012 г.) Модульный набор инструментов для изучения науки • Доступно по адресу https://sci2.cns.iu.edu/ • Анализ результатов поисков в WoS, Scopus и др., а также собственные данные Выполнение различных типов анализа с использованием наиболее эффективных алгоритмов на микро- и макро уровне Использование различных визуализаций для интерактивного изучения и понимания конкретных данных Обмен данными и алгоритмами 07.05.2016 Крым - 2013 19 Sci2 Tool Текст … 07.05.2016 Крым - 2013 20 Sci2 Tool Текст … 07.05.2016 Крым - 2013 21 Sci2 Tool Текст … 07.05.2016 Крым - 2013 22 Sci2 Tool Основные виды и уровни анализа 07.05.2016 Крым - 2013 23 5. Сайт Loet Leydesdorff • Доступно по адресу http://www.leydesdorff.net/ • Набор ДОС программ для разбора, преобразования и анализа данных, полученных из различных БД: Scopus, WoS и Google Scholar преобразование данных различных БД страны, организации, авторы, соавторы цитирование, социтирование ключевые слова, др. 07.05.2016 Крым - 2013 24 Сайт Loet Leydesdorff Текст … 07.05.2016 Крым - 2013 25 Сайт Loet Leydesdorff • Dynamic Visone (CREEN) for the animation of network • Mapping the Geography of Science (Leydesdorff & Persson, 2010) • TI.exe software for co-word mapping of texts (lines) • Fulltext.exe software for co-word mapping of full texts • ISI.EXE for organizing a set downloaded from the WoS into databases for relational database management • CoAuth.EXE for visualization of the coauthorship network using a WoS set • BibCoupl.EXE for visualization of the bibliographic coupling among authors using a WoS set • BibJourn.EXE for visualization of the bibliographic coupling in terms of cited journals 07.05.2016 Крым - 2013 26 Сайт Loet Leydesdorff • IntColl.EXE for visualization of international collaboration • InstColl.Exe for the analysis and visualization of institutional collaboration • Scop2ISI.EXE for reorganizing Scopus output files into the tagged format of the Web-of-Science. (Note that the CR-field is differently organized!) • Scopus.Exe for the organization of Scopus output into files for relational database management (MS Access, dBase) • GScholar.Exe for the organization of Google Scholar files into files for relational database management (MS Access, dBase) • Google.Exe for the organization of Google files into files for relational database management (MS Access, dBase) • Acc2ISI.exe for the reverse route of turning databases (exported from MS Access) into the «tagged» format of the WoS 07.05.2016 Крым - 2013 27 Сайт Loet Leydesdorff Текст … 07.05.2016 Крым - 2013 28 Сайт Loet Leydesdorff Текст … 07.05.2016 Крым - 2013 29 6. Publish or Perish (Harzing, A.W.) PoP Version 3.6.4520 (16.05.2012 г.) • Доступно по адресу http://www.harzing.com/pop.htm/ • Анализ результатов поисков в Google Scholar для получения статистических данных: общее число статей, цитирований среднее число цитирований на статью, цитирований на автора, статей на автора, цитирований в год индексы Хирша, Эгга и др. 07.05.2016 Крым - 2013 30 Publish or Perish Текст … 07.05.2016 Крым - 2013 31 Publish or Perish Текст … 07.05.2016 Крым - 2013 32 7. VOSviewer (Leiden University) VOSviewer Version 1.5.0 (24.05.2012 г.) • Доступно по адресу http://www.vosviewer.com/ • Предназначена для анализа библиометрических сетей. • Программа может использоваться для создания карт по публикациям, статьям или журналам, основанных на сети социтирования или для создания карт авторов, ключевых слов, основанных на их одновременном появлении в сети 07.05.2016 Крым - 2013 33 VOSviewer Текст … 07.05.2016 Крым - 2013 34 VOSviewer Текст … 07.05.2016 Крым - 2013 35 8. Network Workbench (NSF) NWB Version 1.0.0 (17.09.2009 г.) • Доступно по адресу http://nwb.cns.iu.edu/ • Программа дает возможность представить сетевой анализ посредством наиболее эффективных доступных алгоритмов. • Используя NWB имеется возможность онлайнового доступа к большинству сетевых наборов данных, а также возможно загружать собственные сети. • NWB предоставляет продвинутый инструментарий для визуализации, позволяющий интерактивно исследовать и понимать специфические сети, а также их взаимодействие с другими сетями. 07.05.2016 Крым - 2013 36 Network Workbench Текст … 07.05.2016 Крым - 2013 37 Network Workbench Текст … 07.05.2016 Крым - 2013 38 Network Workbench Текст … 07.05.2016 Крым - 2013 39 9. SciMAT SciMAT (Science Mapping Analysis Software Tool) • Доступно по адресу http://sci2s.ugr.es/scimat/ • Предназначено для проведения картографического анализа науки за многолетний период. • Предусмотрены модули, позволяющие вести работу на различных этапах процесса составления карт науки. • Имеет три особенности, выгодно отличающие его от других аналогичных инструментов: • а) мощный модуль предварительной обработки, который прореживает необработанные библиографические данные; • б) использование библиометрических показателей для изучения влияния каждого анализируемого элемента и • в) мастер настроек анализа 07.05.2016 Крым - 2013 40 SciMAT 07.05.2016 Крым - 2013 41 SciMAT Текст … 07.05.2016 Крым - 2013 42 SciMAT Текст … 07.05.2016 Крым - 2013 43 SciMAT Текст … 07.05.2016 Крым - 2013 44 Заключение … • Закрытое и платное программное обеспечение ограничивает пользователя-исследователя в творчестве рамками доступа и соответствующих лицензионных соглашений • Представленный список программного обеспечения является практически исчерпывающим • На основе вышеописанных свободно распространяемых программ возможно проведение качественного информетрического исследования • Рассмотренное программное обеспечение может быть рекомендовано специалистам в областях, связанных с информетрическими исследованиями • Открывает путь для самостоятельной работы специалистов в рамках активно развивающихся информетрических исследований и позволяет им вносить вклад в дальнейшее развитие программного обеспечения 07.05.2016 Крым - 2013 45 Спасибо за внимание! Мазов Николай Алексеевич, зав. ИБЦ ИНГГ СО РАН E-mail [email protected] Тел. +7 383 333 22 16 SciMAT (основные характеристики) • • • • • • • • Загрузчики: форматы WoS и RIS. Библиометрия: слово, цитирование автора, цитирование журнала, библиографическую связи. Предварительная обработка: удаление дублей (руководство, множественным числом или расстоянием Levenshtein, или импортированием из файла XML), квантование времени, уплотнение данных и сетевое сокращение. Нормализация: Сила Ассоциации, Эквивалентный Индекс, Индекс Включения, Индекс Jaccard’s и Косинус Salton’s. Отображение (через кластеризацию): Простой Алгоритм Центров, Единственное редактирование, Законченное редактирование, Среднее редактирование и алгоритмы кластеризации Редактирования суммы. Анализ: сетевой анализ (плотность Callon's и центрированность), производительность и качественный анализ (сумма, минимум, максимальные и средние цитаты, и сложные меры, такие как h-индекс, индекс г, индекс гектограмма или q2-индекс), и временный анализ. Визуализация: стратегическая диаграмма, кластерная сеть, накладываясь на карту, карту развития. Отчет: в HTML и формате LaTeX. 07.05.2016 Крым - 2013 47 SciMAT (основные характеристики) • • • • • • • • Loaders: ISI Web of Knowledge format and RIS format. Bibliometric networks: co-word, author co-citation, journal co-citation, author co-citation, bibliographic coupling, journal bibliographic coupling and author bibliographic coupling. Preprocessing: de-duplicating (manual, by plural or by Levenshtein distance, or importing from a XML file), time-slicing, data reduction and network reduction. Normalization: Association Strength, Equivalence Index, Inclusion Index, Jaccard’s Index and Salton’s Cosine. Mapping (through clustering): Simple Centers Algorithm, Single-linkage, Complete-linkage, Average-linkage and Sum-linkage clustering algorithms. Analysis: network analysis (Callon's density and centrality), performance and quality analysis (sum, minimum, maximum and average citations, and complex measures such as the h-index, g-index, hg-index or q2-index), and temporal analysis. Visualization: strategic diagram, cluster network, overlapping map, evolution map. Report: in HTML and LaTeX format. 07.05.2016 Крым - 2013 48 Заголовок слайда … Текст … 07.05.2016 Крым - 2013 49 Заголовок слайда … Текст … 07.05.2016 Крым - 2013 50