Технология поддержки электронных научных публикаций как «живых» документов С.И. Паринов Центральный экономико-математический институт РАН М.Р. Когаловский Институт проблем рынка РАН Работа поддержана грантами РФФИ (№09-07-00378) и РГНФ (№09-02-12117-в) XI Всероссийская научная конференция RCDL-2009 Что такое «живой» документ? • Если текст статьи в электронном виде время от времени меняется ее автором, то она имеет статус «живого» документа • В научной литературе также встречаются термины «изменчивая публикация» (liquid publication) и «живая» статья • Для нас представляют интерес «живые» документы, возникающие тем или иным способом в научных репозиториях и, в частности, в электронных библиотеках XI Всероссийская научная конференция RCDL-2009 Актуальность проблематики • 2007, первые публикации по «живым» документам • 2008, грант 7-й Рамочной Программы ЕС, проект LiquidPub (http://project.liquidpub.org/), University of Trento, участвует Springer Science • 2009, грант РФФИ №09-07-00378, Исследование и разработка технологий поддержки научных статей как «живых документов», ЦЭМИ РАН • 2009, грант РФФИ, конкурс «офи_м», «Развивающиеся во времени научные публикации в интернете», ИПМ РАН им. Келдыша (М.М. ГорбуновПосадов) • 2009, большое количество упоминаний проблематики «живых» документов в научных проектах и презентациях XI Всероссийская научная конференция RCDL-2009 Проблемы «живых» документов • Развитие ЭБ делает легко возможным для авторов изменение текстов их статей, т.к. все чаще сами авторы загружают свои статьи в ЭБ и имеют к их файлам и метаданным полный доступ • Но изменение текста статьи ставит под угрозу корректность семантических связей (ссылок и цитат), которые уже для нее сформировались • Поддержки версионности статей не достаточно, требуется комплексное решение (гранулирование статьи, мониторинг, информирование читателей о статусе статей и текстов, оповещения авторов об изменениях в статьях и цитировании, и т.п.) XI Всероссийская научная конференция RCDL-2009 Особенности «живых» документов в науке • Написание научных статей и их цитирование видимая часть работы системы научного разделения труда и взаимодействий между звеньями этой системы • Процесс производства нового научного знания будет эффективнее, если механизм научных публикаций и цитирования обеспечитболее динамичные взаимодействия между учеными • Превращение статей в «живые» документы является объективным следствием развития профессиональных взаимодействий в науке XI Всероссийская научная конференция RCDL-2009 Общие условия эффективного использования «живых» документов • Разработка функциональной инфраструктуры, обеспечивающей авторов и читателей сервисами создания и поддержки «живых» документов • Эти сервисы информируют авторов обо всех случаях установления/удаления связей (например, цитирования) с его статьей • При редактировании своей статьи автор знает какие ее фрагменты процитированы, кем и в какой статье • Авторы цитат информируются об изменении текста цитируемой ими статьи-источника • Читатели статьи информируются, если содержащиеся в ней цитаты не были обновлены после изменения соответствующих статейисточников XI Всероссийская научная конференция RCDL-2009 Проект инфраструктуры для поддержки "живых" документов в Соционет http://socionet.ru/ 1. «Гранулирование» научных статей для создания и пополнения коллекций цитат 2. Поддержка подготовки текстов статей на основе коллекций цитат, пополняемых в результате гранулирования статей 3. Поддержка различных видов сетей связей между статьями и цитатами, визуализация сетей связей для авторов и читателей 4. Мониторинг изменений цитат и связей цитирования, а также оповещение авторов 5. Визуализация статуса связей для читателей статей XI Всероссийская научная конференция RCDL-2009 1. Гранулирование научных статей • Представляет собой оформление смысловых элементов статей (которые цитируются или могут цитироваться) как самостоятельных информационных объектов типа «цитата» • Выполняется в процессе цитирования чужих результатов или заранее авторами результатов • Упрощает организацию процесса многократного и многопланового использования (цитирования) результатов исследований • Облегчает автоматический мониторинг за процессами использования результатов исследований XI Всероссийская научная конференция RCDL-2009 Техника гранулирования • Инициативное создание электронных коллекций цитат как самими авторами, так и другими людьми • Структура типа данных (полей) цитаты: – смысловой элемент статьи, выделенный для повторного использования (цитирования) – заголовок для данного элемента – ссылка на статью-источник – информация для потенциальных пользователей цитат, например, рубрикаторы областей возможного применения и рекомендации по применению • Размещение подобных коллекций в научном информационном пространстве в открытом доступе XI Всероссийская научная конференция RCDL-2009 2. Система поддержки авторов научных статей • Персональные средства поиска, анализа, выбора и использования записей из коллекций типа «цитаты» при подготовке собственных научных статей • Средства вставки в текст статью цитаты или ссылки • Возможность добавить собственные записи в коллекции цитат • Возможность посмотреть параметры использования цитат, кто и как их использовал • Улучшение конкуренции близких по смыслу цитат за право быть процитированными в статье автора за счет возможности выбора наиболее подходящей из полного списка XI Всероссийская научная конференция RCDL-2009 3. Использование сетей связей цитирования • Визуализация графов связей цитирования для заданных цитат, статей, авторов, организаций • Анализ временных и структурных изменений в графах цитирования • Анализ возмущений в изменении графов, а также параметров их затуханий XI Всероссийская научная конференция RCDL-2009 Развитие атрибутов связей цитирования • Для уточнения смысла использовании цитаты в своей статье автор задает семантические значения соответствующей связи цитирования. Например: – цитируемый результат является основанием (одним из) для получения моего результата; – мой результат подтверждает или подтверждается цитируемым результатом; – цитируемый результат является иллюстрацией моего результата или имеет с ним логическую связь; – мой результат опровергает цитируемый результат XI Всероссийская научная конференция RCDL-2009 4. Мониторинг и оповещения • Программное отслеживание в автоматическом режиме всех изменений в цитатах и связях цитирования в рамках научного информационного пространства • Формирование на основе результатов мониторинга статистической базы использования результатов исследований • Автоматическая рассылка оповещений авторам статей и цитирований о важных для них событиях XI Всероссийская научная конференция RCDL-2009 5. Отслеживание статуса цитат и связей цитирования • Визуализация текущего статуса статей, цитат и связей цитирования при их просмотре в рамках научного информационного пространства • Индикация статей, цитат и связей, которые должны быть проверены на актуальность при изменении объектов, на которые они ссылаются XI Всероссийская научная конференция RCDL-2009 Ожидаемые результаты для ученого • Получение оперативных сигналов о новых цитированиях материалов ученого, удалений уже существующих цитирований, а также об изменении цитируемых результатов исследований • Возможность быть в курсе развития/изменения научных результатов, которые используются данным ученым в своей работе, а также автоматически оповещать других ученых, которые используют результаты ваших исследований, о развитии/улучшении данных результатов • Наличие комплексной картины, включая историю того, кто, когда и зачем (при внедрении модели цитирования с качественными атрибутами) цитировал материалы ученого и т.п. XI Всероссийская научная конференция RCDL-2009 Ожидаемые результаты для науки • Более высокий уровень информированности ученых о появлении новых результатов исследований • Новые стимулы и лучшие условия для развития собственных результатов исследований как следствие новых результатов у других ученых • Улучшение среднего уровня использования результатов исследований в научном сообществе • Повышение степени профессиональной связанности ученых, использующих результаты друг друга, и, как следствие, ускорение процессов создания нового научного знания XI Всероссийская научная конференция RCDL-2009 Заключение • Просматриваются перспективы превращения научной статьи в элемент профессиональной социальной сети ученого, в которой связи цитирования между статьями становятся поводом для устойчивых профессиональных взаимодействий между исследователями • Как следствие, возможно превращение корпуса научных результатов во множество взаимосвязанных "живых" документов, когда изменения в одном документе могут порождать цепную реакцию изменений в связях цитирования и изменения содержания других "живых" документов. XI Всероссийская научная конференция RCDL-2009 Приглашение к сотрудничеству • Если вас интересует проблематика «живых» документов применительно к электронным научным публикациям … • Если вы планируете разработку и реализацию подобных сервисов и систем у себя … • Если вы хотели бы связать/скоординировать вашу деятельность и ваши результаты с нашими … • … то дайте знать об этом авторам: [email protected] (Сергей Паринов) XI Всероссийская научная конференция RCDL-2009