Технология поддержки электронных научных публикаций как «живых» документов

advertisement
Технология поддержки
электронных научных публикаций
как «живых» документов
С.И. Паринов
Центральный экономико-математический институт
РАН
М.Р. Когаловский
Институт проблем рынка РАН
Работа поддержана грантами РФФИ (№09-07-00378) и РГНФ (№09-02-12117-в)
XI Всероссийская научная конференция RCDL-2009
Что такое «живой» документ?
• Если текст статьи в электронном виде время от
времени меняется ее автором, то она имеет
статус «живого» документа
• В научной литературе также встречаются термины
«изменчивая публикация» (liquid publication) и
«живая» статья
• Для нас представляют интерес «живые»
документы, возникающие тем или иным
способом в научных репозиториях и, в частности,
в электронных библиотеках
XI Всероссийская научная конференция RCDL-2009
Актуальность проблематики
• 2007, первые публикации по «живым» документам
• 2008, грант 7-й Рамочной Программы ЕС, проект
LiquidPub (http://project.liquidpub.org/), University of
Trento, участвует Springer Science
• 2009, грант РФФИ №09-07-00378, Исследование и
разработка технологий поддержки научных статей
как «живых документов», ЦЭМИ РАН
• 2009, грант РФФИ, конкурс «офи_м»,
«Развивающиеся во времени научные публикации в
интернете», ИПМ РАН им. Келдыша (М.М. ГорбуновПосадов)
• 2009, большое количество упоминаний
проблематики «живых» документов в научных
проектах и презентациях
XI Всероссийская научная конференция RCDL-2009
Проблемы «живых» документов
• Развитие ЭБ делает легко возможным для авторов
изменение текстов их статей, т.к. все чаще сами
авторы загружают свои статьи в ЭБ и имеют к их
файлам и метаданным полный доступ
• Но изменение текста статьи ставит под угрозу
корректность семантических связей (ссылок и
цитат), которые уже для нее сформировались
• Поддержки версионности статей не достаточно,
требуется комплексное решение (гранулирование
статьи, мониторинг, информирование читателей о
статусе статей и текстов, оповещения авторов об
изменениях в статьях и цитировании, и т.п.)
XI Всероссийская научная конференция RCDL-2009
Особенности «живых» документов
в науке
• Написание научных статей и их цитирование видимая часть работы системы научного
разделения труда и взаимодействий между
звеньями этой системы
• Процесс производства нового научного знания
будет эффективнее, если механизм научных
публикаций и цитирования обеспечитболее
динамичные взаимодействия между учеными
• Превращение статей в «живые» документы
является объективным следствием развития
профессиональных взаимодействий в науке
XI Всероссийская научная конференция RCDL-2009
Общие условия эффективного
использования «живых» документов
• Разработка функциональной инфраструктуры,
обеспечивающей авторов и читателей сервисами
создания и поддержки «живых» документов
• Эти сервисы информируют авторов обо всех случаях
установления/удаления связей (например,
цитирования) с его статьей
• При редактировании своей статьи автор знает какие
ее фрагменты процитированы, кем и в какой статье
• Авторы цитат информируются об изменении текста
цитируемой ими статьи-источника
• Читатели статьи информируются, если
содержащиеся в ней цитаты не были обновлены
после изменения соответствующих статейисточников
XI Всероссийская научная конференция RCDL-2009
Проект инфраструктуры для поддержки
"живых" документов в Соционет
http://socionet.ru/
1. «Гранулирование» научных статей для создания
и пополнения коллекций цитат
2. Поддержка подготовки текстов статей на основе
коллекций цитат, пополняемых в результате
гранулирования статей
3. Поддержка различных видов сетей связей
между статьями и цитатами, визуализация сетей
связей для авторов и читателей
4. Мониторинг изменений цитат и связей
цитирования, а также оповещение авторов
5. Визуализация статуса связей для читателей
статей
XI Всероссийская научная конференция RCDL-2009
1. Гранулирование научных статей
• Представляет собой оформление смысловых
элементов статей (которые цитируются или могут
цитироваться) как самостоятельных
информационных объектов типа «цитата»
• Выполняется в процессе цитирования чужих
результатов или заранее авторами результатов
• Упрощает организацию процесса многократного
и многопланового использования (цитирования)
результатов исследований
• Облегчает автоматический мониторинг за
процессами использования результатов
исследований
XI Всероссийская научная конференция RCDL-2009
Техника гранулирования
• Инициативное создание электронных коллекций
цитат как самими авторами, так и другими людьми
• Структура типа данных (полей) цитаты:
– смысловой элемент статьи, выделенный для повторного
использования (цитирования)
– заголовок для данного элемента
– ссылка на статью-источник
– информация для потенциальных пользователей цитат,
например, рубрикаторы областей возможного
применения и рекомендации по применению
• Размещение подобных коллекций в научном
информационном пространстве в открытом доступе
XI Всероссийская научная конференция RCDL-2009
2. Система поддержки авторов
научных статей
• Персональные средства поиска, анализа, выбора и
использования записей из коллекций типа «цитаты» при
подготовке собственных научных статей
• Средства вставки в текст статью цитаты или ссылки
• Возможность добавить собственные записи в коллекции
цитат
• Возможность посмотреть параметры использования цитат,
кто и как их использовал
• Улучшение конкуренции близких по смыслу цитат за право
быть процитированными в статье автора за счет
возможности выбора наиболее подходящей из полного
списка
XI Всероссийская научная конференция RCDL-2009
3. Использование сетей связей
цитирования
• Визуализация графов связей цитирования для
заданных цитат, статей, авторов, организаций
• Анализ временных и структурных изменений в
графах цитирования
• Анализ возмущений в изменении графов,
а также параметров их затуханий
XI Всероссийская научная конференция RCDL-2009
Развитие атрибутов связей
цитирования
• Для уточнения смысла использовании цитаты в
своей статье автор задает семантические
значения соответствующей связи цитирования.
Например:
– цитируемый результат является основанием (одним из)
для получения моего результата;
– мой результат подтверждает или подтверждается
цитируемым результатом;
– цитируемый результат является иллюстрацией моего
результата или имеет с ним логическую связь;
– мой результат опровергает цитируемый результат
XI Всероссийская научная конференция RCDL-2009
4. Мониторинг и оповещения
• Программное отслеживание в автоматическом
режиме всех изменений в цитатах и связях
цитирования в рамках научного информационного
пространства
• Формирование на основе результатов мониторинга
статистической базы использования результатов
исследований
• Автоматическая рассылка оповещений авторам
статей и цитирований о важных для них событиях
XI Всероссийская научная конференция RCDL-2009
5. Отслеживание статуса цитат и
связей цитирования
• Визуализация текущего статуса статей, цитат и
связей цитирования при их просмотре в рамках
научного информационного пространства
• Индикация статей, цитат и связей, которые
должны быть проверены на актуальность при
изменении объектов, на которые они ссылаются
XI Всероссийская научная конференция RCDL-2009
Ожидаемые результаты для ученого
• Получение оперативных сигналов о новых
цитированиях материалов ученого, удалений уже
существующих цитирований, а также об изменении
цитируемых результатов исследований
• Возможность быть в курсе развития/изменения
научных результатов, которые используются данным
ученым в своей работе, а также автоматически
оповещать других ученых, которые используют
результаты ваших исследований, о
развитии/улучшении данных результатов
• Наличие комплексной картины, включая историю
того, кто, когда и зачем (при внедрении модели
цитирования с качественными атрибутами)
цитировал материалы ученого и т.п.
XI Всероссийская научная конференция RCDL-2009
Ожидаемые результаты для науки
• Более высокий уровень информированности
ученых о появлении новых результатов
исследований
• Новые стимулы и лучшие условия для развития
собственных результатов исследований как
следствие новых результатов у других ученых
• Улучшение среднего уровня использования
результатов исследований в научном сообществе
• Повышение степени профессиональной
связанности ученых, использующих результаты
друг друга, и, как следствие, ускорение процессов
создания нового научного знания
XI Всероссийская научная конференция RCDL-2009
Заключение
• Просматриваются перспективы превращения
научной статьи в элемент профессиональной
социальной сети ученого, в которой связи
цитирования между статьями становятся поводом
для устойчивых профессиональных
взаимодействий между исследователями
• Как следствие, возможно превращение корпуса
научных результатов во множество
взаимосвязанных "живых" документов, когда
изменения в одном документе могут порождать
цепную реакцию изменений в связях
цитирования и изменения содержания других
"живых" документов.
XI Всероссийская научная конференция RCDL-2009
Приглашение к сотрудничеству
• Если вас интересует проблематика «живых»
документов применительно к электронным
научным публикациям …
• Если вы планируете разработку и реализацию
подобных сервисов и систем у себя …
• Если вы хотели бы связать/скоординировать вашу
деятельность и ваши результаты с нашими …
• … то дайте знать об этом авторам: sparinov@gmail.com
(Сергей Паринов)
XI Всероссийская научная конференция RCDL-2009
Download