www.antiplagiat.ru Особенности проверок диссертаций с помощью системы Антиплагиат Юрий Викторович Чехович, к.ф.-м.н. 18 февраля 2016 года, г. Бишкек, Республика Кыргызстан www.antiplagiat.ru СИСТЕМА АНТИПЛАГИАТ. КОРОТКО • Антиплагиат – это специализированная поисковая система • Поисковый запрос – документ (любой формат, любой размер) • Ответ на запрос – документ запроса, в котором «подсвечен» заимствованный текст, показаны источники, рассчитан «процент оригинальности» • Сайт www.antiplagiat.ru – общедоступная ограниченная версия • Антиплагиат.Корп, Антиплагиат.ВУЗ (*.antiplagiat.ru) – версии для организаций и учебных заведений, учитывающие специфику процессов организаций 18 февраля 2016 года г. Бишкек 2 www.antiplagiat.ru АНТИПЛАГИАТ. КАК ЭТО РАБОТАЕТ 18 февраля 2016 года г. Бишкек 3 www.antiplagiat.ru АНТИПЛАГИАТ. КАК ЭТО РАБОТАЕТ 21-24 октября 2014 года «Образовательная среда-2014» г. Москва 4/14 www.antiplagiat.ru АНТИПЛАГИАТ. КАК ЭТО РАБОТАЕТ 21-24 октября 2014 года «Образовательная среда-2014» г. Москва 5/14 www.antiplagiat.ru АНТИПЛАГИАТ. КАК ЭТО РАБОТАЕТ 21-24 октября 2014 года «Образовательная среда-2014» г. Москва 6/14 www.antiplagiat.ru АНТИПЛАГИАТ. КАК ЭТО РАБОТАЕТ 18 февраля 2016 года г. Бишкек 7 www.antiplagiat.ru НАЧАЛО ПРОЕКТА • 2005 год: – Вузам нужна система для проверки работ студентов – Разработчик алгоритмов: Вычислительный центр РАН • • • • академик РАН Ю.И. Журавлев член-корреспондент РАН К.В. Рудаков доктора и кандидаты наук – сотрудники ВЦ РАН молодые ученые МФТИ, МГУ – Разработчик системы: компания «Форексис», – Запуск сайта www.antiplagiat.ru – Организована компания «Антиплагиат» • 2006 год: – Зарегистрирован торговый знак: Антиплагиат® 18 февраля 2016 года г. Бишкек 8 www.antiplagiat.ru ПРИЗНАНИЕ ПРОЕКТА • • • • • • • • • • 2006: победа в Конкурсе русских инноваций, первое внедрение в вузе 2007: топ 10 Премии Рунета, внедрение в ГУ ВШЭ 2008: внедрение в Российской государственной библиотеке 2009: финалист премии имени Владимира Зворыкина 2010: внедрение в Минобрнауки РФ, 16 вузов 2011: ВАК Кыргызстана – первое зарубежное внедрение, внедрение в ГК «Росатом», 52 вуза 2012: Премия Правительства РФ в области образования, внедрение в ЦИТиС, 140 вузов 2013: внедрение в Дирекции НТП, 240 вузов 2014: резидент «Сколково», внедрение в НЭБ eLIBRARY.RU, 350 вузов, больше 3 миллионов студентов, номинант Премии Рунета 2015: 510 вузов России, Казахстана, Кыргызстана, Беларуси 18 февраля 2016 года г. Бишкек 9 www.antiplagiat.ru АНТИПЛАГИАТ СЕЙЧАС. ЦИФРЫ • ~ 10 секунд на проверку среднего документа • > 200 тысяч проверок в сутки (в 2016 году ожидаем 300 тысяч) • >20 миллионов проверенных документов в год • ~ 110 миллионов существенно разных источников • > 510 вузов России и ближнего зарубежья • ~ 2 000 000 пользователей 18 февраля 2016 года • 40 участников команды: математики, программисты, инженеры • 2 территориальноразнесенные площадки: до 8 серверов в пике • 2 площадки партнеров: РГБ, eLIBRARY.RU • Еженедельное обновление индекса • Постоянное совершенствование системы г. Бишкек 10 www.antiplagiat.ru ЧТО МОЖЕТ АНТИПЛАГИАТ? • Проверять тексты на любых языках • Исправлять замены сходных по написанию букв • Обнаруживать перестановки предложений, абзацев, страниц и т.п. • Корректно обрабатывать вставку, удаление, замену форм слов • Оповещать о попытках «обхода» системы 18 февраля 2016 года г. Бишкек 11 www.antiplagiat.ru ЧЕГО НЕ МОЖЕТ АНТИПЛАГИАТ? • Проверять изображения, формулы, графики, сложные таблицы • Обнаруживать текст, переписанный «своими словами» • Заменить человека в принятии решения о качестве проверяемого документа 18 февраля 2016 года г. Бишкек 12 www.antiplagiat.ru ГДЕ ИЩЕТ АНТИПЛАГИАТ? • Интернет (>92 млн.) на русском, английском, украинском, казахском, белорусском, киргизском языках : – – – – – – Журналы ВАК Ученые советы Патенты России и СССР Arxiv.org Cyberleninka.ru Другие открытые сайты (рефераты, аналитика, СМИ) • • • • Диссертации и авторефераты РГБ (843 тыс.) Полные тексты научных статей НЭБ eLibrary.ru (>11 млн.) Юридические и нормативные документы Лекспро (11,5 млн.) Собственная коллекция (неограниченный объем, возможности автоматического пополнения) • Кольцо Вузов 18 февраля 2016 года г. Бишкек 13 АНТИПЛАГИАТ Исследование Тема: изучение структуры заимствований в текстах диссертаций, защищенных по историческим наукам, хранящимся в электронной коллекции полных текстов диссертаций РГБ Цель: исследование применимости системы «Антиплагиат» для массового анализа на заимствования специализированных узкотематических коллекций объемных документов Исторические диссертации АНТИПЛАГИАТ 1 2 3 4 Обрабатывались 14 256 текстов по специальностям 07.ХХ.ХХ Суммарный объем текста – 7,2 млрд. символов, около 3,6 миллионов условных страниц 2204 докторских, 12052 кандидатских диссертации Проблемы оцифровки: переносы, сноски, номера страниц Этапы исследования АНТИПЛАГИАТ 1 Предобработка данных: удаление некорректных файлов (пустые, ошибочные, неправильная кодировка), построение индекса 2 Построение отчетов о заимствованиях по принципу «каждый со всеми» (длительная операция) 3 Постобработка отчетов: фильтрация по году защиты, удаление малообъемных заимствований и объединение блоков, учет корректного цитирования, учет расположения заимствований 4 Анализ и интерпретация результатов Исторические рамки АНТИПЛАГИАТ Количество диссертаций 1400 1200 Период защит с 1965 по 2012 Более 90% диссертаций защищено после 1999 1000 800 600 400 200 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 2002 2001 2000 1999 1998 1997 1996 1995 1994 1993 1992 1991 1990 1989 1988 1987 1986 1985 1984 1983 1982 1981 1980 0 АНТИПЛАГИАТ Структура заимствований АНТИПЛАГИАТ Объемы заимствований Более 10% диссертаций имеют значимые заимствования Страница 10 из 12 АНТИПЛАГИАТ Направление заимствований АНТИПЛАГИАТ Влияние нормативной базы www.antiplagiat.ru СПАСИБО ЗА ВНИМАНИЕ! Компания «Антиплагиат» +7 (495) 223-23-84 [email protected] Чехович Юрий Викторович 22