Проект описания Антиплагиат - Московский государственный

advertisement
Система Антиплагиат.МГУ
Описание
Москва, МГУ 2009
Содержание
Содержание ........................................................................................................................................................... 2
Аннотация .............................................................................................................................................................. 3
Общее описание системы Антиплагиат.МГУ ....................................................................................... 3
Основные функциональные возможности Системы ....................................................................... 3
Дополнительные функциональные возможности Системы .................................................. 5
Описание некоторых процессов использования Системы ........................................................... 5
Регистрация пользователей .................................................................................................................... 5
Проверка документов ................................................................................................................................. 6
Работа с Системой через сайт ............................................................................................................ 6
Работа с Системой средствами электронной почты .............................................................. 6
Работа с несколькими коллекциями ................................................................................................... 7
Работа с «белыми коллекциями» .......................................................................................................... 7
Работа с «оперативной коллекцией» .................................................................................................. 7
Индексация собственных фондов + работы студентов ............................................................ 8
Коллекция собственных фондов МГУ............................................................................................ 8
Внесение работ в межфакультетскую и отдельные факультетские коллекции .... 8
Работа со статистическими отчетами о функционировании Системы ............................ 8
Роли пользователей Системы ..................................................................................................................... 8
Суперадминистратор................................................................................................................................... 8
Преподаватель ................................................................................................................................................ 9
Студент ............................................................................................................................................................... 9
Администратор факультета .................................................................................................................... 9
Сотрудник ученого совета ........................................................................................................................ 9
Надежность Системы и информационная безопасность Error! Bookmark not defined.
Приложение 1.................................................................................................................................................... 11
Приложение 2.................................................................................................................................................... 12
2
Аннотация
Документ разработан во исполнение решения, принятого на заседании Рабочей
группы по внедрению системы Антиплагиат в Московском государственном
университете 8 июня 2009 года. Документ содержит описание системы
Антиплагиат.МГУ, рекомендуемой Рабочей группой для внедрения. Описание
системы дается путем перечисления ее функциональных возможностей и описания
процессов ее использования. Документ не служит техническим заданием на систему
Антиплагиат.МГУ, но должен быть учтен при его написании.
Общее описание системы Антиплагиат.МГУ
Система Антиплагиат.МГУ (далее – Система) предназначена для обнаружения и
профилактики случаев студенческого и научного плагиата в Московском
университете. Основной принцип действия Системы – сличение всех текстовых
работ студентов и аспирантов, требующих подтверждения их оригинальности, с
базой источников Системы с целью нахождения в них идентичных или частично
совпадающих фрагментов.
Физически Система располагается на сервере (серверах) на площадке факультета
Вычислительной математики и кибернетики. Требования к серверам и площадке
вносятся в техническое задание на Систему.
Доступ к сервисам Системы осуществляется, как посредством внутренней
телекоммуникационной сети МГУ, так и по каналам интернета. Доступ
осуществляется с персональных компьютеров, подключенных к сети, с
использованием стандартных браузеров или приложений для работы с электронной
почтой. Система поддерживает авторизацию пользователей. Авторизуясь в Системе,
пользователь попадает в личный кабинет, где получает тот набор сервисов, который
соответствует его пользовательским правам.
Основным результатом работы Системы является отчет о проверке документа. В
отчете отмечаются те фрагменты проверяемого документа, которые были найдены
в коллекции источников Системы, а также указывается соотношение
заимствованного и оригинального текста в нем.
Вопросы и методические указания по использованию результатов работы Системы в
учебном процессе содержатся в «Положении о плагиате Московского университета»
и в других нормативных актах и инструкциях.
Основные функциональные возможности Системы
1. Поиск заимствований в текстовых документах наиболее распространенных
форматов (MS Office Word (DOC, DOCx), MS Office PowerPoint (PPT, PPTx), RTF,
PDF, TXT, HTML, ZIP и RAR).
2. Построение отчетов о проверке с указанием тех фрагментов анализируемого
текста, которые были найдены системой в базе источников, с возможностью
просмотра текста этих источников.
3
3. Время проверки одного документа – в среднем, около 3 секунд.
4. Доступ пользователя к личному кабинету через Интернет или по внутренней
сети МГУ.
5. Выдача краткого отчета, содержащего список источников и процента
оригинальности документа, а также полного отчета о проверке, плюс,
возможность выбора наиболее подходящего для пользователя из четырех
вариантов его отображения.
6. Возможность работы пользователей с Системой посредством электронной
почты.
7. Формирование собственной базы внутренних источников (работы учащихся
прошлых лет, учебники, художественная литература, методические
материалы и другие тексты), как общей для всех факультетов, так и
отдельных для расширения области поиска плагиата.
8. Присвоение обрабатываемым системой документам атрибутов в зависимости
от их типов (например, типов «Книга», «Статья», «Студенческая работа»,
«Прочее» и др.).
9. Подключение к коллекции интернет-сервиса www.antiplagiat.ru, которая
формируется из текстов, размещенных в свободном доступе в Интернете, и на
сегодняшний день насчитывает более 25 миллионов документов.
10. Подключение к дополнительной коллекции, держателем которой является
Российская государственная библиотека, содержащей 350 тысяч диссертаций
и авторефератов, для выявления случаев научного плагиата.
11. Подключение к дополнительной коллекции, содержащей 100 тысяч законов и
других нормативных документов, для специфичной проверки текстов
юридической направленности (с использованием «механизма белого
цитирования»*).
12. Подключение других дополнительных коллекций – например, других вузов с
установленной системой Антиплагиат.
13. Использование «оперативной коллекции», позволяющей отслеживать случаи
одновременной сдачи одинаковых или похожих работ в параллельных
группах на факультете или на разных факультетах.
14. Автоматическое обнаружение в проверяемом документе таких его частей, как
содержание, библиография и цитаты, заключенные в кавычки, и включение
найденного таким образом текста в класс оригинального.
15. Система сигнализации пользователей о попытках «обмана» Системы
студентами путем специальной модификации документов без изменения их
смыслового содержания с целью повышения выдаваемой Системой оценки.
Подробнее об этом механизме изложено в разделе «Работа с «белой коллекцией»» данного
документа
*
4
Дополнительные функциональные возможности Системы
1. Интерактивное визуальное сравнение двух документов для наглядного
определения степени их совпадения, как на сайте, так и с помощью
программы Antiplagiat Report Viewer.
2. Для пользователей Системы в роли сотрудника ученого совета (см. раздел
документа «Роли пользователей Системы») двухступенчатый поиск, суть
которого заключается в следующем:
a. на первой ступени Система определяет всё множество источников для
проверяемого документа, найденное в коллекции Системы, и выдает их
пользователю в виде таблицы;
b. далее пользователь из найденного множества источников выделяет
некоторые, его заинтересовавшие (возможен выбор всех источников,
но скорость выполнения второй ступени поиска существенно зависит
от числа выбранных источников);
c. на второй ступени поиска Система строит подробный отчет о проверке
по выбранным пользователем источникам.
3. Автоматическое атрибутирование проверяемых Системой документов, что
позволяет заполнять такие атрибуты документов как «Автор», «Название»,
«Дисциплина» и другие.
4. Установка на площадке МГУ программы-робота для оперативной индексации
некоторых ресурсов, в том числе, иноязычных.
5. Обнаружение цитат, заключенных в кавычки, для того, чтобы за их счет
общая оценка оригинальности работы студента не снижалась.
6. Поддержка дополнительных по отношению к текущим обрабатываемым
форматам текстовых документов.
Описание некоторых процессов использования Системы
Регистрация пользователей
Для регистрации пользователей Системы, планируется использование специального
приложения. Это приложение обеспечивает полный цикл управления учетными
записями от создания учетных записей в почтовой системе и импорта данных во
внутреннюю базу, до распечатки имен и паролей студентам и отправки писем с
настраиваемым содержимым по электронной почте. Схема работы с приложением
следующая:
1. В базу приложения импортируется список студентов в одном из табличных
форматов. В дальнейшем этот список регулярно актуализируется.
2. Для новых пользователей формируются адреса электронной почты (для
повторяющихся фамилий последовательно перебираются 5 методов
формирования имени в транслите – Name.Surname , NameSurname,
Surname.Name, Nam.Surname, Surname.Nam, для шестого пользователя будет
использован первый метод и прибавлена единица, для 7-го – второй и
единица, для 11-го первый метод и двойка и т.д.)
5
3. Для новых пользователей запускаются скрипты создания учетных записей и,
отдельно, обновления. Таким образом, эти процессы разделены, что
повышает эффективность.
4. Далее с помощью формы поиска и распечатки в приложении можно по набору
фильтров сделать выборки учетных записей (например, только первый курс
отдельного факультета) и сделать их массовую распечатку. Кроме того,
можно отправить сформированной выборке письмо по электронной почте.
Например, последовательно проводится активация учетных записей для
первого курса факультета, делается распечатка листовок с логином и паролем
и отправляется письмо-приветствие (каждое письмо уникально и может
обращаться к студенту по имени). Листовки все студенты получают в
деканате с отметкой о вручении.
Проверка документов
Работа с Системой через сайт
1. Пользователь загружает документы на проверку в личном кабинете. Загруженные
документы организуются аналогично файловой системе на компьютере (иерархия
папок).
2. Через некоторое время после загрузки, Система формирует отчет о проверке
документа, ссылка на который становится доступной в кабинете пользователя.
3. Работа с отчетом также производится непосредственно на сайте, кроме того,
существует возможность загрузить отчет на компьютер пользователя в виде
отдельного файла специального формата APD и поработать с ним локально с
помощью специального приложения Antiplagiat Report Viewer.
4. Загруженные документы и построенные отчеты хранятся в кабинетах пользователей
неограниченное время. Пользователь имеет возможность переносить документы из
папки в папку, а также удалять их.
Работа с Системой средствами электронной почты
5. На сайте МГУ в специальном разделе студент выясняет электронный адрес
преподавателя, которому ему необходимо сдать на проверку работу.
6. Используя любую программу – почтовый клиент стороннего производителя или
почтовый сервис, студент составляет электронное письмо с приложенной работой. И
отправляет его на два адреса: antiplagiat@msu.ru и адрес преподавателя.
7. После формирования отчета по присланной работе студента, система создает письмо
с приложением файла в формате APD, содержащего отчет по присланной работе
студента, и посылает это письмо по электронному адресу преподавателя, которому
оно предназначается.
8. Преподаватель получает письмо с отчетом, и имеет возможность работать с ним при
помощи программы Antiplagiat Report Viewer, которая поставляется вместе с
системой, а также находится в свободном доступе для загрузки на сайте
www.antiplagiat.ru. Подлинность отчета гарантируется применением технологии
цифровых сертификатов, которыми при создании подписываются файлы формата
APD .
6
Работа с несколькими коллекциями
По умолчанию, построение отчета производится одновременно по всем доступным данному
пользователю коллекциям. Набор коллекций, доступных пользователям того или иного
факультета, устанавливается суперадминистратором Системы. Пользователь может перед
построением отчета по документу выбрать, по каким (из числа доступных) коллекциям
должна производиться его проверка. При работе пользователя с Системой средствами
электронной почты, отчет всегда строится по всем доступным коллекциям.
В сводном отчете (то есть в отчете, построенном не по одной коллекции) одни и те же
фрагменты проверяемого документа могут быть найдены Системой одновременно в
нескольких коллекциях. В связи с этим, в Системе был предусмотрен механизм приоритета
отображения источников в сводном отчете. В порядке убывания приоритета отображения
источников, коллекции располагаются следующим образом:
1. «Белая коллекция» юридических документов
2. Коллекция диссертаций и авторефератов
3. Коллекция собственных фондов МГУ
4. Межфакультетская коллекция + отдельные факультетские коллекции
5. Коллекция документов, собранных в интернете
6. «Оперативная коллекция»
Если фрагменты при проверке документа были обнаружены в разных коллекциях,
находящихся на одном уровне иерархии отображения источников, приоритет отдается
источнику, имеющему большее пересечение с проверяемым документом.
Работа с «белыми коллекциями»
«Механизм белого цитирования» позволяет особым образом учитывать при подсчете
оценки оригинальности фрагменты проверяемого текста, найденные в соответствующей –
«белой» – коллекции.
При построении сводного отчета, цитаты, найденные в «белой коллекции» и в других
коллекциях выделяются по-разному, что позволяет преподавателю визуально отличать
цитирование законов от других цитат. Кроме того, цитирование из «белой коллекции» не
снижает общую оценку оригинальности, выдаваемую Системой. Эта возможность особенно
важна при проверке работ юридической направленности, в которых цитирование законов
является неотъемлемой частью.
Работа с «оперативной коллекцией»
В том случае, если при построении сводного отчета источники были найдены только в
«оперативной коллекции», они так же, как и цитаты из «белой коллекции» выделяются в
тексте особым образом. Помимо такого выделения, в Системе предусматривается
дополнительная сигнализация для привлечения внимания преподавателя. Эта
сигнализация срабатывает также в том случае, если в оперативной коллекции оказываются
практически одинаковые документы (отличающиеся 15-20%). Это позволяет
преподавателю выявлять случаи, когда студенты списывают друг у друга – внутри группы, в
параллельных группах и даже на разных факультетах.
В остальном, работа с «оперативной коллекцией» аналогична работе с другими
коллекциями (кроме «белых коллекций»).
7
Индексация собственных фондов + работы студентов
Расширение собственной базы источников потенциального цитирования МГУ
значительно повышает эффективность работы Системы в целом. Это расширение
будет производиться за счет наполнения коллекции собственных фондов МГУ,
межфакультетской коллекции работ студентов и отдельных факультетских
коллекций, также содержащих студенческие работы.
Коллекция собственных фондов МГУ
В коллекцию собственных фондов МГУ Системой документы добавляются
суперадминистратором Системы. Документы могут заноситься в коллекцию как по
одному, так и пакетно. В обоих случаях предусмотрена возможность
атрибутирования документов.
Внесение работ в межфакультетскую и отдельные факультетские коллекции
Все документы, находящиеся в «оперативной коллекции» по определенному
расписанию (например, два раза в год, во время студенческих каникул или в начале
семестра) переносятся в основные коллекции студенческих работ.
Работа со статистическими отчетами о функционировании Системы
Отчеты о функционировании Системы доступны суперадминистратору. Данные
отчеты представляют собой набор срезов данных, накопленных за время
функционирования Системы. Далее представлен список групп отчетов, доступных
суперадминистратору, и которые касаются:
1. числа пользователей Системы;
2. числа проверенных Системой документов;
3. процента оригинальности;
4. числа документов в коллекциях источников;
5. функционирования «оперативной коллекции»;
6. возникавших ошибок при работе Системы;
7. {содержимого проверяемых документов (основные ключевые
проверяемых документах, наиболее популярные темы работ)}
слова
в
Роли пользователей Системы
Суперадминистратор
Основная задача Суперадминитратора Системы - управление содержимым
коллекций источников, а также доступом пользователей факультетов к ним.
Суперадминистратор обладает доступом ко всем документам, проверенным
Системой, и ко всем документам в собственных коллекциях МГУ.
Суперадминистратор имеет также доступ к отчетам о функционировании Системы в
целом и в разрезах отдельных факультетов.
8
Преподаватель
Основная задача преподавателя при работе с Системой - изучить сформированный
ею отчет о проверке документа (работы студента) и определить, руководствуясь, в
том числе, «Положением о плагиате Московского университета» и другими
применимыми нормативными документами и инструкциями, являются ли
найденные в этом документе цитаты корректными, а их число допустимым для
данного типа работы.
При работе с Системой через сайт, преподаватель самостоятельно загружает
документы, полученные от студентов в электронном виде, на проверку в личном
кабинете. Через некоторое время после загрузки, преподаватель может работать с
построенным отчетом.
При работе с Системой средствами электронной почты, преподаватель получает два
письма по каждой работе. Первое письмо приходит к нему от студента и содержит
исходный документ в электронном виде. Второе письмо приходит от Системы через
некоторое время после первого, и содержит отчет о проверке документа в
специальном формате APD. Далее преподаватель может работать с отчетом с
помощью приложения Antiplagiat Report Viewer. Это приложение преподаватель
сможет в любой момент загрузить с сайта Системы во внутренней сети МГУ или с
сайта сервиса www.antiplagiat.ru.
Студент
Задача Студента при работе с Системой - передать преподавателю работу на
проверку в электронном виде в одном из поддерживаемых форматов. Студент может
сделать это, передав копию файла любым доступным способом (с тем чтобы
преподаватель самостоятельно через сайт Системы загрузил его на проверку), или
отправив документ по электронной почте на два адреса - адрес преподавателя и
адрес antiplagiat@msu.ru. Адрес преподавателя студент сможет узнать, зайдя на сайт
Системы в специальный раздел.
Администратор факультета
Основная задача администратора факультета при работе с Системой – обеспечить
доступ преподавателей к сервисам Системы. Для этого в их личных кабинетах на
сайте Системы есть средство управления списком преподавателей. Кроме того, в их
задачи входит опубликование списка адресов электронной почты преподавателей в
соответствующем разделе сайта Системы.
Администратор факультета имеет также доступ к отчетам о функционировании
Системы в разрезе соответствующего факультета.
Сотрудник ученого совета
Основная задача сотрудника ученого совета при работе с Системой - проверка
научных работ и статей, подготавливаемых на факультетах Университета, по базе
диссертаций РГБ.
Надежность Системы и информационная безопасность
Информационная безопасность Системы обеспечивается применением технологии
цифровой подписи и использованием защищенных соединений при передаче
9
данных между компонентами Системы, внешними коллекциями. Доступ к другой
внешней информации (получение документов на проверку, отправка отчетов о
проверке) осуществляется через специальный защищенный шлюз.
Надежность
функционирования
системы
обеспечивается
применением
сертифицированного оборудования и дублированием критических программных и
аппаратных компонентов.
Безопасность данных системы также обеспечивается за счет их резервного
копирования, производимого на регулярной основе.
10
Приложение 1
Архитектура Системы
Сайт для преподавателей
Сайт для администраторов
Хранилище
технической информации
Сайт системы,
отображающий статистику
Почтовый менеджер
Identity
Lifecycle Manager
Администраторы
Преподаватели
Хранилище
учетной информации
Подсистема
проверки документов
Студенты
Шлюз к внешним
коллекциям
Защищенный
протокол ssl
Почтовые серверы
Почтовая служба
(webmail)
Защищенный
протокол ssl
Приложение 2
Информационная иерархия Системы
12
Download