Технология научных исследований в области машинного обучения Цель дисциплины Научить студентов точно излагать свои и чужие решения задач анализа данных и машинного обучения. Написать научную статью, которая была бы принята другими исследователями, работающими в нашей области; сделать доклад. Результат: научная статья, поданная в рецензируемый журнал из списка ВАК. Задачи дисциплины Технология научных исследований — практические занятия, посвященные изучению методов научной работы и выполнения исследовательских проектов в области машинного обучения и анализа данных. Задачей третьекурсников является исследование свойств алгоритмов прогнозирования. Целью работы является написание научной статьи с элементами математической новизны с последующей подачей в научный журнал. В процессе работы студенты изучают методы и технику написания научных статей и проведения вычислительных экспериментов, а также сопутствующие этому процессу технологии — язык разметки научных текстов LaTeX, формат представления библиографической записи BibTeX, язык программирования высокого уровня m-code. Работа включает следующие этапы: сбор и анализ литературы, математическая постановка задачи, описание метода решения задачи и исследование его свойств, проведение вычислительного эксперимента. Каждому студенту предлагается персональная тема, по которой он анализирует публикации отечественных и зарубежных исследователей за последние десять лет, ставит задачу и делает доклад для группы о полученных результатах. Далее выполняется математическое описание метода, делается промежуточный доклад о состоянии работ. Последним шагом работы становится вычислительный эксперимент, иллюстрирующий свойства метода и использующий синтетические или реальные данные. Каждая статья рецензируется одногруппниками автора, работы синхронизируются на сайте SourceForge.org, проект «MLAlgorithms». Дисциплина «Технология научных исследований» базируется на дисциплинах: 1. Машинное обучение 2. Математическая статистика 3. Алгоритмы и структуры данных В результате освоения дисциплины обучающиеся должны знать: основные методы анализа данных и машинного обучения уметь: организовывать свою научно-исследовательскую работу и оформлять ее результаты владеть: базовыми инструментами анализа данных и машинного обучения Содержание дисциплины 1. Введение в предмет. Обзор инструментов, пробное программирование. Вводная лекция. Мотивационная часть, цели. Знакомство со структурой и расписанием курса, системой консультирования и оценивания. Установка необходимых 2. 3. 4. 5. 6. инструментов, ознакомление с рекомендованными статьями. Обзор основных инструментов, демонстрация интерфейсов. Выбор задачи пробного программирования. Рекомендации по сбору литературы, основные требования к списку литературы. Решение задачи пробного программирования, оформление результатов в виде графиков. Обзор задач. Написание аннотации и введения. Обзор задач, предлагаемых для исследования. План написания аннотации и введения с обзором собранной литературы. Постановка задачи. Вычислительный эксперимент. Формат поставки задачи и план базового вычислительного эксперимента. Краткий отчет с описанием проведенного эксперимента, использованных данных и комментарием к результатам. Результаты и их визуализация. Обсуждение результатов, способов визуализации результатов. Постановка вычислительного эксперимента на основе предлагаемого алгоритма с учетом предыдущих результатов, описание результатов в разделе “Вычислительный эксперимент”. Доклады промежуточных результатов. Обсуждение результатов. Описание теоретической части статьи и предлагаемого алгоритма. Разбор структуры статьи в целом. Рекомендации по описанию рисунков, выводов, заключения. Написание раздела “Заключение”. Математические методы анализа ошибки. Обзор математических методов анализа ошибки. Написание раздела “Вычислительный” эксперимент с использование одного из предложенных методов анализа ошибки. Доклад о завершенной работе. Основная литература 1. Ф. А. Кузин. Кандидатская диссертация. Методика написания, правила оформления и порядок защиты: Практ. пособие для аспирантов и соискателей ученой степени. — 2 - е изд. — М.: «Ось-89», 1998. 2. Умберто Эко. Как написать дипомную работу. Гуманитарные науки: Учебнометодическое пособие / Пер. с ит. Е.Костюкович. — 3 изд. — М., КДУ, 2004. — 240 с. 3. А. Б. Сосинский. Как написать математическую статью по-английски. — М: Изд-во «Факториал Пресс», 2000. 4. С. С. Кутателадзе. Russian-To-English in Writing: Советы эпизодическому переводчику. Новосибирск: Изд-во Ин-та математики, 2000. Электронные ресурсы 1. Адрес страницы курса: bit.ly/16UIlQH 2. Страница группы bit.ly/1yhhdTC 3. Описание курса 4. Список задач для пробного программирования 5. Учебные примеры 6. Временной ряд (библиотека примеров) 7. Список завершенных проектов 8. План лекций