Интеллектуальные информационные технологии

реклама
2
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Институт математики и компьютерных наук
Кафедра информационных систем
Кугаевских Александр Владимирович
ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
Учебно-методический комплекс. Рабочая программа
для студентов направления 09.04.03 «Прикладная информатика», магистерская
программа «Прикладная информатика в экономике», очная форма обучения
Тюменский государственный университет
2014
3
Кугаевских А.В. Интеллектуальные информационные технологии. Учебнометодический комплекс. Рабочая программа для студентов направления 09.04.03
«Прикладная информатика», магистерская программа «Прикладная информатика в
экономике», очная форма обучения. Тюмень, 2014, 11 стр.
Рабочая программа составлена в соответствии с требованиями ФГОС ВО с учетом
рекомендаций и ПрОП ВО по направлению и профилю подготовки.
Рабочая программа дисциплины (модуля) опубликована на сайте ТюмГУ: Интеллектуальные
информационные
технологии
[электронный
ресурс]
/
Режим
доступа:
http://www.umk3plus.utmn.ru, раздел «Образовательная деятельность», свободный.
Рекомендовано к изданию кафедрой информационных систем. Утверждено директором
Института математики и компьютерных наук.
ОТВЕТСТВЕННЫЙ РЕДАКТОР:
заведующий кафедрой информационных систем,
д.т.н., профессор Глухих И.Н.
© Тюменский государственный университет, 2014.
© Кугаевских А.В., 2014.
4
1.
Пояснительная записка
1.1.
Цели и задачи дисциплины (модуля)
Целью данной дисциплины является формирование у студентов знаний в области
современных и перспективных интеллектуальных систем и принципов их построения, а
также знаний по применению современных алгоритмов и технологий интеллектуальной
обработки данных.
Задачи: ознакомить студентов с современным состоянием исследований в области
искусственного интеллекта и применения интеллектуальных алгоритмов к задачам анализа
данных, дать основы для самостоятельной разработки новых интеллектуальных алгоритмов.
1.2.Место дисциплины в структуре образовательной программы
Б1.В.ОД.2. Вариативная часть. Обязательные дисциплины
Требуется успешное освоение программы бакалавриата, навыки объектно-ориентированного
и функционального программирования.
Также требуется успешное освоение тем 1-3, 11 дисциплины «Математические и
инструментальные методы поддержки принятия решений».
№
п/п
1.
Таблица 1.
Разделы дисциплины и междисциплинарные связи с обеспечиваемыми
(последующими) дисциплинами
Наименование
Темы дисциплины необходимые для изучения
обеспечиваемых
обеспечиваемых (последующих) дисциплин
(последующих)
1.1
1.2
1.3
2.1
2.2
3.1
3.2
дисциплин
Управление знаниями
+
+
+
1.3. Компетенции обучающегося, формируемые в результате освоения данной
образовательной программы.
В результате освоения ОП выпускник должен обладать следующими компетенциями:
ОПК-5. Способность на практике применять новые научные принципы и методы
исследований
ПК-10. Способность проводить маркетинговый анализ ИКТ и вычислительного
оборудования для рационального выбора инструментария автоматизации и информатизации
прикладных задач
1.4. Перечень планируемых результатов обучения по дисциплине (модулю):
Знать современное состояние исследований в области интеллектуальных систем и
технологий, принципы построения обучающихся систем, принципы применения и
построения многоагентных систем.
Уметь проводить анализ предметной области и определять задачи, для решения которых
целесообразно использование технологий интеллектуальных систем; определять назначение,
выбирать методы и средства для построения прикладных интеллектуальных систем.
Владеть навыками разработки алгоритмов и моделей интеллектуального анализа данных,
кластерного анализа, построения искусственных нейронных сетей и алгоритмов
интеллектуального поиска решений.
5
2. Структура и трудоемкость дисциплины.
Семестр 2. Форма промежуточной аттестации: экзамен. Общая трудоемкость
дисциплины составляет 4 зачетных единицы, 144 академических часа, из них 72,95 часа,
выделенных на контактную работу с преподавателем (из них 14 часов лекций, 56 часов
практик, 2,95 часов иных видов работ), 71,05 часа, выделенных на самостоятельную работу.
3. Тематический план
Таблица 2.
1.1
1.2
1.3
4
5
7
8
9
10
1-2
2
4
2
8
4
Лабораторная
работа
3-4
2
12
10
24
4
5-6
2
4
8
14
2
Лабораторная
работа,
Собеседование
Лабораторная
работа,
Собеседование
6
6
20
20
46
10
7-8
2
6
4
10
6
Собеседование
9-10
2
12
18
34
6
Лабораторная
работа,
Собеседование
4
4
18
22
44
12
11-12
2
12
14
28
6
13-14
2
8
18
28
8
4
14
4
14
20
56
32
74
56
144
14
36
Всего*
Модуль 2
2.1
Машинное
обучение
2.2
Искусственные
нейронные сети
3.2
Многоагентные
системы
Формы контроля
3
Кластерный анализ
Всего*
Модуль 3
3.1 Принятие решений
Из них
в
интерак
тивной
форме,
в часах
Самостоятельная
работа
2
Модуль 1
Обзор
интеллектуальных
технологий
Интеллектуальный
анализ данных
Итого
часов
по
теме
Семинарские
(практические)
занятия
1
Виды учебной
работы и
самостоятельная
работа, в час.
Лекции
Тема
недели семестра
№
Всего*
Итого* (часов,
баллов):
Из них в интеракт.
форме
* с учетом иных видов работ
36
Лабораторная
работа,
Собеседование
Собеседование,
контрольная
работа
6
4. Содержание дисциплины.
1.1 Обзор интеллектуальных технологий. Понятие интеллектуальной системы. Понятие
искусственного интеллекта. Тест Тьюринга. Теории сильного и слабого ИИ. Основные
подходы к созданию ИИ. Текущее состояние исследований.
1.2 Интеллектуальный анализ данных. Понятие. Классификация методов. Задачи Data
Mining. Деревья решений. Алгоритм C4.5. Алгоритм CART. Ассоциативные правила.
Алгоритм Apriori.
1.3 Кластерный анализ. Понятие. Этапы. Требования к данным. Классификация методов.
Алгоритм k-средних. Алгоритм k-means++. Алгоритм Fuzzy C-means.
2.1 Машинное обучение. Классификация методов обучения. Распознавание образов.
Понятие. Структура системы распознавания. Математическая постановка задачи
распознавания. Классификация методов распознавания. Генетические алгоритмы. Схема
работы генетического алгоритма. Кодирование признаков.
2.2 Искусственные нейронные сети. Понятие ИНС. Структура. Формальный нейрон. Типы
функций активации. Классификация ИНС. Многослойный персептрон. Алгоритм обратного
распространения ошибки. Сеть GRNN. Сеть Фальмана.
3.1 Принятие решений. Поиск в пространстве состояний. Алгоритм A*. Задача
удовлетворения ограничений. Поиск в условиях противодействия. Сети принятия решений.
3.2 Многоагентные системы. Понятие. Классификация агентов. Свойства агентов.
Стандарты многоагентных систем. Парадигмы построения.
5. Темы лабораторных работ (Лабораторный практикум).
1.2 Интеллектуальный анализ данных.
1. Построение самообучающегося дерева решений
2. Формирование ассоциативных правил
1.3 Кластерный анализ.
1. Кластеризация данных
2.1 Машинное обучение.
1. Применение генетических алгоритмов
2.2 Искусственные нейронные сети.
1. Разработка нейронной сети прогнозирования GRNN
2. Разработка нейронной сети Фальмана
3.1 Принятие решений.
1. Поиск решения с помощью алгоритма SMA*
6. Учебно-методическое обеспечение и планирование самостоятельной работы
студентов.
Таблица 3.
№
Модули и темы
Виды СРС
обязательные
Модуль 1
1.1
Обзор
интеллектуальных
технологий
1.2 Интеллектуальный
анализ данных
1.3
Кластерный
анализ
Всего*
Модуль 2
дополнительные
Проработка
лекций
Проработка
лекций
Проработка
лекций
Анализ
ситуаций
Анализ
ситуаций
Неделя
семестра
Объем
часов
1-2
2
3-4
10
5-6
8
6
20
7
Машинное
обучение
2.2
Искусственные
нейронные сети
Всего*
Модуль 3
3.1 Принятие решений
2.1
3.2
Многоагентные
системы
Проработка
лекций
Проработка
лекций
Проработка
лекций
Проработка
лекций,
контрольная
работа
Анализ
ситуаций
Анализ
ситуаций
Анализ
ситуаций
Анализ
ситуаций
Всего*
Итого *
7-8
4
9-10
18
4
22
11-12
14
13-14
18
4
14
32
74
* с учетом иных видов работ
7.Фонд оценочных средств для проведения промежуточной аттестации по итогам
освоения дисциплины (модуля).
7.1 Перечень компетенций с указанием этапов их формирования в процессе освоения
образовательной программы (выдержка из матрицы компетенций):
Таблица 4.
Индекс
Б.1. Дисциплины
компетенции
Интеллектуальные
информационные технологии
Научно-исследовательская
практика
Производственная практика
Научно-исследовательская работа
в семестре, включая научноисследовательский семинар
+
+
+
+
+
моделирование
процессов
и
ИТ консалтинг*
Математическое
экономических
систем*
ОПК-5
Семестр 2
Математическое
экономических
систем*
Семестр 3
моделирование
процессов
и
Семестр 1
Б.2. Практики/НИР
+
ПК-10
+
* - дисциплины базовой части
+
+
7.2 Описание показателей и критериев оценивания компетенций на различных этапах
их формирования, описание шкал оценивания:
Таблица 5.
Карта критериев оценивания компетенций
ОПК-5
Код
компетенции
8
Критерии в соответствии с уровнем
освоения ОП
пороговый
(удовл.)
базовый
(хор.)
Знает: общие
принципы
и
базовые
алгоритмы
интеллектуаль
ного анализа
данных
Умеет:
проводить
анализ
проблемы на
предмет
применения
интеллектуаль
ных
технологий
Владеет:
навыками
применения
алгоритмов и
моделей
интеллектуаль
ного анализа
данных,
кластерного
анализа
Знает:
продвинут
ые
алгоритмы
кластерног
о анализа и
деревьев
решений
Умеет:
разрабатыв
ать
и
применять
нейронные
сети
Владеет:
навыками
оптимизаци
и
с
помощью
генетическ
их
алгоритмов
повышенный
(отл.)
Виды занятий
(лекции, семинар
ские, практические,
лабораторные)
Знает:
Лекции,
алгоритмы
практические
поиска
занятия
решений
Умеет:
проводить
проблемноори
ентированный
поиск новых
методов
и
интеллектуал
ьных
технологий
Владеет:
навыками
адаптации
интеллектуал
ьных
технологий
под
конкретную
задачу
Оценочные
средства (тесты,
творческие
работы, проекты
и др.)
Лабораторная
работа,
собеседование,
контрольная
работа
ПК-10
9
Знает:
современное
состояние
исследований в
области
интеллектуаль
ных систем и
технологий
Умеет:
проводить
анализ
предметной
области
и
определять
задачи,
для
решения
которых
целесообразно
использование
технологий
интеллектуаль
ных систем
Владеет:
аппаратом
простейшего
анализа
данных
(ассоциативны
е
правила,
кластеризация)
Знает:
принципы
построения
обучающих
ся систем
Умеет:
определять
назначение,
выбирать
методы и
средства
для
построения
прикладны
х
интеллекту
альных
систем
Владеет:
навыками
применени
я
интеллекту
ального
анализа
данных
Знает:
Лекции
принципы
применения и
построения
многоагентны
х систем
Умеет:
строить
модульные
интеллектуал
ьные системы
Владеет:
навыками
адаптации
интеллектуал
ьных
технологий и
моделей под
конкретную
задачу
Собеседование,
контрольная
работа
7.3 Типовые контрольные задания или иные материалы, необходимые для оценки
знаний, умений, навыков и (или) опыта деятельности, характеризующей этапы
формирования компетенций в процессе освоения образовательной программы.
Контрольные задания:
1) Имеется модуль автоматизированной банковской системы по учету кредитов
физических лиц. Какие интеллектуальные технологии могут быть применены для
увеличения прибыли от кредитов для банка и уменьшения невыплат по ним со
стороны физических лиц? Необходима ли адаптация технологий под условия
применения, какая и почему?
2) Имеется ситуационный центр коммерческого производственного предприятия.
Можно ли организовать для него интеллектуальную систему по принципу
многоагентных систем? Опишите ее строения, принципы работы интеллектуальных
агентов.
3) В чем отличие алгоритмов построения деревьев решений C4.5 и CART? Что
оптимальнее использовать?
4) У Вас имеется исходная выборка данных, которую необходимо разбить на группы по
некоторым признакам. Какими технологиями Вы будете пользоваться?
5) У Вас имеется статистика поведения пользователей Вашей программы. Каким
образом Вы можете получить наиболее распространенный сценарий ее
использования?
6) Имеются данные по зависимости добычи газа от ряда параметров на скважине.
Диаметр штуцера является управляющим параметров, остальные зависят от времени.
Необходимо дать прогноз добычи в зависимости от конкретного значения диаметра
штуцера на 3 и 6 месяцев вперед. Какие технологии Вы будете использовать?
10
7) На основании данных из предыдущей задачи Вам необходимо подобрать значение
диаметра штуцера, чтобы максимизировать добычу в течение 3 и 6 месяцев. Как Вы
сможете этого добиться?
8) Вам необходимо создать спам-фильтр. Какие интеллектуальные технологии Вы
будете использовать?
9) Вы разрабатываете программу поведения марсохода. Дан набор действий
(передвижения по местности с разным рельефом по нескольким точкам,
исследовательские операции). С помощью каких технологий марсоход будет
выполнять действия без оператора?
Вопросы к экзамену:
1. Понятие интеллектуальной системы, основные свойства. Тест Тьюринга
2. Теории искусственного интеллекта
3. Подходы к построению ИИ
4. Кластеризация данных. Классификация.
5. Кластеризация данных. Алгоритм k-means++
6. Кластеризация данных. Алгоритм Fuzzy C-means
7. Основы интеллектуального анализа данных (понятие, классификация методов, задачи)
8. Деревья решений. Алгоритм C4.5
9. Деревья решений. Алгоритм CART
10. Машинное обучение. Классификация методов.
11. Распознавание образов (понятие, основные алгоритмы)
12. Генетические алгоритмы (схема работы, кодирование признаков)
13. Искусственные нейронные сети (понятие, классификация, структура)
14. Понятие формального нейрона. Классификация функций активации
15. Многослойный персептрон. Алгоритм обратного распространения ошибки
16. Сети прогнозирования. Сеть GRNN
17. Сети прогнозирования. Сеть Фальмана
18. Принятие решений. Алгоритмы поиска
19. Поиск решений на графе. Алгоритм A* и его вариации.
20. Сети принятия решений
21. Многоагентные системы. Понятие. Стандарты многоагентных систем. Парадигмы
построения
22. Интеллектуальный агент. Классификация агентов. Свойства агентов
7.4 Методические материалы, определяющие процедуры оценивания знаний, умений,
навыков и (или) опыта деятельности характеризующих этапы формирования
компетенций.
Экзамен проводится в форме собеседования при ответе на вопросы экзаменационного
билета. На подготовку по билету студенту отводится 40 минут. По результатам ответа
студенту могут быть заданы дополнительные вопросы в рамках вопросов билета.
8. Образовательные технологии.
1. Разбор ситуаций
2. Проведение семинаров в диалоговом режиме
3. Организация мозговых штурмов над применением интеллектуальных технологий в
различных работах студентов
9. Учебно-методическое и информационное обеспечение дисциплины (модуля).
9.1 Основная литература:
Глухих, И. Н. Интеллектуальные информационные системы: учеб. пособие для студ. вузов/
И. Н. Глухих; Тюм. гос. ун-т. - Москва: Академия, 2010. – 112 с.
9.2 Дополнительная литература:
11
Осипов, Г. С. Лекции по искусственному интеллекту/ Г. С. Осипов. - 2-е изд., испр. и доп. Москва: Красанд, 2013. - 272 с.
9.3 Интернет-ресурсы:
http://www.basegroup.ru/library/
10. Перечень информационных технологий, используемых при осуществлении
образовательного процесса по дисциплине (модулю), включая перечень программного
обеспечения и информационных справочных систем (при необходимости).
Microsoft Visual Studio 2010 или новее.
11. Технические средства и материально-техническое обеспечение дисциплины
(модуля).
Мультимедийная аудитории с проектором
Компьютерный класс
12. Методические указания для обучающихся по освоению дисциплины (модуля).
1) Построение самообучающегося дерева решений
Дан файл, содержащий таблицу признаков, их значений и исходов. Необходимо разработать
программу, обладающую следующим функционалом:
а) экспорт файла с данными
б) построение дерева решений по этим данным по алгоритму C4.5 (для четных номеров в
списке) или CART (для нечетных номеров)
в) добавление и удаление признаков и исходов с перестроением дерева
г) проверку построенного дерева путем диалога с пользователем (по выбранным
пользователем значениям признаков производится обход дерева)
2) Формирование ассоциативных правил
Есть 4 типа товаров (A, B, C, D). Необходимо разработать программу сервис магазина «с
этим товаром часто покупают», обладающую следующим функционалом:
а) случайным образом формируется набор из 100 транзакций по покупкам этих товаров
(транзакции могут повторяться и содержать от 1 до 4 товаров)
б) построение ассоциативных правил с помощью алгоритма Apriori
в) проверку построенных правил путем выбора товара или товаров и отображения наиболее
подходящего правила с выводом достоверности предложенного решения
3) Кластеризация данных
Дано трехмерное облако точек, формируемое случайным образом. Необходимо реализовать
программу, обладающие следующим функционалом:
а) формирование облака точек случайным образом
б) ввод пользователем количества кластеров
в) кластеризация облака точек с помощью алгоритма Fuzzy C-means (для четных номеров в
списке) или k-means++ (для нечетных). Мера близости – евклидово расстояние.
г) вывод количества итераций работы алгоритма
д) визуализация кластеризации (отображение центроидов и точек, относящихся к ним
отдельным цветом)
4) Применение генетических алгоритмов
Дан график функции (на диаграмме обозначить красным цветом) и прямая линия,
параллельная оси абсцисс (на диаграмме обозначить синим цветом). С помощью
генетического алгоритма привести красную и синие линии в соответствие, обеспечив
наследование
совпавших
экстремумов.
Функцию
приспособленности
вывести
самостоятельно. Вывести графики функций, количество итераций сходимости алгоритма,
функцию приспособленности и конечное состояние генотипа.
График функции представляет собой точечную диаграмму, где координаты точек
формируются случайным образом. Количество точек – 20. Вероятность мутации – 10%.
12
5) Разработка нейронной сети прогнозирования GRNN
Дан файл с исходными данными. Необходимо разработать программу, обеспечивающую
следующий функционал:
а) загрузка файла с данными
б) разделение данных на обучающую и тестовую выборки (процент соотношения вводит
пользователь)
в) построение нейронной сети GRNN
г) ввод пользователем значений и вывод результатов прогнозирования
д) проверка работы сети на тестовой выборке с выводом среднеквадратической ошибки
прогнозирования
6) Разработка нейронной сети Фальмана
Дан файл с исходными данными. Необходимо разработать программу, обеспечивающую
следующий функционал:
а) загрузка файла с данными
б) разделение данных на обучающую и тестовую выборки (процент соотношения вводит
пользователь)
в) построение нейронной сети Фальмана
г) ввод пользователем значений и вывод результатов прогнозирования
д) проверка работы сети на тестовой выборке с выводом оценки SMAPE
7) Поиск решения с помощью алгоритма SMA*
Дано стандартное шахматное поле с расположенными на нем шашками противника (черный
цвет) и 1 белая шашка, необходимо с помощью алгоритма SMA* привести белую шашку в
«дамки», при условии, что черные шашки не перемещаются.
13
Дополнения и изменения к рабочей программе на 201__ / 201__ учебный год
В рабочую программу вносятся следующие изменения:
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
___________________________________________________________
Рабочая
программа
пересмотрена
и
одобрена
на
заседании
______________________________________ «__» _______________201 г.
Заведующий кафедрой ___________________/___________________/
Подпись
Ф.И.О.
кафедры
Скачать