Организация наблюдения объекта и обработка данных. Поиск

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
«УТВЕРЖДАЮ»:
Проректор по научной работе
_______________________ /А.В. Толстиков/
__________ _____________ 2014г.
ОРГАНИЗАЦИЯ НАБЛЮДЕНИЯ ОБЪЕКТА
И ОБРАБОТКА ДАННЫХ.
ПОИСК ЗАКОНОМЕРНОСТЕЙ В МАССИВЕ ДАННЫХ
Учебно-методический комплекс. Рабочая программа
для аспирантов направления 09.06.01 – Информатика и вычислительная
техника (Математическое моделирование, численные методы и комплексы
программ), очной и заочной форм обучения.
«ПОДГОТОВЛЕНО К ИЗДАНИЮ»:
Автор работы _________________ / В.А. Шапцев/
«____»____________2014г.
Рассмотрено на заседании кафедры информационных систем «___» ________2014г.
Протокол № ____ : соответствует требованиям к содержанию, структуре и оформлению,
«РЕКОМЕНДОВАНО К ЭЛЕКТРОННОМУ ИЗДАНИЮ». Объем _13_стр.
Зав. кафедрой ____________________/И.Н. Глухих/.
«_____»___________ 2014 г.
Рассмотрено на заседании УМК ИМиКН «_10_» _октября_2014г. Протокол № _1 :
соответствует ФГОС ВО и учебному плану образовательной программы.
«СОГЛАСОВАНО»
Председатель УМК ________________/Н.М. Гаврилова/
«_____»_____________2014 г.
«СОГЛАСОВАНО»
Директор ИБЦ____________________/Е.А. Ульянова/
«_____»_____________2014 г.
«СОГЛАСОВАНО»
Начальник отдела аспирантуры и докторантуры _________________/ М.Р. Сорокина/.
«_____»_____________2014 г.
0
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Институт математики и компьютерных наук
Кафедра информационных систем
Валерий Алексеевич Шапцев
ОРГАНИЗАЦИЯ НАБЛЮДЕНИЯ ОБЪЕКТА
И ОБРАБОТКА ДАННЫХ.
ПОИСК ЗАКОНОМЕРНОСТЕЙ В МАССИВЕ ДАННЫХ
Учебно-методический комплекс. Рабочая программа
для аспирантов направления 09.06.01 – Информатика и вычислительная
техника (Математическое моделирование, численные методы и комплексы
программ), очной и заочной форм обучения.
Тюменский государственный университет
2014
1
Шапцев В.А. Организация наблюдения объекта и обработка данных. Поиск
закономерностей в массиве данных. Учебно-методический комплекс. Рабочая программа
для аспирантов направления 09.06.01 – Информатика и вычислительная техника
(Математическое моделирование, численные методы и комплексы программ), очной и
заочной форм обучения. – Тюмень, 2014. – 13 с.
Рабочая программа составлена в соответствии с требованиями ФГОС ВО с учетом
рекомендаций и ОПОП ВО по направлению и профилю подготовки.
Рабочая программа дисциплины опубликована на сайте ТюмГУ: Организация
наблюдения объекта и обработка данных. Поиск закономерностей в массиве данных
[электронный ресурс] / Режим доступа: http://www.umk3plus.utmn.ru, свободный.
Рекомендовано к изданию кафедрой информационных систем. Утверждено
проректором по научной работе Тюменского государственного университета.
ОТВЕТСТВЕННЫЙ РЕДАКТОР: И.Н. Глухих, д-р техн. наук, проф.,
зав. каф. информационных систем
© Тюменский государственный университет, 2014.
© Шапцев В.А. 2014.
2
1.
ПОЯСНИТЕЛЬНАЯ ЗАПИСКА.
1.1. Цели и задачи дисциплины.
Целью дисциплины «Организация наблюдения объекта и обработка данных. Поиск
закономерностей в массиве данных» является ознакомление аспирантов с современными
подходами к организации наблюдения исследуемого объекта, методами информативной
обработки данных наблюдений и методами выявления закономерностей в полученных
данных, формруемых в виде матрицы эксперимента.
К основным задачам изучения дисциплины относятся:
- формирование системного подхода к решению проблемы получения сведений о
сложном объекте;
- изучение математических методов обработки данных и рядов наблюдений;
- изучение методов выявления закономерностей, скрытых в данных.
1.2.
Место дисциплины в структуре образовательной программы.
«Организация наблюдения объекта и обработка данных. Поиск закономерностей в
массиве данных» является дисциплиной базового цикла, опирающейся на знания методов
математического анализа, линейной алгебры, теории вероятностей и математической
статистики, дискретной математики, приложений MS Office.
Дисциплина обеспечивает научно-обоснованное планирование, проведение
обработку
результатов
вычислтельных
экусперментов
при
математическом
моделировании объектов и систем. Так что данная дисциплина является основой
исследований и дисциплин, связанных с разработкой и исследованиями математических
моделей объектов (табл. 1).
Таблица 1.
Разделы дисциплины и междисциплинарные связи с обеспечиваемыми дисциплинами.
№
п/п
Наименование
обеспечиваемых
(последующих) дисциплин
1.
Информационные технологии в научноисследовательской деятельности.
Математическое моделирование,
численные методы комплексы программ.
Теория и средства
математического моделирования.
Методы распознавания образов.
Методы компьютерного моделирования.
Статистическое моделирование.
Математические модели
для поддержки принятия решений.
2.
3.
4.
5.
1.3.
Темы дисциплины, необходимые для
изучения обеспечиваемых
(последующих) дисциплин
1
2
3
4
+
+
+
+
+
+
+
+
+
+
+
+
+
+
Компетенции аспиранта, формируемые в результате освоения рассматрваемой
дисциплины.
3
Процесс изучения дисциплины направлен на формирование следующих
профессиональных компетенций:
 ПК4. Умение формализовывать явления, процессы и системы в контексте
возникающих проблем;
 ПК6. Умение формулировать научные проблемы, гипотезы и инновационные
идеи.
1.4. Перечень планируемых результатов освоения дисциплины.
В результате освоения дисциплины аспирант должен:
знать
- основные этапы процессов планирования, организации и осуществления
наблюдения объекта или его модели,
- методы планирования, фиксации и обработки результатов наблюдения;
уметь
- использовать методы анализа и обработки данных наблюдений,
- пользоваться инструментальными средствами обработки данных;
владеть
- способностью разрабатывать и производить эксперименты по научнообоснованным методикам с обработкой и анализом их результатов, составлять
описание выполненных исследований и подготавливать данные для разработки
научных обзоров и публикаций;
- навыками документирования результатов эксперимента и их интерпретации.
2. Структура и трудоемкость дисциплины.
Семестр 1. Форма промежуточной аттестации  зачет (2 контрольные работы).
Общая трудоемкость дисциплины составляет 1 зачетную единицу (36
академических часов: 24 часа самостоятельной работы, 12 часов аудиторных занятий = 8
часов лекций + 4 часа практических занятий).
Текст самостоятельной работы.
3. Тематический план.
Таблица 2.
Тематический план дисциплины.
4
Формы контроля
3
Из них в интерактивной
форме
2
Самостоятельная
работа
1
Практические
занятия
Тема
Лекции
№
Всего часов
Виды учебной и
самостоятельная
работы, час.
4
5
6
7
8
1
1.
2
3.
4.
2
Планирование наблюдения системы.
Матрица эксперимента
Описательная статистика и формирование
гипотез.
Методы и средства обработки данных
измерений.
Методы определения закономерностей в
данных о параметрах и показателях объекта.
Итого:
Из них часов в интерактивной форме
3
4
6
1
12
2
18
3
36
5
6
7
Опрос
4
2
8
4
2
Excelфайл
8
4
КР
КР
2
2
8
6
8
4
24
4
Зачет
8
4. Содержание дисциплины.
Тема 1. Планирование и сбор данных наблюдения системы.
Формулирование цели наблюдения/эксперимента. Документ «Методика и план
эксперимента». Содержание работ по наблюдению системы. Выбор и шкалирование
измеряемых величин. Планы экспериментов. Матрицы активного и пассивного
экспериментов. Их цензурирование.
Тема 2. Описательная статистика данных измерений. Формулирование
гипотез.
Понятие описательной статистики. Роль средних и среднеквадратичных величин;
оценок асимметрии и эксцесса; моды, медианы и других квантилей. Гистограмма. Задачи
о проверке гипотез. Парные точечные диаграммы. Формирование моделей зависимостей.
Тема 3. Методы и средства обработки данных измерений.
Коррекция матрицы эксперментов. Кластеризация матрицы эксперимента.
Нормирование данных измерений. Корреляционный анализ матрицы эксперимента.
Информативные параметры и показатели. Оценка параметров моделей взаимосвязи пар
столбцов матрицы эксперимента. Непараметрческие методы матемтаической статистки.
Тема 4. Методы оценки зависимостей показателей и параметров объекта.
Факторный анализ. Дисперсионный анализ. Кластерный анализ. Регрессионный
анализ. Исследование регрессий. Шаговые методы оценки параметров регрессии.
Непараметрическая регрессия. Нечёткая регрессия.
5. Планировение семинарских занятий.
Семинарских занятий в этой дисицплине нет.
6.Темы практических занятий (Лабораторный практикум).
Занятие 1.
1. Генерация матрцы эксперимента в Excel.
2. Анализ и исправление матрицы эксперимента.
5
3. Нормирование значений выборки.
4. Описательная статистика матрицы эксперимента.
Занятие 2.
5. Проверка гипотез о характере распределения величин столбцов.
6. Корреляционные матрицы Пирсона и Спирмена.
7. Трехфакторная регрессия. Её анализ.
8. Кластеризация данных матрицы эксперимента.
7. Учебно-методическое обеспечение и планирование самостоятельной работы
аспирантов.
7.1. Предмет самостоятельной работы аспиранта.
Предметом самостоятельной работы аспирантов являются этапы их
диссертационных исследований, требующие наблюдений, экспериментов и обработки
данных, в матрицах экспериментов. От аспирантов требуется электронный текст,
содержащий методику, план эксперимента с моделью и сценарий обработки данных
вычислительного эксперимента. Он может стать основой соответствующих разделов
диссертационной работы.
Таким образом, самостоятельная работа аспиранта заключается в углубленном,
адаптрованном изучении тем, предложенных аспирантам на лекционных и практических
занятиях.
Контроль зрелости результатов самостоятельной работы аспиранта осуществляется
в форме защиты соответствующего текста.
7.2. Примерные темы самостоятельных работ.
Конкретная тема самостятелбной работы формулируется совместно с аспирантом.
Таблица 3.
Виды самостоятельной работы аспиранта (примерные задания).
№
Виды СРС
1
Обоснованный выбор наблюдаемых/
измеряемых величин.
Их шкалирование и нормирование.
1.
2.
3.
Контролируемый Неделя
результат
семестра
Темы
2
3
4.
4
Формрование методики
вычислительного эксперимента.
Выбор метода и инструмента
обработки данных.
Подготвка шаблона документа о
результатах вычислительного
эксперимента.
Итого
Текст в файле
Объем
часов
12
4
13
4
14
8
15
8
24
8. Типовые контрольные задания или иные материалы, необходимые для оценки
знаний, умений, навыков и (или) опыта деятельности, характеризующей этапы
формирования компетенций в процессе освоения образовательной деятельности.
6
Вопросы к зачёту.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
Понятие наблюдения. Виды экспериментов.
Типы задач наблюдения объекта.
Этапы наблюдения объекта.
Понятие матриц пассивного и активного экспериментов.
Цензурирование матрицы эксперимента.
Методы исправления матриц экспериментов.
Задача планирования эксперимента.
Содержание обработки данных в описательной статистике.
Вды гипотез отностельно наблюдаемых величин.
Формальная постановка задачи о регрессии.
Параметры и показатели системы.
Критерии принятия решений в обработке данных.
Прнцип дисперсионного аналза.
Принцип факторного анализа.
Кластеризация данных.
Шкалы и размерности наблюдаемых величин.
Информативные параметры и показатели.
Типы закономерностей, скрытых в массиве данных.
Прнципы формирования модели регрессии.
Концепция непараметрической статистики.
Нечёткая регрессия.
Непараметрическая регрессия.
Инструменты поддержки обработки данных наблюдения/ эксперимента.
Возможна разработка электронного теста
9.
Образовательные технологии.
Озвучивание материала курса сопровождается мультимедиа-презентацией при связи
с Интернетом.
Практические занятия проводятся в компьютерном классе, соединенном с
Интернетом.
Возможные инструменты поддрежки обработки данных на практическх занятях в
самостоятельной работе: Excel, Statistika, SPSS.
Предусмотрены встречи с представителями российских и зарубежных компаний,
государственных и общественных организаций, мастер-классы экспертов и специалистов.
10. Учебно-методическое и информационное обеспечение дисциплины.
10.1. Основная литература.
1. Теория систем и системный анализ в управлении организациями: Справочник
[Электронный ресурс]: учебное пособие / под ред. А.А. Емельянов. - М. : Финансы и
статистика, 2012. - 858 с. - URL: http://biblioclub.ru/index.php?page=book&id=219845
(дата обращения 30.12.2014).
2. Балдин, К.В. Теория вероятностей и математическая статистика [Электронный ресурс]:
учебник / К.В. Балдин, В.Н. Башлыков, А.В. Рукосуев. - 2-е изд. - М. : Дашков и Ко,
2014. - 473 с. - URL: http://biblioclub.ru/index.php?page=book&id=253787 (дата
обращения 30.12.2014).
7
3. Шапцев В. А. Информационные технологии анализа и проектирования бизнеспроцессов: учеб. пособие. - Тюмень: Изд-во ТюмГУ, 2011. - 232 с.
10.2. Дополнительная литература.
1. Алешин Л.И., Гузев Ю.С. Методы аналитической обработки данных: учеб.-практ.
пособие. – М.: Литера, 2008. – 144 с.
2. Вапник В. Н. Восстановление зависимостей по эмпирическим данным. – М.: Наука,
1979. - 447 с.
3. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. – Новосибирск: Изд-во
Ин-та математики СО РАН, 1999. - 270 с.
4. Крыштановский А. О. Анализ социологических данных с помощью пакета SPSS: учеб.
пособие для студ. вузов. - Москва: Изд-во ГУ ВШЭ, 2006. - 281 с.
5. Рублева Г. В. Математическая статистика [Электронный ресурс] : изучение
взаимосвязей между признаками : учебно-методическое пособие для студентов очной
формы обучения технических и инженерных специальностей / Г. В. Рублева. Электрон. текстовые дан. - Тюмень : Изд-во ТюмГУ, 2014. Режим доступа :
http://tmnlib.ru/jirbis/files/upload/books/PPS/Rybleva_2014.pdf
6. Рублева Г. В. Математическая статистика [Электронный ресурс] : статистические
критерии проверки гипотез : учебно-методическое пособие / Г. В. Рублева ; Тюм. гос.
ун-т, Ин-т матем. и компьют. наук, Каф. матанализа и теории функций. - Электрон.
текстовые дан. - Тюмень : Изд-во ТюмГУ, 2014. - 50 с. - Режим доступа :
http://tmnlib.ru/jirbis/files/upload/books/PPS/Rybleva_proverka gipotez_2014.pdf
7. Рублева, Г. В. Теория вероятностей и математическая статистика [Электронный ресурс]
: учебно-методическое пособие / Г. В. Рублева. - Электрон. текстовые дан. - Тюмень :
Изд-во
ТюмГУ,
2014.
Режим
доступа
:
http://tmnlib.ru/jirbis/files/upload/books/PPS/Rybleva_teoria veroatnosti_2014.pdf
10.3. Ресурсы Интернета.
1. ГОСТ 24026-80. Исследовательские испытания. Планирование эксперимента. Термины
и определения.  http://www.znaytovar.ru/gost/2/ GOST_2402680_Issledovatelskie.html.
2. Васнев С.А. Статистика (учебное пособие). / электронное издание московского
государственного
университета
печати.
http://www.hi-edu.ru/ebooks/xbook096/01/index.html?part-003.htm.
3. Поиск закономерностей в рядах данных: что есть и чего не хватает? - http://
schegloff.livejournal.com/252903.html.
4. Алгебра над алгоритмами и эвристический поиск закономерностей. http://www.machinelearning.ru/wiki/index.php.
5. Современный анализ данных: поиск скрытых закономерностей. - http://
www.management.com.ua/ims/ims106.html.
11. Перечень информационных технологий, используемых при осуществлении
образовательного процесса по дисциплине, включая компоненты программного
обеспечения и информационные системы.
1.
2.
3.
4.
Мультмедиа-презентации на лекцях и на практческх занятях.
Интернет.
MS Office: Word, Power Point, Excel.
Statistika или SPSS.
8
12. Технические средства и материально-техническое обеспечение дисциплины
(модуля).
Компьютерный класс. Видеопроектор. Экран. Школьная доска. Мелки.
13. Методические указания аспирантам по освоению дисциплины.
Теоретический материал является обзором методов и программных инструментов
систематизации и обработки данных наблюдений/измерений. Аспиарту целесообразно
освоить один из распростарнённых инструментов обработки данных. Приоритетом здесь
является система SPSS.
Целью практических занятий является системное усвоение теоретического
материала, развитие навыков обработки данных.
Основой текста самостоятельной работы аспиранта являются определения (смысл)
терминов,
связанных
с
организацией
и
интерпретацией
результатов
наблюдения/измерения системы. При этом должно быть чёткое различение понятий
«информация» (сведения) и «носитель информации)» (в частности, данные и документы),
их адекватное контексту использование. Все используемые термины, аналитические
выражения и утверждения должны быть понятны самому автору. Тема работы выбирается
аспирантом, исходя из проблематики его научной работы. Формулировка наименования
текста СРС согласовывается с преподавателем. Тема может быть и оригинальной, и
инновационной идеей.
Объем доклада должен быть порядка 7-9 стр. текста, шрифта 14 (Times New
Roman), через 1,15 интервала, на листе А4 с полями: 2,5 см слева, 1,5 см сверху и снизу,
1,0 см. справа.
В тексте в квадратных скобках указывается номер источника в перечне.
Конструктивным является утверждение, предложение, критика, если все они содержат
действие(я), реализуемо(ы)е в существующих условиях.
Доклад следует записать в файле для передачи преподавателю. Имя файла:
фамилия и ИО аспиранта.
В лучшем случае текст может стать основой научной публикации. Поэтому
приветствуются оригинальные результаты, наблюдения, необычные факты, их обобщение,
соображения, критический анализ проделанного или прочитанного.
Научный текст, технический, учебный, – это рационально, логично построенное
повествование, имеющее целью убедить слушателей в обоснованности предлагаемых их
вниманию утверждений (в лучшем случае, аксиом и теорем) и их следствий, появившихся
в результате интерпретации результатов обработанных данных.
Если Вы готовите презентацию, то на каждом слайде:
- не должно быть больше семи-девяти чётких взаимосвязанных графических объектов;
- не более 13 строк легко читаемого, не «водянистого» текста;
- фразы должны быть лаконичными, служить сигналами докладчику в логичном
изложении и слушателям в связанном восприятии, не зашумлённом лишними словами;
- полные скриншоты образов экранов должны сопровождаться следующим слайдом с
укрупнённым фрагментом, помогающим изложению;
- определения можно помещать полностью или на последовательности слайдов, если
строк на одном  13.
Текст и фон должны быть контрастно отличными. На последнем слайде
повторяется имя докладчика, для того чтобы облегчить обращение к нему с вопросами.
Желателен адрес e-mail.
Заботтесь о корректности использования грамматики русского языка.
При устном представлении матерала не читать слайды и бумагу. Говорить не
торопясь, уверенно: Ваш материал никто не знает лучше Вас. Не бояться пауз.
9
Желательно называть авторов источников, где был взят материал. Смотреть в основном на
слушателей, а не на слайды. Желательно пользоваться средствами привлечения внимания
отвлекающихся слушателей, например, вопросами к некоторым из них. Или: если не
слушают, то, например, замолчать.
Целесообразно за день до выступления выслать текст преподавателю для
повышения его корректости.
10
Дополнения и изменения к рабочей программе
по дисциплине
_____________________________________________
на 201__ / 201__ учебный год.
В рабочую программу вносятся следующие изменения.
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
_______________________________
Рабочая программа пересмотрена и одобрена на заседании кафедры
______________________________________ «__» _______________201 г.
Заведующий кафедрой
___________________/___________________/
Роспись
Ф.И.О.
11
Download