факультете информатики ТГУ. - Томский государственный

реклама
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
УТВЕРЖДАЮ
Декан факультета информатики
С.П. Сущенко
«
»
2010 г.
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
РАБОЧАЯ ПРОГРАММА
Специальность 351500:
МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ И
АДМИНИСТРИРОВАНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ
Статус дисциплины:
федеральный компонент специальности
Томск - 2010
ОДОБРЕНО
кафедрой прикладной информатики
Протокол №50 от 01.12.2010
Зав. кафедрой, профессор _________________С.П.Сущенко
РЕКОМЕНДОВАНО методической комиссией
факультета информатики
Председатель комиссии, профессор _____________________ Б.А. Гладких
“___”_____________2010 г.
Рабочая программа по курсу “Теория вероятностей и математическая статистика”
составлена на основе требований Государственного образовательного стандарта высшего
профессионального образования по специальности 351500 – МАТЕМАТИЧЕСКОЕ
ОБЕСПЕЧЕНИЕ И АДМИНИСТРИРОВАНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ,
утвержденного приказом Министерства образования Российской Федерации от
02.03.2000 г. № 686. Общий объем курса 204 часа. Из них: лекции – 66 часов, семинары –
16, лабораторные занятия – 32 часа, самостоятельная работа студентов – 90 часов. В первом
семестре – экзамен, во втором – зачет. Общая трудоемкость курса 6,3 зач. ед.
СОСТАВИТЕЛЬ:
Юрий Викторович Потапов – доцент кафедры прикладной информатики, кандидат
технических наук, доцент.
I. ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЙ РАЗДЕЛ
Выписка
из Государственного образовательного стандарта высшего профессионального образования
по специальности 351500 – МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ И
АДМИНИСТРИРОВАНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ (квалификация – математикпрограммист).
Математическое обеспечение и администрирование информационных систем — это
область науки и техники, которая включает совокупность средств, способов и методов
человеческой деятельности, направленной на: создание и применение средств
математического обеспечения информационных систем; программного обеспечения и
способов администрирования информационных систем и сетей (включая глобальные);
программного
обеспечения
средств
вычислительной
техники
(ВТ)
и
автоматизированных систем (АС); использование средств ВТ; развитие новых областей
и методов применения ВТ и АС в информационных системах (сетях).
Объектами профессиональной деятельности математика-программиста являются
математические и алгоритмические модели, программы, программные системы и
комплексы, методы проектирования и реализации, способы производства,
сопровождения, эксплуатации и администрирования в различных областях, включая
междисциплинарные. Объектами профессиональной деятельности могут быть
имитационные модели сложных процессов управления, программные средства,
администрирование вычислительных, информационных процессов.
Математик-программист должен уметь компетентно и ответственно решать на
основе полученных при обучении знаний и опыта следующие характерные комплексные
(обобщенные) задачи: разработки, выбора и преобразования алгоритмов,
математических моделей явлений и процессов с целью эффективной реализации
программного продукта и проведении с его помощью исследований средствами ВТ …
ТРЕБОВАНИЯ К ОБЯЗАТЕЛЬНОМУ МИНИМУМУ СОДЕРЖАНИЯ ОСНОВНОЙ
ОБРАЗОВАТЕЛЬНОЙ ПРОГРАММЫ ПОДГОТОВКИ МАТЕМАТИКА-ПРОГРАММИСТА. Теория вероятностей и математическая статистика: элементарная теория
вероятностей, математические основы теории вероятностей, модели случайных
процессов, математические модели статистики, проверка гипотез, принцип
максимального правдоподобия, методы и процедуры оценивания параметров,
статистические методы и алгоритмы обработки экспериментальных данных.
Цель курса: целью курса является изучение теории вероятностей и математической
статистики.
Задачи курса: студент должен владеть методами теории вероятностей и математической
статистики.
Место курса: входит в блок общих математических дисциплин.
Требования к уровню освоения курса.
Студент должен знать:
фундаментальные понятия теории вероятностей;
основные задачи математической статистики и практические методы их решения.
Студент должен уметь:
строить вероятностные модели;
формулировать статистические задачи;
применять программные пакеты статистической обработки.
II. СОДЕРЖАНИЕ КУРСА
II.1. Теоретическая часть
Теория вероятностей
Введение
1. Случайные события и их вероятности
1.1. Понятие случайного события. События детерминированные, неопределенные,
случайные. Схема испытаний в теории вероятностей и формальная трактовка случайного
события. Отношения между событиями.
1.2. Понятие вероятности события. Простейшие представления Я.Бернулли, Лапласа,
Бюффона. Физическая трактовка вероятности по Н.Бернулли. Современное представление
о вероятности по Колмогорову.
1.3. Правила исчисления вероятностей. Формулы сложения. Понятие зависимости событий
и формулы умножения. Схема гипотез и полная вероятность события. Формула Байеса.
1.4. Формула Бернулли. Биномиальная схема и формула Я.Бернулли. Полиноминальное
обобщение схемы Бернулли.
2. Случайные величины и их распределения вероятностей
2.1. Понятие случайной величины. Простейшие представления. Формальная трактовка по
Колмогорову. Функция распределения случайной величины и ее свойства.
2.2. Типы случайных величин. События со случайной величиной и интеграл Стилтьеса.
Понятие спектра значений случайной величины и деление ее на типы. Дискретная
случайная величина и ее ряд распределения. Непрерывная случайная величина и ее
плотность распределения.
2.3. Система случайных величин. Описание системы через совместную функцию, ряд либо
плотность распределения. Понятия условной и безусловной случайной величины в системе.
Формулы для условных и безусловных рядов и плотностей в системе.
2.4. Смена распределения при преобразовании случайных величин. Трансформация
функции распределения при преобразовании. Преобразование Мизеса как пример.
Трансформация ряда и плотности распределения.
3. Числовые характеристики случайных величин
3.1. Математическое ожидание и другие характеристики положения. Простейшие
представления Гюйгенса и Н.Бернулли о матожидании. Современное понятие матожидания
по Колмогорову и формулы для его вычисления. Свойства функционала матожидания,
неравенство Маркова. Матожидание, медиана и мода как характеристики положения.
3.2. Дисперсия, среднеквадратическое отклонение и другие характеристики рассеяния.
Формальное понятие дисперсии и ее физическая трактовка по Н.Бернулли. Свойства
функционала дисперсии, неравенство Чебышева. Среднеквадратическое отклонение,
полуширота и межквартильный размах как характеристики рассеяния.
3.3. Моменты случайной величины. Понятия начальных и центральных моментов.
Моменты и характеристики скошенности и островершинности.
3.4. Характеристики системы случайных величин. Понятия вектора средних и
ковариационной матрицы. Свойства ковариационной матрицы. Эллипсоид рассеяния.
Понятие коэффициента корреляции, его свойства. Представление о функции
среднеквадратической регрессии.
4. Стохастические последовательности
4.1. Стохастическая сходимость у последовательности случайных величин. Виды
стохастической сходимости. Сходимость по вероятности и по распределению.
4.2. Понятия закона больших чисел и центральной предельной проблемы. Основные
результаты по закону больших чисел. Теоремы Маркова, Чебышева, Хинчина. Варианты
центральной предельной теоремы. Теорема Линдеберга - Леви.
Математическая статистика
Введение
5. Оценивание параметров
5.1. Задача оценивания параметров. Понятия статистического параметра и его оценки.
Основные требования к статистикам оценок. Принципы точечного оценивания.
5.2. Метод максимального правдоподобия для точечного оценивания. Идея метода и
условия его состоятельности. Свойства регулярных оценок максимального правдоподобия.
Оценивание вероятности успеха в схеме Бернулли как показательный пример.
5.3. Способы интервального оценивания. Доверительное утверждение и его построение по
Е.Нейману. Примеры с дисперсией и средним нормальной генеральной совокупности;
знакомство с  2 распределением К.Пирсона и t распределением Стьюдента.
6. Проверка параметрических гипотез
6.1. Задача проверки параметрических гипотез. Понятие параметрической статистической
гипотезы. Ошибки первого и второго рода и выбор проверяемой гипотезы. Критерий
значимости для гипотезы. Практическая конструкция теста.
6.2. Тест для вероятности успеха в схеме Бернулли как показательный пример. Тройной
тест дегустатора в экспериментальной психологии. Формальные соотношения для теста;
знакомство с  распределением.
6.3. Способы конструирования субоптимальных тестов. Фундаментальная лемма НейманаПирсона. Тесты при монотонном отношении правдоподобия. Критерий обобщенного
отношения правдоподобия Вальда - Уилкса. Примеры со средним и дисперсией
нормальной генеральной совокупности.
6.4.  2 тест как разновидность критерия обобщенного отношения правдоподобия.  2 тест
Пирсона для полиномиальной схемы Бернулли. Обобщение Фишера для  2 теста.
7. Процедуры прикладной статистики
7.1. Задача проверки согласия. Проблема согласия в статистике. Разведочный анализ для
выдвижения гипотезы согласия. Общая конструкция теста согласия.
7.2. Практические тесты согласия. Тесты Колмогорова, Крамера - Мизеса и Пирсона для
простой гипотезы. Модифицированные тесты для сложной гипотезы, тест Колмогорова Лиллифорса.
7.3. Задача проверки однородности. Проблема однородности в статистике. Разведочный
анализ для выдвижения гипотезы однородности. Общая конструкция теста однородности.
7.4. Практические тесты однородности. Универсальные тесты Крамера - Пирсона и
Колмогорова - Смирнова. Ранговые сдвига-масштабные тесты Фишера, Манна - Уитни,
Вилкоксона и Ансари - Брэдли. Тесты на нормальных данных Стьюдента и Фишера;
знакомство с F распределением Фишера - Снедекора.
7.5. Проверка независимости. Проблема независимости в статистике. Общая конструкция
теста независимости. Универсальные тесты независимости типа 2 и  2 . Тесты
некоррелированности Фишера, Спирмена и Кендалла.
7.6. Регрессионный анализ. Проблема выявления регрессионной зависимости в статистике и
метод наименьших квадратов. Простая линейная регрессия; теорема Гаусса - Маркова о
свойствах оценок наименьших квадратов. Доверительные границы для линии регрессии.
II.2. Практические и семинарские занятия
Занятие 1. Решение задач на применение классических определений вероятности
случайного события по Бернулли - Лапласу и по Бюффону.
Занятие 2. Решение задач на применение формул сложения и умножения вероятностей.
Занятие 3. Решение задач на применение формулы полной вероятности и формулы Байеса.
Занятие 4. Решение задач на применение биномиальной и полиномиальной формул
Бернулли.
Занятие 5. Решение задач на применение определения случайной величины (СВ) как
измеримого отображения. Задачи на анализ свойств функции распределения и выявление
типа СВ. Задачи на построение безусловных и условных распределений в системе СВ.
Занятие 6. Решение задач на построение нового закона распределения СВ при её
преобразовании. Задачи на моделирование СВ с требуемым законом распределения.
Занятие 7. Решение задач на определение числовых характеристик СВ.
Занятие 8. Решение контрольных примеров.
II.3. Лабораторные работы
Введение. Общее знакомство с универсальным пакетом статистической обработки
STATISTICA по основному меню. Изучение с помощью Help встроенного языка
программирования пакета.
Задание 1. Смоделировать с помощью датчиков случайных чисел из языка пакета три
выборки объема n  50 наблюдений из генеральной совокупности (ГС) с распределениями:
стандартным нормальным с   0,  2  1 ; равномерным в [0.5, 0.5] ; пуассоновским с   1 .
Завести реальные данные (N_группы, идентификатор_студента, рост /см/, вес /кг/,
цвет_глаз /0-темные, 1-светлые/). Построить средствами графики пакета гистограммы
модельных данных на фоне подгоночных кривых распределений ГС. Проинтерпретировать
гистограммы как оценки дифференциальной формы распределений ГС.
Задание 2. Для модельных данных объема n  1000 наблюдений из стандартного
нормального и равномерного на [3, 3] распределений построить средствами пакета
таблицу основных описательных статистик выборок. Проанализировать данные из таблицы
как оценки подходящих параметров смоделированных ГС.
Задание 3. На модельных нормальных данных Задания 1 построить классические 95%-ные
доверительные утверждения для матожидания и дисперсии распределения ГС (для
промежуточных вычислений воспользоваться описательными статистиками выборки и
квантилями t и  2 распределений из пакета).
Задание 4. Для числа опытов n  25,100 и 500 при уровне значимости порядкa   0.042
построить графикой пакета функцию мощности Wn  p   теста дегустатора с шагом для p в
0.05 на отрезке 1 3,1 (для вычислений воспользоваться встроенной функцией  распределения из языка пакета). Прокомментировать состоятельность теста.
Задание 5. Провести разведочный анализ нормального согласия на реальных данных у
роста и веса по описательным статистикам, вероятностной бумаге и гистограммам. Сделать
формальный анализ согласия по достигнутому уровню значимости у теста Колмогорова Лиллифорса для сложной гипотезы.
Задание 6. Провести разведочный анализ однородности на реальных данных у роста, либо
веса модифицированным методом вероятностной бумаги; сделать корректный выбор
альтернативы и теста для строгой проверки однородности. Провести формальный анализ
однородности по достигнутому уровню значимости у теста Стьюдента и теста Вилкоксона.
Задание 7. Составить таблицу сопряженности признаков для проведения анализа
независимости на реальных данных между номером группы и цветом глаз. Сделать
формальный анализ независимости по достигнутому уровню значимости у теста  2
Пирсона - Фишера.
Задание 8. Проверить степень зависимости у реальных данных между ростом и весом
путем анализа наблюдаемой значимости нормального коэффициента корреляции Фишера.
Восстановить линейную регрессионную зависимость между ростом и весом по методу
наименьших квадратов.
Ш. РАСПРЕДЕЛЕНИЕ ЧАСОВ КУРСА ПО ТЕМАМ И ВИДАМ РАБОТ
№
1.
2.
3.
Наименование
тем
Случайное
событие и его
вероятность
Правила
исчисления
вероятностей
Схема опытов
Бернулли
Всего
часов
Аудиторные занятия (час)
Самостоятельная
в том числе
работа
лабораторные
лекции семинар
занятия
ы
13
6
2
-
5
12
4
3
-
5
9
2
2
-
5
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
Понятие
случайной
величины
Функция
распределения и
её свойства
Типы случайных
величин
Смена закона
распределения
при
преобразовании
случайной
величины
Числовые
характеристики
случайной
величины
Понятие
генеральной
совокупности и
выборки из неё
Точечное
оценивание
статистического
параметра
Интервальное
оценивание
параметра
Проверка
параметрических
статистических
гипотез
Проверка
гипотезы
согласия
Проверка
гипотезы
однородности
Проверка
гипотезы
независимости
Задача
восстановления
регрессионной
зависимости
ИТОГО
10
4
1
-
5
11
4
2
-
5
11
4
2
-
5
12
4
2
-
6
14
6
2
-
6
11
1
-
4
6
19
9
-
4
6
13
3
-
4
6
19
9
-
4
6
13
3
-
4
6
12
2
-
4
6
12
2
-
4
6
13
3
-
4
6
204
66
16
32
90
IV. ФОРМА ИТОГОВОГО КОНТРОЛЯ
В первом семестре – экзамен, во втором семестре – зачёт.
V. УЧЕБНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ КУРСА
1.
2.
3.
4.
5.
V.1.Рекомендуемая литература (основная)
Гнеденко Б.В. Курс теории вероятностей, изд.6-е. -М:Наука,1988.
Радюк Л.Е., Терпугов А.Ф. Теория вероятностей и случайных процессов. -Томск:Изд-во
ТГУ,1988.
Вентцель Е.С. Теория вероятностей. -М:Наука,1969.
Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. -М:ИНФРА-М,Финансы и
статистика,1995.
Терпугов А.Ф. Математическая статистика (конспект лекций). -Томск:Изд-во ТГУ,1974.
6. Боровиков В.П., Боровиков И.П. STATISTICA - Статистический анализ и обработка
данных в среде Windows. -М:Информационно-издательский дом "Филинъ",1997.
V.2. Рекомендуемая литература (дополнительная)
7. Колмогоров А.Н. Основные понятия теории вероятностей, изд.2-е. -М:Наука,1974.
8. Худсон Д. Статистика для физиков, изд.2-е. -М:Мир,1970.
9. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики, изд.3-е. -М:Наука,
1983.
V.3. Рекомендуемые наглядные пособия
10. Компьютерный помощник по теории вероятностей. Часть 2. (учебно-методическое
пособие). Электрон. ресурс. -Томск:ТГУ,2004.
–Реж. доступа: http://www.inf.tsu.ru/Library/Edu/Potapov/Tv2.pdf.
11. Лабораторный практикум по математической статистике на базе пакета STATISTICA-6
(учебно-методическое пособие). Электрон. ресурс. -Томск:ТГУ,2005.
–Реж. доступа: http://www.inf.tsu.ru/Library/Edu/Potapov/Ms6.pdf.
Скачать