МИНОБРНАУКИ ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ФАКУЛЬТЕТ ИНФОРМАТИКИ УТВЕРЖДАЮ Декан факультета С.П. Сущенко « » 2010 г. ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА (ЕН.Ф.1.11) РАБОЧАЯ ПРОГРАММА трудоемкость дисциплины 5 зачетных единиц НАПРАВЛЕНИЕ 080800 – ПРИКЛАДНАЯ ИНФОРМАТИКА Томск 2010 УТВЕРЖДЕНО СОСТАВИТЕЛЬ кафедрой программной инженерии. профессор кафедры программной инже- Протокол №19 от 01.12.2010 г. нерии А.Ф. Терпугов Зав. кафедрой, профессор О.А. Змеев I. Организационно-методический раздел Цель курса – изучение теории вероятностей и математической статистики. Задача учебного курса – освоение различных методов решения дифференциальных уравнений разного типа. Дисциплины-предшественники – математический анализ. Требования к уровню освоения дисциплины – знание фундаментальных понятий теории вероятностей, основных задач математической статистики и практических методов их решения. Умение строить вероятностные модели, формулировать статистические задачи, применять программные пакеты статистической обработки. II. Содержание дисциплины II.1. Лекционный курс Тема 1. Случайные события и их вероятности. Понятие случайного события. События детерминированные, неопределенные, случайные. Схема испытаний в теории вероятностей и формальная трактовка случайного события. Отношения между событиями. Понятие вероятности события. Простейшие представления Я.Бернулли, Лапласа, Бюффона. Физическая трактовка вероятности по Н.Бернулли. Современное представление о вероятности по Колмогорову. Правила исчисления вероятностей. Формулы сложения. Понятие зависимости событий и формулы умножения. Схема гипотез и полная вероятность события. Формула Байеса. Формула Бернулли. Биномиальная схема и формула Я.Бернулли. Полиноминальное обобщение схемы Бернулли. Тема 2. Случайные величины и их распределения вероятностей. Понятие случайной величины. Простейшие представления. Формальная трактовка по Колмогорову. Функция распределения случайной величины и ее свойства. Типы случайных величин. События со случайной величиной и интеграл Стилтьеса. Понятие спектра значений случайной величины и деление ее на типы. Дискретная случайная величина и ее ряд распределения. Непрерывная случайная величина и ее плотность распределения. Система случайных величин. Описание системы через совместную функцию, ряд либо плотность распределения. Понятия условной и безусловной случайной величины в системе. Формулы для условных и безусловных рядов и плотностей в системе. Смена распределения при преобразовании случайных величин. Трансформация функции распределения при преобразовании. Преобразование Мизеса как пример. Трансформация ряда и плотности распределения. Тема 3. Числовые характеристики случайных величин. Математическое ожидание и другие характеристики положения. Простейшие представления Гюйгенса и Н.Бернулли о матожидании. Современное понятие матожидания по Колмогорову и формулы для его вычисления. Свойства функционала матожидания, неравенство Маркова. Матожидание, медиана и мода как характеристики положения. Дисперсия, среднеквадратическое отклонение и другие характеристики рассеяния. Формальное понятие дисперсии и ее физическая трактовка по Н.Бернулли. Свойства функционала дисперсии, неравенство Чебышева. Среднеквадратическое отклонение, полуширота и межквартильный размах как характеристики рассеяния. Моменты случайной величины. Понятия начальных и центральных моментов. Моменты и характеристики скошенности и островершинности. Характеристики системы случайных величин. Понятия вектора средних и ковариа- ционной матрицы. Свойства ковариационной матрицы. Эллипсоид рассеяния. Понятие коэффициента корреляции, его свойства. Представление о функции среднеквадратической регрессии. Тема 4. Стохастические последовательности. Стохастическая сходимость у последовательности случайных величин. Виды стохастической сходимости. Сходимость по вероятности и по распределению. Понятия закона больших чисел и центральной предельной проблемы. Основные результаты по закону больших чисел. Теоремы Маркова, Чебышева, Хинчина. Варианты центральной предельной теоремы. Теорема Линдеберга - Леви. Тема 5. Оценивание параметров. Задача оценивания параметров. Понятия статистического параметра и его оценки. Основные требования к статистикам оценок. Принципы точечного оценивания. Метод максимального правдоподобия для точечного оценивания. Идея метода и условия его состоятельности. Свойства регулярных оценок максимального правдоподобия. Оценивание вероятности успеха в схеме Бернулли как показательный пример. Способы интервального оценивания. Доверительное утверждение и его построение по Е.Нейману. Примеры с дисперсией и средним нормальной генеральной совокупности; знакомство с распределением К.Пирсона и распределением Стьюдента. Тема 6. Проверка параметрических гипотез. Задача проверки параметрических гипотез. Понятие параметрической статистической гипотезы. Ошибки первого и второго рода и выбор проверяемой гипотезы. Критерий значимости для гипотезы. Практическая конструкция теста. Тест для вероятности успеха в схеме Бернулли как показательный пример. Тройной тест дегустатора в экспериментальной психологии. Формальные соотношения для теста; знакомство с распределением. Способы конструирования субоптимальных тестов. Фундаментальная лемма Неймана-Пирсона. Тесты при монотонном отношении правдоподобия. Критерий обобщенного отношения правдоподобия Вальда - Уилкса. Примеры со средним и дисперсией нормальной генеральной совокупности. тест как разновидность критерия обобщенного отношения правдоподобия. тест Пирсона для полиномиальной схемы Бернулли. Обобщение Фишера для теста. Тема 7. Процедуры прикладной статистики. Задача проверки согласия. Проблема согласия в статистике. Разведочный анализ для выдвижения гипотезы согласия. Общая конструкция теста согласия. Практические тесты согласия. Тесты Колмогорова, Крамера - Мизеса и Пирсона для простой гипотезы. Модифицированные тесты для сложной гипотезы, тест Колмогорова Лиллифорса. Задача проверки однородности. Проблема однородности в статистике. Разведочный анализ для выдвижения гипотезы однородности. Общая конструкция теста однородности. Практические тесты однородности. Универсальные тесты Крамера - Пирсона и Колмогорова - Смирнова. Ранговые сдвига-масштабные тесты Фишера, Манна - Уитни, Вилкоксона и Ансари - Брэдли. Тесты на нормальных данных Стьюдента и Фишера; знакомство с распределением Фишера - Снедекора. Проверка независимости. Проблема независимости в статистике. Общая конструкция теста независимости. Универсальные тесты независимости типа и . Тесты некоррелированности Фишера, Спирмена и Кендалла. Регрессионный анализ. Проблема выявления регрессионной зависимости в статистике и метод наименьших квадратов. Простая линейная регрессия; теорема Гаусса - Мар- кова о свойствах оценок наименьших квадратов. Доверительные границы для линии регрессии. II.2. Практические занятия Занятие 1. Решение задач на применение классических определений вероятности случайного события по Бернулли - Лапласу и по Бюффону. Занятие 2. Решение задач на применение формул сложения и умножения вероятностей. Занятие 3. Решение задач на применение формулы полной вероятности и формулы Байеса. Занятие 4. Решение задач на применение биномиальной и полиномиальной формул Бернулли. Занятие 5. Решение задач на применение определения случайной величины (СВ) как измеримого отображения. Задачи на анализ свойств функции распределения и выявление типа СВ. Задачи на построение безусловных и условных распределений в системе СВ. Занятие 6. Решение задач на построение нового закона распределения СВ при её преобразовании. Задачи на моделирование СВ с требуемым законом распределения. Занятие 7. Решение задач на определение числовых характеристик СВ. II.3. Лабораторный практикум Задание 1. Смоделировать с помощью датчиков случайных чисел из языка пакета три выборки объема наблюдений из генеральной совокупности (ГС) с распределениями: стандартным нормальным с ; равномерным в ; пуассоновским с . Завести реальные данные (N_группы, идентификатор_студента, рост /см/, вес /кг/, цвет_глаз /0-темные, 1-светлые/). Построить средствами графики пакета гистограммы модельных данных на фоне подгоночных кривых распределений ГС. Проинтерпретировать гистограммы как оценки дифференциальной формы распределений ГС. Задание 2. Для модельных данных объема наблюдений из стандартного нормального и равномерного на распределений построить средствами пакета таблицу основных описательных статистик выборок. Проанализировать данные из таблицы как оценки подходящих параметров смоделированных ГС. Задание 3. На модельных нормальных данных Задания 1 построить классические 95%-ные доверительные утверждения для матожидания и дисперсии распределения ГС (для промежуточных вычислений воспользоваться описательными статистиками выборки и квантилями и распределений из пакета). Задание 4. Для числа опытов и при уровне значимости порядкa построить графикой пакета функцию мощности гом для в на отрезке теста дегустатора с ша- (для вычислений воспользоваться встроенной функцией - распределения из языка пакета). Прокомментировать состоятельность теста. Задание 5. Провести разведочный анализ нормального согласия на реальных данных у роста и веса по описательным статистикам, вероятностной бумаге и гистограммам. Сделать формальный анализ согласия по достигнутому уровню значимости у теста Колмогорова - Лиллифорса для сложной гипотезы. Задание 6. Провести разведочный анализ однородности на реальных данных у роста, либо веса модифицированным методом вероятностной бумаги; сделать корректный выбор альтернативы и теста для строгой проверки однородности. Провести формальный анализ однородности по достигнутому уровню значимости у теста Стьюдента и теста Вилкоксона. Задание 7. Составить таблицу сопряженности признаков для проведения анализа независимости на реальных данных между номером группы и цветом глаз. Сделать формаль- ный анализ независимости по достигнутому уровню значимости у теста Пирсона - Фишера. Задание 8. Проверить степень зависимости у реальных данных между ростом и весом путем анализа наблюдаемой значимости нормального коэффициента корреляции Фишера. Восстановить линейную регрессионную зависимость между ростом и весом по методу наименьших квадратов. III. Распределение часов курса по темам и видам работ №№ пп Наименование тем Всего Аудиторные занятия (час), часов в том числе лекции 1 2 3 4 5 6 7 8 9 ИТОГО Случайные события и их вероятности Случайные величины и их распределения вероятностей Числовые характеристики случайных величин Стохастические последовательности Практические занятия Оценивание параметров Проверка параметрических гипотез Процедуры прикладной статистики Лабораторные занятия практики Самостоятельная работа лабораторные занятия 10 6 4 10 6 4 6 4 2 6 4 2 21 8 6 5 2 8 6 2 10 8 2 21 100 16 40 16 16 16 5 28 IV. Учебно-методическое обеспечение курса IV.1. Основная литература 1. Гнеденко Б.В. Курс теории вероятностей, изд.6-е. -М:Наука,1988. 2. Радюк Л.Е., Терпугов А.Ф. Теория вероятностей и случайных процессов. Томск:Изд-во ТГУ,1988. 3. Вентцель Е.С. Теория вероятностей. -М:Наука,1969. 4. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. -М:ИНФРА-М,Финансы и статистика,1995. 5. Терпугов А.Ф. Математическая статистика (конспект лекций). -Томск:Изд-во ТГУ,1974. 6. Боровиков В.П., Боровиков И.П. STATISTICA - Статистический анализ и обработка данных в среде Windows. -М:Информационно-издательский дом "Филинъ",1997. IV.2. Дополнительная литература 1. Колмогоров А.Н. Основные понятия теории вероятностей, изд.2-е. -М:Наука,1974. 2. Худсон Д. Статистика для физиков, изд.2-е. -М:Мир,1970. 3. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики, изд.3-е. М:Наука, 1983. IV.3. Учебно-методические пособия 1. Компьютерный помощник по теории вероятностей. Часть 2. (учебно-методическое пособие). Электрон. ресурс. -Томск:ТГУ,2004. –Реж. доступа: http://www.inf.tsu.ru/Library/Edu/Potapov/Tv2.pdf. 2. Лабораторный практикум по математической статистике на базе пакета STATISTICA-6 (учебно-методическое пособие). Электрон. ресурс. -Томск:ТГУ,2005. –Реж. доступа: http://www.inf.tsu.ru/Library/Edu/Potapov/Ms6.pdf. IV.4. Программное обеспечение лабораторного практикума Универсальный пакет статистической обработки STATISTICA.