МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ УТВЕРЖДАЮ Декан факультета информатики С.П. Сущенко « » 2010 г. ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА РАБОЧАЯ ПРОГРАММА Специальность 351500: МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ И АДМИНИСТРИРОВАНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ Статус дисциплины: федеральный компонент специальности Томск - 2010 ОДОБРЕНО кафедрой прикладной информатики Протокол №50 от 01.12.2010 Зав. кафедрой, профессор _________________С.П.Сущенко РЕКОМЕНДОВАНО методической комиссией факультета информатики Председатель комиссии, профессор _____________________ Б.А. Гладких “___”_____________2010 г. Рабочая программа по курсу “Теория вероятностей и математическая статистика” составлена на основе требований Государственного образовательного стандарта высшего профессионального образования по специальности 351500 – МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ И АДМИНИСТРИРОВАНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ, утвержденного приказом Министерства образования Российской Федерации от 02.03.2000 г. № 686. Общий объем курса 204 часа. Из них: лекции – 66 часов, семинары – 16, лабораторные занятия – 32 часа, самостоятельная работа студентов – 90 часов. В первом семестре – экзамен, во втором – зачет. Общая трудоемкость курса 6,3 зач. ед. СОСТАВИТЕЛЬ: Юрий Викторович Потапов – доцент кафедры прикладной информатики, кандидат технических наук, доцент. I. ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЙ РАЗДЕЛ Выписка из Государственного образовательного стандарта высшего профессионального образования по специальности 351500 – МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ И АДМИНИСТРИРОВАНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ (квалификация – математикпрограммист). Математическое обеспечение и администрирование информационных систем — это область науки и техники, которая включает совокупность средств, способов и методов человеческой деятельности, направленной на: создание и применение средств математического обеспечения информационных систем; программного обеспечения и способов администрирования информационных систем и сетей (включая глобальные); программного обеспечения средств вычислительной техники (ВТ) и автоматизированных систем (АС); использование средств ВТ; развитие новых областей и методов применения ВТ и АС в информационных системах (сетях). Объектами профессиональной деятельности математика-программиста являются математические и алгоритмические модели, программы, программные системы и комплексы, методы проектирования и реализации, способы производства, сопровождения, эксплуатации и администрирования в различных областях, включая междисциплинарные. Объектами профессиональной деятельности могут быть имитационные модели сложных процессов управления, программные средства, администрирование вычислительных, информационных процессов. Математик-программист должен уметь компетентно и ответственно решать на основе полученных при обучении знаний и опыта следующие характерные комплексные (обобщенные) задачи: разработки, выбора и преобразования алгоритмов, математических моделей явлений и процессов с целью эффективной реализации программного продукта и проведении с его помощью исследований средствами ВТ … ТРЕБОВАНИЯ К ОБЯЗАТЕЛЬНОМУ МИНИМУМУ СОДЕРЖАНИЯ ОСНОВНОЙ ОБРАЗОВАТЕЛЬНОЙ ПРОГРАММЫ ПОДГОТОВКИ МАТЕМАТИКА-ПРОГРАММИСТА. Теория вероятностей и математическая статистика: элементарная теория вероятностей, математические основы теории вероятностей, модели случайных процессов, математические модели статистики, проверка гипотез, принцип максимального правдоподобия, методы и процедуры оценивания параметров, статистические методы и алгоритмы обработки экспериментальных данных. Цель курса: целью курса является изучение теории вероятностей и математической статистики. Задачи курса: студент должен владеть методами теории вероятностей и математической статистики. Место курса: входит в блок общих математических дисциплин. Требования к уровню освоения курса. Студент должен знать: фундаментальные понятия теории вероятностей; основные задачи математической статистики и практические методы их решения. Студент должен уметь: строить вероятностные модели; формулировать статистические задачи; применять программные пакеты статистической обработки. II. СОДЕРЖАНИЕ КУРСА II.1. Теоретическая часть Теория вероятностей Введение 1. Случайные события и их вероятности 1.1. Понятие случайного события. События детерминированные, неопределенные, случайные. Схема испытаний в теории вероятностей и формальная трактовка случайного события. Отношения между событиями. 1.2. Понятие вероятности события. Простейшие представления Я.Бернулли, Лапласа, Бюффона. Физическая трактовка вероятности по Н.Бернулли. Современное представление о вероятности по Колмогорову. 1.3. Правила исчисления вероятностей. Формулы сложения. Понятие зависимости событий и формулы умножения. Схема гипотез и полная вероятность события. Формула Байеса. 1.4. Формула Бернулли. Биномиальная схема и формула Я.Бернулли. Полиноминальное обобщение схемы Бернулли. 2. Случайные величины и их распределения вероятностей 2.1. Понятие случайной величины. Простейшие представления. Формальная трактовка по Колмогорову. Функция распределения случайной величины и ее свойства. 2.2. Типы случайных величин. События со случайной величиной и интеграл Стилтьеса. Понятие спектра значений случайной величины и деление ее на типы. Дискретная случайная величина и ее ряд распределения. Непрерывная случайная величина и ее плотность распределения. 2.3. Система случайных величин. Описание системы через совместную функцию, ряд либо плотность распределения. Понятия условной и безусловной случайной величины в системе. Формулы для условных и безусловных рядов и плотностей в системе. 2.4. Смена распределения при преобразовании случайных величин. Трансформация функции распределения при преобразовании. Преобразование Мизеса как пример. Трансформация ряда и плотности распределения. 3. Числовые характеристики случайных величин 3.1. Математическое ожидание и другие характеристики положения. Простейшие представления Гюйгенса и Н.Бернулли о матожидании. Современное понятие матожидания по Колмогорову и формулы для его вычисления. Свойства функционала матожидания, неравенство Маркова. Матожидание, медиана и мода как характеристики положения. 3.2. Дисперсия, среднеквадратическое отклонение и другие характеристики рассеяния. Формальное понятие дисперсии и ее физическая трактовка по Н.Бернулли. Свойства функционала дисперсии, неравенство Чебышева. Среднеквадратическое отклонение, полуширота и межквартильный размах как характеристики рассеяния. 3.3. Моменты случайной величины. Понятия начальных и центральных моментов. Моменты и характеристики скошенности и островершинности. 3.4. Характеристики системы случайных величин. Понятия вектора средних и ковариационной матрицы. Свойства ковариационной матрицы. Эллипсоид рассеяния. Понятие коэффициента корреляции, его свойства. Представление о функции среднеквадратической регрессии. 4. Стохастические последовательности 4.1. Стохастическая сходимость у последовательности случайных величин. Виды стохастической сходимости. Сходимость по вероятности и по распределению. 4.2. Понятия закона больших чисел и центральной предельной проблемы. Основные результаты по закону больших чисел. Теоремы Маркова, Чебышева, Хинчина. Варианты центральной предельной теоремы. Теорема Линдеберга - Леви. Математическая статистика Введение 5. Оценивание параметров 5.1. Задача оценивания параметров. Понятия статистического параметра и его оценки. Основные требования к статистикам оценок. Принципы точечного оценивания. 5.2. Метод максимального правдоподобия для точечного оценивания. Идея метода и условия его состоятельности. Свойства регулярных оценок максимального правдоподобия. Оценивание вероятности успеха в схеме Бернулли как показательный пример. 5.3. Способы интервального оценивания. Доверительное утверждение и его построение по Е.Нейману. Примеры с дисперсией и средним нормальной генеральной совокупности; знакомство с 2 распределением К.Пирсона и t распределением Стьюдента. 6. Проверка параметрических гипотез 6.1. Задача проверки параметрических гипотез. Понятие параметрической статистической гипотезы. Ошибки первого и второго рода и выбор проверяемой гипотезы. Критерий значимости для гипотезы. Практическая конструкция теста. 6.2. Тест для вероятности успеха в схеме Бернулли как показательный пример. Тройной тест дегустатора в экспериментальной психологии. Формальные соотношения для теста; знакомство с распределением. 6.3. Способы конструирования субоптимальных тестов. Фундаментальная лемма НейманаПирсона. Тесты при монотонном отношении правдоподобия. Критерий обобщенного отношения правдоподобия Вальда - Уилкса. Примеры со средним и дисперсией нормальной генеральной совокупности. 6.4. 2 тест как разновидность критерия обобщенного отношения правдоподобия. 2 тест Пирсона для полиномиальной схемы Бернулли. Обобщение Фишера для 2 теста. 7. Процедуры прикладной статистики 7.1. Задача проверки согласия. Проблема согласия в статистике. Разведочный анализ для выдвижения гипотезы согласия. Общая конструкция теста согласия. 7.2. Практические тесты согласия. Тесты Колмогорова, Крамера - Мизеса и Пирсона для простой гипотезы. Модифицированные тесты для сложной гипотезы, тест Колмогорова Лиллифорса. 7.3. Задача проверки однородности. Проблема однородности в статистике. Разведочный анализ для выдвижения гипотезы однородности. Общая конструкция теста однородности. 7.4. Практические тесты однородности. Универсальные тесты Крамера - Пирсона и Колмогорова - Смирнова. Ранговые сдвига-масштабные тесты Фишера, Манна - Уитни, Вилкоксона и Ансари - Брэдли. Тесты на нормальных данных Стьюдента и Фишера; знакомство с F распределением Фишера - Снедекора. 7.5. Проверка независимости. Проблема независимости в статистике. Общая конструкция теста независимости. Универсальные тесты независимости типа 2 и 2 . Тесты некоррелированности Фишера, Спирмена и Кендалла. 7.6. Регрессионный анализ. Проблема выявления регрессионной зависимости в статистике и метод наименьших квадратов. Простая линейная регрессия; теорема Гаусса - Маркова о свойствах оценок наименьших квадратов. Доверительные границы для линии регрессии. II.2. Практические и семинарские занятия Занятие 1. Решение задач на применение классических определений вероятности случайного события по Бернулли - Лапласу и по Бюффону. Занятие 2. Решение задач на применение формул сложения и умножения вероятностей. Занятие 3. Решение задач на применение формулы полной вероятности и формулы Байеса. Занятие 4. Решение задач на применение биномиальной и полиномиальной формул Бернулли. Занятие 5. Решение задач на применение определения случайной величины (СВ) как измеримого отображения. Задачи на анализ свойств функции распределения и выявление типа СВ. Задачи на построение безусловных и условных распределений в системе СВ. Занятие 6. Решение задач на построение нового закона распределения СВ при её преобразовании. Задачи на моделирование СВ с требуемым законом распределения. Занятие 7. Решение задач на определение числовых характеристик СВ. Занятие 8. Решение контрольных примеров. II.3. Лабораторные работы Введение. Общее знакомство с универсальным пакетом статистической обработки STATISTICA по основному меню. Изучение с помощью Help встроенного языка программирования пакета. Задание 1. Смоделировать с помощью датчиков случайных чисел из языка пакета три выборки объема n 50 наблюдений из генеральной совокупности (ГС) с распределениями: стандартным нормальным с 0, 2 1 ; равномерным в [0.5, 0.5] ; пуассоновским с 1 . Завести реальные данные (N_группы, идентификатор_студента, рост /см/, вес /кг/, цвет_глаз /0-темные, 1-светлые/). Построить средствами графики пакета гистограммы модельных данных на фоне подгоночных кривых распределений ГС. Проинтерпретировать гистограммы как оценки дифференциальной формы распределений ГС. Задание 2. Для модельных данных объема n 1000 наблюдений из стандартного нормального и равномерного на [3, 3] распределений построить средствами пакета таблицу основных описательных статистик выборок. Проанализировать данные из таблицы как оценки подходящих параметров смоделированных ГС. Задание 3. На модельных нормальных данных Задания 1 построить классические 95%-ные доверительные утверждения для матожидания и дисперсии распределения ГС (для промежуточных вычислений воспользоваться описательными статистиками выборки и квантилями t и 2 распределений из пакета). Задание 4. Для числа опытов n 25,100 и 500 при уровне значимости порядкa 0.042 построить графикой пакета функцию мощности Wn p теста дегустатора с шагом для p в 0.05 на отрезке 1 3,1 (для вычислений воспользоваться встроенной функцией распределения из языка пакета). Прокомментировать состоятельность теста. Задание 5. Провести разведочный анализ нормального согласия на реальных данных у роста и веса по описательным статистикам, вероятностной бумаге и гистограммам. Сделать формальный анализ согласия по достигнутому уровню значимости у теста Колмогорова Лиллифорса для сложной гипотезы. Задание 6. Провести разведочный анализ однородности на реальных данных у роста, либо веса модифицированным методом вероятностной бумаги; сделать корректный выбор альтернативы и теста для строгой проверки однородности. Провести формальный анализ однородности по достигнутому уровню значимости у теста Стьюдента и теста Вилкоксона. Задание 7. Составить таблицу сопряженности признаков для проведения анализа независимости на реальных данных между номером группы и цветом глаз. Сделать формальный анализ независимости по достигнутому уровню значимости у теста 2 Пирсона - Фишера. Задание 8. Проверить степень зависимости у реальных данных между ростом и весом путем анализа наблюдаемой значимости нормального коэффициента корреляции Фишера. Восстановить линейную регрессионную зависимость между ростом и весом по методу наименьших квадратов. Ш. РАСПРЕДЕЛЕНИЕ ЧАСОВ КУРСА ПО ТЕМАМ И ВИДАМ РАБОТ № 1. 2. 3. Наименование тем Случайное событие и его вероятность Правила исчисления вероятностей Схема опытов Бернулли Всего часов Аудиторные занятия (час) Самостоятельная в том числе работа лабораторные лекции семинар занятия ы 13 6 2 - 5 12 4 3 - 5 9 2 2 - 5 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. Понятие случайной величины Функция распределения и её свойства Типы случайных величин Смена закона распределения при преобразовании случайной величины Числовые характеристики случайной величины Понятие генеральной совокупности и выборки из неё Точечное оценивание статистического параметра Интервальное оценивание параметра Проверка параметрических статистических гипотез Проверка гипотезы согласия Проверка гипотезы однородности Проверка гипотезы независимости Задача восстановления регрессионной зависимости ИТОГО 10 4 1 - 5 11 4 2 - 5 11 4 2 - 5 12 4 2 - 6 14 6 2 - 6 11 1 - 4 6 19 9 - 4 6 13 3 - 4 6 19 9 - 4 6 13 3 - 4 6 12 2 - 4 6 12 2 - 4 6 13 3 - 4 6 204 66 16 32 90 IV. ФОРМА ИТОГОВОГО КОНТРОЛЯ В первом семестре – экзамен, во втором семестре – зачёт. V. УЧЕБНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ КУРСА 1. 2. 3. 4. 5. V.1.Рекомендуемая литература (основная) Гнеденко Б.В. Курс теории вероятностей, изд.6-е. -М:Наука,1988. Радюк Л.Е., Терпугов А.Ф. Теория вероятностей и случайных процессов. -Томск:Изд-во ТГУ,1988. Вентцель Е.С. Теория вероятностей. -М:Наука,1969. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. -М:ИНФРА-М,Финансы и статистика,1995. Терпугов А.Ф. Математическая статистика (конспект лекций). -Томск:Изд-во ТГУ,1974. 6. Боровиков В.П., Боровиков И.П. STATISTICA - Статистический анализ и обработка данных в среде Windows. -М:Информационно-издательский дом "Филинъ",1997. V.2. Рекомендуемая литература (дополнительная) 7. Колмогоров А.Н. Основные понятия теории вероятностей, изд.2-е. -М:Наука,1974. 8. Худсон Д. Статистика для физиков, изд.2-е. -М:Мир,1970. 9. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики, изд.3-е. -М:Наука, 1983. V.3. Рекомендуемые наглядные пособия 10. Компьютерный помощник по теории вероятностей. Часть 2. (учебно-методическое пособие). Электрон. ресурс. -Томск:ТГУ,2004. –Реж. доступа: http://www.inf.tsu.ru/Library/Edu/Potapov/Tv2.pdf. 11. Лабораторный практикум по математической статистике на базе пакета STATISTICA-6 (учебно-методическое пособие). Электрон. ресурс. -Томск:ТГУ,2005. –Реж. доступа: http://www.inf.tsu.ru/Library/Edu/Potapov/Ms6.pdf.