1 аксиоматика теории вероятностей

реклама
Государственное образовательное учреждение «Кемеровский государственный университет»
ГОУ ВПО Новокузнецкий филиал-институт КемГУ
Кафедра математики и математического моделирования
Факультет информационных технологий
РАБОЧАЯ ПРОГРАММА
учебной дисциплины
ДС.Р “ПРИКЛАДНЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ”
( шифр и наименование дисциплины по рабочему учебному плану ООП)
для специальности
010501 Прикладная математика и информатика
( шифр и название специальности)
для ______________дневной________ формы обучения
Составитель(и) / разработчик(и) программы
Линдин Г.Л., доцент, к.т.н.
(Ф.И.О., должность и ученая степень)
Новокузнецк
Учебно-методическое обеспечение дисциплины
Лист – вкладка рабочей программы учебной дисциплины
Прикладные задачи математической статистики, ДС
название дисциплины, цикл, компонент
Список основной учебной литературы
*Указания о контроле на
момент переутверждения
программы
Дата
Внесение, продление или исключение
1
2
Внесение
4
Гмурман В.Е.
5
2003
Соответствие ГОС (для федеральных дисциплин) или соответствия требованиям ООП
(для региональных и вузовских)
- указание на недостаточно
отраженные в учебнике разделы
6
Соответствует
Плис А. И.
2004
Соответствует
31
Боровиков В.
2003
Соответствует
7
Сведения об учебниках
Наименование, гриф
3
1. Теория вероятностей и математическая
статистика : Учебное пособие для вузов. - 9-е
издание, стереотипное. - М. : Высшая школа,
2003. - 479с. - Гриф МО "Рекомендовано".
2. Практикум по прикладной статистике в
среде SPSS: учебное пособие : в 2 ч. Ч. 1 :
Классические процедуры статистики. - М. :
Финансы и статистика, 2004. - 288 с. - Гриф
МО "Допущено".
3. Боровиков В. STATISTICA. Искусство
анализа данных на компьютере: Для профессионалов [Текст] / Боровиков В. – СПб.: Питер, 2003. – 688 с. - Гриф МО "Допущено".
Автор
Год издания
Количество экземпляров в библиотеке
на момент переутверждения программы
7
77
5
СОДЕРЖАНИЕ
ВВЕДЕНИЕ .................................................................................................................... 7
ОСНОВНАЯ ЧАСТЬ УМК........................................................................................ 8
1 РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ...................................... 8
1.1 Пояснительная записка ....................................................................................... 8
1.2 Инновационные образовательные технологии ................................................ 9
1.2.1 Рейтинговая система оценки знаний ........................................................ 9
1.2.2 Статистический анализ данных с помощью пакета программ
“STATISTICA” .......................................................................................... 11
1.3 Учебно-тематический план рабочей программы дисциплины
ДС.Р “Прикладные задачи математической статистики” ............................... 12
1.3.1 Специализация “Математическое моделирование“ ............................... 12
1.3.2 Специализация “Системное программирование“ ................................... 13
1.3.3 Тематика курсовых работ .......................................................................... 14
1.4 Учебно-методическое обеспечение дисциплины ............................................ 14
1.4.1 Учебная литература ................................................................................... 14
1.4.2 Методические рекомендации для преподавателей ................................. 15
1.4.3 Методические указания студентам ......................................................... 16
1.4.3.1 Общие указания................................................................................... 16
1.4.3.2 Статистическая оценка числовых характеристик............................ 15
1.4.3.3 Проверка гипотезы о нормальном распределении .......................... 17
1.4.3.4 Отыскание двумерной корреляционной связи и проверка
гипотезы об отсутствии этой связи ................................................... 17
1.4.3.5 Отыскание множественной корреляционной связи ........................ 18
1.4.3.6 Проверка гипотезы об отсутствии ранговой корреляции ............... 18
1.4.3.7 Проверка гипотезы о совпадении распределений двух выборок... 19
1.5 Формы текущего, промежуточного и итогового контроля ............................. 19
1.6 Требования к уровню освоения программы ..................................................... 20
1.7 График организации самостоятельной работы студентов ............................. 20
2 ТЕМАТИКА И ПЕРЕЧЕНЬ КОНТРОЛЬНЫХ (САМОСТОЯТЕЛЬНЫХ)
РАБОТ, ЗАДАНИЙ И ЗАДАЧ ................................................................................. 22
2.1 Самостоятельная работа по математической статистике ............................... 22
2.2 Самостоятельная работа по дисперсионному анализу .................................... 22
3 ТЕСТЫ ДЛЯ ПРОМЕЖУТОЧНОГО КОНТРОЛЯ ЗНАНИЙ .............................. 39
4 ВОПРОСЫ ДЛЯ ЭКЗАМЕНА ................................................................................. 53
5 СПРАВОЧНИК .......................................................................................................... 57
ПРИЛОЖЕНИЕ: Методические указания «ЭЛЕМЕНТЫ КОМБИНАТОРИКИ,
ТЕОРИИ ВЕРОЯТНОСТЕЙ И ПРИКЛАДНЫЕ ЗАДАЧИ
МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ»
6
ВВЕДЕНИЕ
Предметом теории вероятностей является изучение вероятностных закономерностей массовых однородных случайных событий. Знание закономерностей, которым
подчиняются массовые случайные события, позволяет предвидеть, как эти события
будут протекать. Например, хотя появление «герба» при одном бросании монеты
нельзя наперед определить, но можно предсказать, причем с маленькой погрешностью, число появлений «герба», если монета будет брошена достаточно большое
число раз.
Методы теории вероятностей широко применяются в различных отраслях естествознания и техники. Теория вероятностей служит также для обоснования математической и прикладной статистики, которая в свою очередь используется при планировании и организации производства, предупредительном и приемочном контроле качества продукции и для многих других целей. Решение этих задач начинается с
исследования зависимостей, которые проявляются в проводимых испытаниях.
В исследовании корреляций (зависимостей, связей...) вы не влияете (или, по
крайней мере, пытаетесь не влиять) на переменные, а только измеряете их и хотите
найти зависимости (корреляции) между некоторыми измеренными переменными,
например, между кровяным давлением и уровнем холестерина. В экспериментальных исследованиях, напротив, вы варьируете некоторые переменные и измеряете
воздействия этих изменений на другие переменные. Например, исследователь может
искусственно увеличивать кровяное давление, а затем на определенных уровнях
давления измерить уровень холестерина. Анализ данных в экспериментальном исследовании также приходит к вычислению "корреляций" (зависимостей) между переменными, а именно, между переменными, на которые воздействуют, и переменными, на которые влияет это воздействие. Тем не менее, экспериментальные данные
потенциально снабжают нас более качественной информацией. Только экспериментально можно убедительно доказать причинную связь между переменными. Например, если обнаружено, что всякий раз, когда изменяется переменная A, изменяется и
переменная B, то можно сделать вывод - "переменная A оказывает влияние на переменную B", т.е. между переменными А и В имеется причинная зависимость. Результаты корреляционного исследования могут быть проинтерпретированы в каузальных (причинных) терминах на основе некоторой теории, но сами по себе не могут
отчетливо доказать причинность.
Независимыми переменными называются переменные, которые варьируются исследователем, тогда как зависимые переменные - это переменные, которые измеряются или регистрируются. Может показаться, что проведение этого различия создает путаницу в терминологии, поскольку как говорят некоторые студенты "все переменные зависят от чего-нибудь". Тем не менее, однажды отчетливо проведя это различие, вы поймете его необходимость. Термины зависимая и независимая переменная применяются в основном в экспериментальном исследовании, где экспериментатор манипулирует некоторыми переменными, и в этом смысле они "независимы"
от реакций, свойств, намерений и т.д. присущих объектам исследования.
7
ОСНОВНАЯ ЧАСТЬ УМК
1 РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
1.1 Пояснительная записка
Дисциплина ДС.Р «Прикладные задачи математической статистики» для студентов специальности 010501 «Прикладная математика и информатика» является логическим продолжением дисциплины ОПД.Ф «Теория вероятностей и математическая статистика» в 8-9 семестрах.
Цель курса – научить студентов использовать математические методы в прикладных исследованиях и расчетах. Она является составной частью общей цели
ООП – подготовить высококвалифицированных специалистов – математиков для
работы в отраслях народного хозяйства, научных и учебных заведениях соответствующего профиля. Для этого необходимо обеспечить уровень подготовки студентов по математическим дисциплинам таким, чтобы они умели:
 математически ставить общие задачи и предлагать адекватные методы их решения;
 конструировать математические модели процессов и явлений;
 рассчитывать параметры конструкций и систем, обеспечивающих безопасность
жизнедеятельности;
 решать конкретные задачи предприятий с применением статистических методов;
 давать статистически обоснованные прогнозы;
 статистически обобщать и давать критический анализ результатов работы
учреждений по повышению эффективности их деятельности.
Студенты должны знать:
 элементы теории вероятностей;
 математическую статистику;
 «разведочный» анализ данных;
 элементы дисперсионного анализа;
 статистические методы обработки экспериментальных данных;
 непараметрические методы статистического анализа;
 методы классификации и компьютерной обработки статистических данных.
Формы обучения включают в себя:
- лекции, на которых закладываются теоретическая база знаний по дисциплине
ДС.Р «Прикладные задачи математической статистики»;
- практические занятия, где студенты приобретают навыки в решении задач по отдельным разделам статистики;
- самостоятельная работа студентов, которая осуществляется в двух формах: индивидуального выполнения заданий и индивидуально-аудиторного – с консультацией у преподавателя;
- разбор сложных задач на плановых консультациях.
Особенность курса ДС.Р «Прикладные задачи математической статистики» для
будущих математиков является его прикладной характер: изучение большинства тем
8
сопровождается использованием современного пакета прикладных программ
«STATISTICA» для решения прикладных задач математической статистики.
По дисциплине осуществляется текущий, промежуточный и итоговый контроль в форме экзамена в каждом семестре.
Аудиторные
Семестр
8
9
Всего
Виды учебных занятий ДО
Внеаудиторные
Лекции
Практические
Лабораторные
Контрольная
Курсовая
32
28
60
32
28
60
-
-
+
+
Самостоятельная
работа
5
10
15
Форма контроля
экзамен
экзамен
1.2 Инновационные образовательные технологии
1.2.1 Рейтинговая система оценки знаний
Уровень математической подготовки студентов в силу известных причин разнороден. Эту ситуацию необходимо учитывать при проведении практических занятий. Очень велика роль преподавателя как организатора самостоятельной познавательной деятельности студентов. Для управления этой деятельностью и эффективного отслеживания работоспособности студентов важно использовать индивидуальный подход, учитывающий уровень подготовки каждого студента.
При проведении практических занятий по дисциплине ДС.Р «Прикладные задачи математической статистики» используется рейтинговая система оценки знаний. Занятия проводятся с использованием практикума «Элементы комбинаторики,
теории вероятностей и прикладные задачи математической статистики».
Каждый студент, получив задания в начале семестра, должен к очередному
занятию проработать соответствующий лекционный материал, подготовить ответы
на вопросы по теме занятия, разобрать приведенные на лекции примеры и попытаться решить одну из задач. На занятиях после планового контроля теоретических
знаний студенты самостоятельно решают задачи, а преподаватель консультирует их,
указывая, в случае необходимости, идею решения, и поэтапно проверяет работу
студентов, выясняя в ходе проверки степень их теоретической подготовки. В случае
возникновения общих затруднений или однотипных ошибок преподаватель дает
общие указания и разъяснения. В конце занятия преподаватель оценивает работу
каждого студента в зависимости от степени его теоретической подготовки и количества решенных задач.
Самостоятельная работа студентов оценивается на основе балльной системы.
За правильный ответ на один теоретический вопрос, а также за правильно решенную
задачу студент получает определенное количество баллов. Аналогично оцениваются
решения заданий при проведении контрольных и семестровых работ, а также ответы
на вопросы экзаменационных билетов. Нерешенные на занятии задачи остаются в
качестве домашних заданий. Однако студент в течение занятия должен решить
определенный минимум задач. Студенты, не выполнившие на занятии установлен9
ный объем работы или пропустившие занятия, обязаны явиться в указанное время
для дополнительной работы.
Индивидуальные задания разработаны по всем темам курса «Прикладные задачи математической статистики». При разработке заданий автор руководствовался
следующими соображениями. Задачи в задании расположены в порядке возрастания
сложности, включая задачи, решаемые по образцу, данному преподавателем на лекции, или по обобщенному алгоритму, реконструктивно-вариативные, частичнопоисковые, а также задачи исследовательского характера. Как показывает опыт, шок
от неудачи при решении первой же задачи редко оказывается полезным. Поэтому
первые две задачи должны быть по силам каждому студенту. Помимо этого задания
должны включать задачи, способствующие приобретению исследовательских навыков или задачи, требующие анализа полученных результатов. При этом преподаватель на каждом занятии должен обеспечивать всем студентам возможность преодоления трудностей, возникающих при решении задач. Чтобы студенты могли работать интенсивно, в посильном для них темпе, задания должны быть разработаны с
учетом времени их выполнения как хорошо подготовленными, так и слабыми студентами.
Варианты заданий требуют различного уровня мышления – от простого решения по образцу или алгоритму до уровня самостоятельного построения некоторых
логических схем с элементами исследовательского характера. Индивидуальные задания, построенные таким образом, позволяют работать самостоятельно всем студентам с учетом различного уровня их подготовки. При этом возможна самооценка
понимания предмета. Вместе с тем преподаватель имеет возможность оценить индивидуальные способности и знания студентов и оперативно корректировать задания, учитывая его сложность и объем, то есть целенаправленно управлять познавательной деятельностью.
К концу семестра каждый студент набирает определенную сумму баллов, которая красноречиво говорит о его успехах в изучении дисциплины. При получении
более 70% от максимально возможной суммы баллов (без учета экзамена) студент
освобождается от экзамена и получает оценку «отлично». При получении от 50 до
70% - получает оценку «хорошо» при согласии студента. Студенты, набравшие менее 50% от максимальной суммы баллов, сдают экзамен.
При проведении экзамена рейтинговая система оценки применяется следующим образом: за отличный ответ студент получает 20-25% от максимально возможной суммы баллов, за хороший ответ – 15-20%, за удовлетворительный ответ – 10%.
Итоговая оценка выставляется с учетом оценки экзамена и текущей успеваемости: «отлично» за 70% от максимально возможной суммы баллов, «хорошо» – за
55%, «удовлетворительно» – за 40%.
Рейтинговая система контроля знаний не может решить всех проблем высшей
школы. Основная цель этой системы – максимальное повышение интереса студентов к изучаемой дисциплине, стимулирование творческой активности и трудолюбия.
Система вносит дух состязательности в студенческую среду, пропагандирует личность студента - отличника.
Ниже приведены результаты оценки знаний студентов на двух потоках по
рейтинговой и традиционной системе.
10
Семестр
восьмой
девятый
Группа студентов
не сдавших экзамен на начало
сессии
не сдавших экзамен на конец
сессии
досрочно получивших оценку
«отлично»
не сдавших экзамен на начало
сессии
не сдавших экзамен на конец
сессии
досрочно получивших оценку
«отлично»
Рейтинговая
система
15%
Традиционная
система
35%
5%
25%
10%
0%
10%
30%
5%
20%
18%
3%
Сравнение полученных результатов показывает, что даже при одинаковом
начальном уровне математической подготовки успеваемость студентов (качественная в том числе) выше в случае, когда оценка их знаний проводилась по рейтинговой системе.
1.2.2 Статистический анализ данных с помощью пакета программ
“STATISTICA”
Статистический анализ крупных баз данных связан с большими вычислительными затратами. В этом анализе полезно использовать пакет программ
“STATISTICA”, который позволяет найти статистические оценки всех числовых характеристик генеральной совокупности, проверить статистическую гипотезу о нормальном распределении генеральной совокупности, построить соответствующую
гистограмму распределения частот.
В случае двумерной выборки из нормальной генеральной совокупности пакет
помогает построить облако данных, сгруппировать данные в виде корреляционной
таблицы, найти выборочное уравнение регрессии и проверить гипотезу об отсутствии корреляционной связи компонент выборки.
Если закон распределения двумерной генеральной совокупности неизвестен, а
выборка имеет малый объем, то пакет программ “STATISTICA” позволяет проверить гипотезу об отсутствии ранговой корреляции Спирмена и Кендалла.
В случае многомерной выборки можно найти уравнение множественной регрессии и выяснить значимость каждой из независимых переменных. С помощью
коэффициента ранговой конкордации Кендалла можно проверить гипотезу об отсутствии корреляции многомерной выборки в целом.
11
С помощью критериев Вальда-Вольфовица, Манна-Уитни и КолмогороваСмирнова можно проверить гипотезу о совпадении законов распределения двух выборок малого объема.
Пакет программ “STATISTICA” позволяет провести кластерный, дисперсионный анализ многомерных и многофакторных объектов в различных метриках, построить дерево классификаций, содержащее необходимое количество вершин ветвления и т.д. Методом статистических испытаний возможно моделирование выборок
из генеральной совокупности с заданным законом распределения и числовыми характеристиками.
1.3 Учебно-тематический план рабочей программы учебной дисциплины
ДС.Р “Прикладные задачи математической статистики”
1.3.1 Специализация “Математическое моделирование“
Объем часов 135 час.
Аудиторная работа 120 час.
ПрактичеЛекЛабораские
ции 60
торные
занятия 60
час.
занятия 0
час.
4
5
6
8 семестр
Примечания, дополниСамотельные указания, местоятодические материалы,
тельная
технические средства и
работа
др.
15 час.
7
8
№
Название и содержание разделов,
тем, модулей
1
2
1
«Разведочный» анализ данных.
7
2
4
0
1
2
Планирование эксперимента и дисперсионный анализ.
13
6
6
0
1
3
Порядковые статистики.
13
6
6
0
1
4
Непараметрические
методы.
13
6
6
0
1
5
Задачи классификации.
12
6
6
0
6
4
0
1
32
32
0
5
6
Общий
объем
135 час.
3
Компьютерное
обеспечение стати11
стических процедур.
Итого за 8 семестр
69
Форма контроля – экзамен
Изучается тема 8 *.
Выполняются индивидуальные задания р.
2.1.
Изучаются темы 9–10*. Выполняются индивидуальные
задания р. 2.1.
Изучается тема 12 *.
Выполняются индивидуальные задания *.
Изучается тема 11 *.
Выполняются индивидуальные задания *.
Изучаются темы 13-14 *
Выполняются индивидуальные задания *..
Изучаются методические указания р. 1.4.3 и
выполняются задания
р. 2.1.
9 семестр
7
8
9
10
11
Статистическое
оценивание
Теория корреляции
Теория статистических гипотез
Метод статистических испытаний
Случайные процессы
Итого за 9 семестр
Всего по дисциплине
14
6
6
0
2
10
4
4
0
2
18
8
8
0
2
6
2
2
0
2
18
8
8
0
2
66
135
28
60
28
60
0
0
10
15
12
Изучаются главы 15-16**.
Изучается глава 18 **.
Изучается глава 19 **.
Изучается глава 21 **.
Изучаются главы 23-25**.
Формы контроля – курсовая работа и экзамен
Рекомендации к переэкзаменовке
Применяются общие требования к переэкзаменовке
Формы контроля
 Аттестационная контрольная работа по прикладной статистике (см. р. 2.1) – 8 неделя 8 семестра
 Экзамен – 8 семестр
 Курсовая работа – 9 семестр
 Экзамен – 9 семестр
Пояснения:
* Элементы комбинаторики, теории вероятностей и прикладные задачи математической статистики: практикум /
Г.Л. Линдин, НФИ Кем ГУ. – Новокузнецк, 2008. – 101 с.
** Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. - 9-е издание,
стереотипное. - М. : Высшая школа, 2003. – 479 с.
1.3.2 Специализация “Системное программирование“
Объем часов 120 час.
Аудиторная работа 120 час.
ПрактичеЛекЛабораские
ции 60
торные
занятия 60
час.
занятия 0
час.
4
5
6
8 семестр
Примечания, дополниСамотельные указания, местоятодические материалы,
тельная
технические средства и
работа
др.
0 час.
7
8
№
Название и содержание разделов,
тем, модулей
1
2
1
«Разведочный» анализ данных.
6
2
4
0
0
2
Планирование эксперимента и дисперсионный анализ.
12
6
6
0
0
3
Порядковые статистики.
12
6
6
0
0
4
Непараметрические
методы.
12
6
6
0
0
5
Задачи классификации.
12
6
6
0
0
6
4
0
0
32
32
0
0
6
7
8
9
10
11
Общий
объем
120 час.
3
Компьютерное
обеспечение стати10
стических процедур.
Итого за 8 семестр
64
Форма контроля – экзамен
9 семестр
Статистическое
12
6
6
0
оценивание
Теория корреляции
8
4
4
0
Теория статистиче16
8
8
0
ских гипотез
Метод статистиче4
2
2
0
ских испытаний
Случайные процес16
8
8
0
сы
Итого за 9 семестр
56
28
28
0
Всего по дисциплине
120
60
60
0
Формы контроля – курсовая работа и экзамен
Рекомендации к переэкзаменовке
Применяются общие требования к переэкзаменовке
13
0
0
0
0
0
0
0
Изучается тема 8 *.
Выполняются индивидуальные задания р.
2.1.
Изучаются темы 9–10*. Выполняются индивидуальные
задания р. 2.1.
Изучается тема 12 *.
Выполняются индивидуальные задания *.
Изучается тема 11 *.
Выполняются индивидуальные задания *.
Изучаются темы 13-14 *
Выполняются индивидуальные задания *..
Изучаются методические указания р. 1.4.3 и
выполняются задания
р. 2.1.
Изучаются главы 15-16**.
Изучается глава 18 **.
Изучается глава 19 **.
Изучается глава 21 **.
Изучаются главы 23-25**.
Формы контроля
 Аттестационная контрольная работа по прикладной статистике (см. р. 2.1) – 8 неделя 8 семестра
 Экзамен – 8 семестр
 Курсовая работа – 9 семестр
 Экзамен – 9 семестр
Пояснения:
* Элементы комбинаторики, теории вероятностей и прикладные задачи математической статистики: практикум /
Г.Л. Линдин, НФИ Кем ГУ. – Новокузнецк, 2008. – 101 с.
** Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. - 9-е издание,
стереотипное. - М. : Высшая школа, 2003. – 479 с.
1.3.3 Тематика курсовых работ
Общая тематика курсовых работ «Статистический анализ наблюдаемых значений многомерной случайной величины». В каждой конкретной работе акцент делается на методах статистического анализа, необходимых для выполнения выпускной
дипломной работы, и их реализации в пакете программ “STATISTICA”.
1.4 Учебно-методическое обеспечение дисциплины
1.4.1 Учебная литература
Основная литература
1. Гмурман В.Е. Теория вероятностей и математическая статистика. Учеб. пособие для вузов. [Текст] / В.Е. Гмурман. – М.: Высш. шк., 2003. – 479 с.
2. Плис А.И. Практикум по прикладной статистике в среде SPSS: учебное пособие: в 2 ч. Ч. 1 : Классические процедуры статистики. [Текст] / А.И. Плис - М. : Финансы и статистика, 2004. - 288 с.
3. Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Для
профессионалов [Текст] / В. Боровиков – СПб.: Питер, 2003. – 688 с.
Дополнительная литература
4. Джонсон Н. Статистика и планирование эксперимента в науке и технике.
Методы обработки данных [Текст] / Джонсон Н., Лион Ф. – М.: Мир, 1980.
5. Айвазян С.Н. Прикладная статистика: основы моделирования и первичная
обработка данных [Текст] / Айвазян С.Н., Енюков И.С., Мешалкин Л.Д. – М.: Финансы и статистика, 1983.
6. Справочник по прикладной статистике / Под ред. Э. Ллойда и У. Ледермана,
т. 1, 2. [Текст] – М.: Финансы и статистика, 1989.
4. Рунион Р. Справочник по непараметрической статистике[Текст] / Рунион Р.
- М.: Финансы и статистика, 1982.
5. Факторный, дискриминантный и кластерный анализ / Под ред. И.С. Енюкова
[Текст] – М.: Финансы и статистика, 1989.
6. Вентцель Е.С. Теория вероятностей. Учеб. пособие для вузов. [Текст] / Е.С.
Вентцель. – М.: Высш. шк., 1998. – 576 с.
14
7. Кендалл М.Дж. Статистические выводы и связи [Текст] / Кендалл М.Дж.,
Стьюарт А. – М: Наука, 1973.
8. Тьюки Дж. Анализ результатов наблюдений [Текст] / Тьюки Дж. - М.: Мир,
1981.
9. Выявление экспертных знаний / Под ред. О.И. Ларичев и др [Текст] – М.:
Наука, 1989.
10. Лбов Г.С. Логические решающие функции и вопросы статистической
устойчивости решений [Текст] / Лбов Г.С., Старцева Н.Г. - Новосибирск: Ин-т математики РАН, 1999.
11. Райфа Г. Прикладная теория статистических решений [Текст] / Райфа Г.,
Шлейфер Р. - М.: Статистика, 1977.
12. Кульбак С. Теория информации и статистика [Текст] - Кульбак С. М.:
Наука, 1967.
13. Тюрин Ю.Н. Анализ данных на компьютере [Текст] / Тюрин Ю.Н., Макаров А.А. - М.: Инфра-М, 1995.
1.4.2 Методические рекомендации для преподавателей
Преподавателю, читающему лекции, рекомендуется строить занятия в следующей
последовательности:
- теоретическая часть;
- решение соответствующей практической задачи;
- предложение подобной самостоятельной задачи (вначале за партой, а затем
одному из студентов – у доски), в ходе самостоятельного решения объяснять возможные ошибки;
- комментарии возможной области приложения похожих задач в прямой специальности.
Преподавателю, ведущему практические занятия, рекомендуется:
- первое занятие (в каждом семестре) посвятить проверке остаточных знаний по
математике (или школьных, или за предыдущий семестр);
Текущие практические занятия строить по схеме:
- «вспомнить» соответствующую лекцию (теорию);
- задавать практические задачи (5-10 минут размышлений и вызов к доске, желательно по списку);
- давать задание «на дом»;
- периодически (по завершению очередной темы) проводить контрольные работы.
Средства обучения математике обычно стандартны: базовые учебники, иллюстрация зависимостей на доске, и т.п.
Лектору и ассистенту рекомендуется стимулировать развитие самостоятельного мышления у студентов различными педагогическими приемами, например, с помощью рейтинговой системы оценки знаний.
15
1.4.3 Методические указания студентам
1.4.3.1 Общие указания
Самостоятельная работа студентов в ходе изучения дисциплины состоит в выполнении самостоятельных работ. Их своевременное выполнение является предпосылкой к обоснованию возможности допуска студента к экзаменам и оценки результатов итогового контроля.
Структура заданий по каждой из самостоятельных работ одинакова:
- в конце соответствующего (по номеру) раздела базового пособия даются контрольные вопросы и задачи;
- далее располагается таблица с графами «Вариант» и номерами от 1 до 30;
В каждой самостоятельной работе имеется 30 вариантов вопросов и задач. Вариант, предлагаемый конкретному студенту, обозначен как «номер по списку», что
означает порядковый номер расположения фамилии в учебном журнале.
Каждая из самостоятельных работ должна быть выполнена не позднее, чем через
неделю после изучения соответствующей темы. Выполненные работы передаются
лектору или ассистенту, ведущему практические занятия. Кроме того, на кафедре
МиММ есть соответствующие папки «Для самостоятельных работ студентов (далее
имена соответствующих преподавателей)», куда студент может поместить выполненное задание в любое учебное время.
Порядок оформления самостоятельных работ по математике весьма демократичен:
- работы могут выполняться на скрепленных двойных тетрадных листах;
- на первой странице указываются: номер самостоятельной работы, номер группы,
фамилия и имя студента, номер варианта;
- каждый из вопросов и задач формулируется в соответствии с заданием и нумеруется;
- зачеркивания и исправления допускаются (в пределах приличий).
Проверка самостоятельных работ осуществляется в течение недели; на ее титульном листе ставится отметка
– зачтено или - доработать. Зачтенные работы
не возвращаются, работы, нуждающиеся в корректировке – возвращаются студенту.
После доработки проверка работ повторяется.
Для разъяснения непонятных вопросов лектором курса еженедельно проводятся
консультации, о времени которых группы извещаются заранее. В последние годы в
НФИ КемГУ нашла распространение практика индивидуально-аудиторных занятий
для выполнения самостоятельных работ. Студентам назначается аудитория и время,
в течение которого они могут выполнять эти работы в присутствии ассистентов или
студентов старших курсов, проводящих квалифицированные текущие консультации.
1.4.3.2 Статистическая оценка числовых характеристик
Для оценки числовых характеристик генеральной совокупности: средней, среднего квадратического отклонения, асимметрии и эксцесса используются соответствующие исправленные выборочные оценки: средняя, среднее квадратическое отклонение, асимметрия и эксцесс
16


х   хi  / n , S   ( xi  x) 2 / (n  1) , As  n 2  M 3 / n  1  (n  2)  M 2 M 2 ,
Еx  n 2  (n  1)  M 4  3M 2  M 2  (n  1) / M 2  M 2  (n  1)  (n  2)  (n  3) , где Мк – тральные
выборочные моменты к-го порядка.
Все эти оценки можно найти с помощью русифицированного пакета программ
“STATISTICA”, используя следующие закладки: “Анализ”  “Основные статистики
и таблицы”  “Описательные статистики”  “Переменные” (выбрать столбцы или
все столбцы)  “Дополнительно” (и в открывшемся окне необходимо поставить
флажки около нужных оценок: “Среднее”, “Стандартное отклонение”, “Дисперсия”,
“Асимметрия”, “Эксцесс”.
Для понимания процесса статистического оценивания важно провести расчеты
«вручную» методом произведений (пример 3, тема 8), сгруппировав предварительно
данные, и сравнить полученные результаты с расчетами в пакете программ
“STATISTICA”.
1.4.3.3 Проверка гипотезы о нормальном распределении
Для проверки гипотезы о нормальном распределении генеральной совокупности
по данным выборки используются закладки “Анализ”  “Подгонка распределений”
 “Нормальное, ОК”  “Переменные, ОК” (выбирается один столбец данных выборки)  “Параметры”  “Число групп, ОК” (число интервалов группировки < 12).
Получим таблицу с наблюдаемыми и ожидаемыми частотами, а также наблюдаемой
и ожидаемой кумулятой. В верхней части таблицы приведено наблюдаемое значение критерия Хи – квадрат, скорректированное число степеней свободы «сс» и вероятность ошибки 1-го рода. Если p < 0.05, то гипотеза противоречит данным выборки. В противном случае – не противоречит.
Для просмотра соответствующей гистограммы распределения частот возвращаемся к свернутой закладке “Подгонка непрерывных распределений” и затем, используются закладки “Быстрый”  “График наблюдаемого и ожидаемого распределения”.
Для понимания процесса проверки статистической гипотезы важно провести
расчеты «вручную» с помощью критерия согласия Пирсона (пример 1, тема 10) и
сравнить полученные результаты с расчетами на ЭВМ.
1.4.3.4 Отыскание двумерной корреляционной связи и проверка гипотезы
об отсутствии этой связи
В случае двумерной выборки из нормальной генеральной совокупности уравнение регрессии отыскивается с помощью закладок “Графики”  “Диаграммы рассеяния”  “Переменные, ОК” (выбираются столбцы независимой и зависимой переменной)  “Дополнительно” (для установления значимости корреляционной зависимости необходимо поставить флажок в группе Статистики  Корреляция и pуровень, ОК).
Получается диаграмма рассеяния данных выборки около прямой линии регрессии. В верхней части отмечено уравнение линии, а в нижней части – выборочный
17
коэффициент корреляции «r» и «p-уровень». Если p < 0.05, то корреляция значима.
В противном случае – незначима и гипотеза об отсутствии этой связи принимается.
Построенное облако данных разделено сеткой на одинаковые прямоугольники.
Это позволяет сгруппировать данные и построить корреляционную таблицу. Эти
данные могут быть использованы при оценивании числовых характеристик каждой
компоненты выборки.
Для понимания процесса отыскания уравнения регрессии важно провести расчеты «вручную» с помощью корреляционной таблицы (тема 9) и сравнить полученные
результаты с расчетами на ЭВМ.
1.4.3.5 Отыскание множественной корреляционной связи
Множественная корреляционная связь отыскивается с помощью закладок “Анализ”  “Множественная регрессия”  “Переменные, ОК, ОК” (выбирается столбцы
данных многомерной выборки, например, v1 – зависимая переменная, а v2 v7 v8 –
независимые переменные)  “Итоговая таблица регрессии”. Коэффициенты линейной зависимости для каждой независимой переменной и свободный член указаны в столбце “В”.
Если для какой-то переменной “p – уровень” > 0.05, то влияние этой переменной
незначимо (соответствующая строка окрашена в черный цвет). В этом случае возвращаемся к “Переменные” и удаляем из списка независимых переменных соответствующий столбец и снова переходим к “Итоговая таблица регрессии”.
Для оценки относительной погрешности полученной многомерной зависимости
проводится расчет предсказаний зависимой переменной v1 по найденной формуле,
которые сравниваются с эмпирическими данными. Для этого необходимо дважды
щелкнуть левой кнопкой мыши по имени нового столбца таблицы данных, например, v9. В открывшемся окне можно изменить “Имя” этого столбца, например, на
«Предсказания», а в окне “Длинная метка или формула” вставить расчетную формулу линейной зависимости с найденными выше коэффициентами для каждой независимой переменной, например, =12,52+0,21*v2–0,37*v7+0,89*v8. Точно также с помощью окна “Длинная метка или формула”, куда вставляется расчетная формула
=(v1–v9)/v1*100, получается новый столбец с относительными погрешностями расчета в процентах.
1.4.3.6 Проверка гипотезы об отсутствии ранговой корреляции
Гипотеза об отсутствии ранговой корреляции двух генеральных совокупностей
проверяется в случае, когда неизвестен закон распределения этих совокупностей, а
двумерная выборка имеет малый объем. Гипотеза проверяется с помощью закладок
“Анализ”  “Непараметрическая статистика”  “Корреляция Спирмена, тау Кендалла, ОК”  “Переменные, ОК” (в открывшемся окне выбираются два столбца
рассматриваемых переменных)  “Дополнительно”  “Спирмена R” или “Тау
Кендалла”. В первом случае получаем наблюдаемое значение выборочного коэффициента ранговой корреляции Спирмена, а во втором случае – значение выборочного
коэффициента ранговой корреляции Кендалла. Если ранговая корреляция значима,
18
то результаты расчетов окрашены в красный цвет. В противном случае – в черный
цвет.
Гипотеза о согласованности многомерной выборки в целом проверяется с помощью коэффициента ранговой конкордации Кендала, который является мерой согласованности выборок. В этом случае ранжированные выборочные данные заносятся в
строки таблицы и выбираются закладки “Анализ”  “Непараметрическая статистика”  “Сравнение нескольких зависимых переменных”  “Переменные”  “Выбрать все, ОК”  “Ранговый ДА (дисперсионный анализ) и конкордация Кендалла”.
В открывшемся окне получаем выборочный коэффициент ранговой конкордации
Кендалла “Коэф. конкордации =” и вероятность ошибки 1- го рода “p”. Если p <
0.05, то ранжированные выборочные данные согласованы.
Для понимания двумерных непараметрических методов важно провести расчеты
«вручную» (примеры 1 - 2, тема 12) и сравнить полученные результаты с расчетами
на ЭВМ.
1.4.3.7 Проверка гипотезы о совпадении распределений двух выборок
Гипотеза о совпадении распределений двух независимых генеральных совокупностей по данным выборок малого объема проверяется с помощью критериев Вальда – Вольфовица, Манна – Уитни или Колмогорова – Смирнова.
Для применения критериев все выборочные данные заносятся во второй столбец
таблицы, а в первом столбце указывается соответствующий номер выборки. Затем
используются закладки “Анализ”  “Непараметрическая статистика”  “Сравнение двух независимых групп”  “Переменные, ОК”. Первый столбец выбирается в
качестве независимой переменной, а второй столбец - в качестве зависимой переменной. Наконец, выбирается критерий: в случае критерия серий Вальда – Вольфовица получаем “Число серий” – наблюдаемое число серий в упорядоченных данных,
относящихся к одной из выборок и р – уровень. В случае U критерия Манна – Уитни
получаем “Суммарные ранги” и р – уровень. В случае критерия Колмогорова –
Смирнова “Макс. Положительную разность” (максимальное по модулю отклонение
эмпирических функций распределения) и р – уровень. Если при этом p < 0.05, то
распределения совокупностей отличаются значимо. В этом случае результаты расчетов окрашены в красный цвет.
Для сравнения разных непараметрических критериев проверки гипотезы важно
провести расчеты «вручную» (примеры 1 – 5, тема 11) и сравнить полученные результаты с расчетами на ЭВМ.
1.5 Формы текущего, промежуточного и итогового контроля
Текущий контроль освоения программы оценивается по результатам выполнения
студентами контрольных (самостоятельных) работ.
График выполнения самостоятельных работ формируется исходя из следующих
требований:
- к началу экзаменационной сессии каждый студент обязан выполнить все самостоятельные работы, предусмотренные программой курса;
19
- к началу аттестации студент обязан выполнить те самостоятельные работы, которые предусмотрены в уже пройденных темах по дисциплине.
Промежуточный контроль освоения программы осуществляется в форме тестирования во время аттестации студентов. Тесты для промежуточного контроля приведены в разделе 3. Суммарное количество задач в тестах – 200. Компьютер с помощью метода случайных испытаний, выбирает каждому студенту 10 из них.
Итоговый контроль осуществляется в форме экзамена. Вопросы для экзаменов
приведены в разделе 4. Соотношение теоретических вопросов и практических задач
1:2, по 64 позиции в семестр. Из них формируются экзаменационные билеты. На экзамен студентам предлагается по одному теоретическому вопросу и по две задаче.
1.6 Требования к уровню освоения программы
Уровень освоения программы оценивается своевременностью и качеством сдачи
экзамена. При этом на экзамене дается один теоретический вопрос и две задачи; на
зачете – 2 задачи. При сдаче экзамена и зачета каждая позиция (вопрос, задача) оцениваются баллами:
3 балла – решение правильное;
2 балла – решение правильное, но с недочетами;
1 балл – путь решения правильный;
0 балл – решение неправильное, или отсутствует.
При сдаче экзамена можно получить в сумме от нуля до 9 баллов. Оценка «отлично» на экзамене выставляется, если количество набранных баллов - от 8 до 9, «хорошо» - от 6 до 7, «удовлетворительно» - от 4 до 5 баллов.
1.7 Организация самостоятельной работы студентов
Каждый студент обязан в течение двух недель после окончания очередной темы
сдать соответствующую работу на проверку ассистенту или лектору. «Работа над
ошибками» проводится во время еженедельных консультаций, назначаемых на кафедре. В ходе обучения дисциплине ДС.Р «Прикладные задачи математической
статистики» студенты выполняют одну курсовую работу на тему: «Статистический
анализ наблюдений многомерной случайной величины». Индивидуальные задания
выбираются из практикума «Элементы комбинаторики, теории вероятностей и прикладные задачи математической статистики», который упоминается ниже под цифрой 1. Кроме того, для изучения теоретического материала в качестве основной литературы используется учебник и задачник, автор которых Гмурман В.Е.
20
График организации самостоятельной работы студентов по учебному плану по дисциплине ДС.Р «Прикладные задачи математической статистики» для специализации
«Математическое моделирование»
Общее кол-во часов по учебному плану - 135 час.
120 час. Аудиторная работа
15 час. Самостоятельная работа
Формы аудиторных учебных занятий (час.)
Виды самостоятельной учебной работы (час.)
№
недели
№ и тема лекции
60
часов
Лекции
60
часов
Практические
занятия
0
часов
лабораторные
работы
0 час.
Изучение
теоретического материала
0 час.
Решение
практических задач
0 час.
Составление практических
задач и
тестов
5 час.
*
Выполнение
курсовой
работы
10 час.
Индивидуальные
задания
8 семестр
1
2-4
5-7
8-10
«Разведочный» анализ
данных.
Планирование эксперимента и дисперсионный анализ.
Порядковые статистики.
Непараметрические
методы.
2
2
0
0
0
0
0
1
6
6
0
0
0
0
0
1
6
6
0
0
0
0
0
1
6
6
0
0
0
0
0
1
11-13
Задачи классификации.
6
8
0
0
0
0
0
0
14-16
Компьютерное обеспечение статистических
процедур.
6
4
0
0
0
0
0
1
Всего
32
час.
32
час.
0 час.
0 час.
0 час.
0 час.
0 час.
5 час.
9 семестр
1-3
4-5
6-9
10
11-14
Статистическое оценивание
Теория корреляции
Теория статистических
гипотез
Метод статистических
испытаний
Случайные процессы
Всего
ИТОГО
6
6
0
0
0
0
1
1
4
4
0
0
0
0
1
1
8
8
0
0
0
0
1
1
2
2
0
0
0
0
1
1
8
8
0
0
0
0
1
1
28
час.
28
час.
0 час.
0 час.
0 час.
0 час.
5 час.
5 час.
60
60
0
0
0
0
5
10
Пояснения:
* см. приложения М, Н [1], а также р. 1.4.3.
21
График организации самостоятельной работы студентов по учебному плану по дисциплине ДС.Р «Прикладные задачи математической статистики» для специализации «Системное программирование»
Общее кол-во часов по учебному плану - 120 час.
120 час. Аудиторная работа
0 час. Самостоятельная работа
Формы аудиторных учебных занятий (час.)
Виды самостоятельной учебной работы (час.)
№
недели
№ и тема лекции
60
часов
Лекции
60
часов
Практические
занятия
0
часов
лабораторные
работы
0 час.
Изучение
теоретического материала
0 час.
Решение
практических задач
0 час.
Составление практических
задач и
тестов
0 час.
*
Выполнение
курсовой
работы
0 час.
Индивидуальные
задания
8 семестр
1
2-4
5-7
8-10
«Разведочный» анализ
данных.
Планирование эксперимента и дисперсионный анализ.
Порядковые статистики.
Непараметрические
методы.
2
2
0
0
0
0
0
1
6
6
0
0
0
0
0
1
6
6
0
0
0
0
0
1
6
6
0
0
0
0
0
1
11-13
Задачи классификации.
6
8
0
0
0
0
0
0
14-16
Компьютерное обеспечение статистических
процедур.
6
4
0
0
0
0
0
1
Всего
32
час.
32
час.
0 час.
0 час.
0 час.
0 час.
0 час.
0 час.
9 семестр
1-3
4-5
6-9
10
11-14
Статистическое оценивание
Теория корреляции
Теория статистических
гипотез
Метод статистических
испытаний
Случайные процессы
Всего
6
6
0
0
0
0
0
1
4
4
0
0
0
0
0
1
8
8
0
0
0
0
0
1
2
2
0
0
0
0
0
1
8
8
0
0
0
0
0
1
28
час.
28
час.
0 час.
0 час.
0 час.
0 час.
0 час.
0 час.
0
0
0
0
0
0
ИТОГО
60
60
Пояснения:
 см. приложения М, Н [1], а также р. 1.4.3.
2 ТЕМАТИКА И ПЕРЕЧЕНЬ КОНТРОЛЬНЫХ
(САМОСТОЯТЕЛЬНЫХ) РАБОТ, ЗАДАНИЙ И ЗАДАЧ
2.1 Самостоятельная работа по математической статистике
Наблюдаемые значения случайных величин Х , У определяются по правилу: X = = Zi , У = Zj , где индексы i, j определяются номером варианта с помощью табл. 1. Например, для варианта № 10 выбираем клетку в таблице 1 с
22
цифрой 10. Соответствующие индексы i = 1, j = 5 – номера столбца и строки,
проходящей через рассматриваемую клетку.
j
9
8
7
6
5
4
3
2
Таблица 1 – Выбор варианта
i
1
2
3
4
5
6
7
30 29
22 23 24 25 26 27 28
21 20 19 18 17 16
11 12 13 14 15
10 9
8
7
4
5
6
3
2
1
Значения Zi , Zj приведены в таблице 2. Необходимо с помощью пакета
программ “STATISTICA”:
1. Построить облако данных на плоскости Х, У и выполнить графически
группировку наблюдений величин.
2. Составить корреляционную таблицу и вычислить выборочные средние,
дисперсии, асимметрии и эксцессы, коэффициент корреляции случайных величин Х, У с помощью пакета программ “STATISTICA” и методом произведений.
3. Построить гистограммы относительных частот, кумуляты для случайных величин Х, У и с уровнем значимости 0,05 проверить гипотезу о нормальном распределении этих величин.
4. С помощью метода произведений и пакета программ “STATISTICA”
найти выборочное уравнение прямой линии регрессии У на Х, изобразить
линию регрессии на облаке данных и с уровнем значимости 0,05 проверить
гипотезу об отсутствии корреляционной связи между величинами Х, У.
5. Найти выборочное уравнение связи х = ay + bZ7 + cZ8 + dZ9 + e , сравнить эмпирические и расчетные значения функции х. Определить, какие независимые переменные этой связи являются значимыми с уровнем значимости 0,05, найти выборочное уравнение только с этими переменными.
23
Таблица 2 – Статистические данные
Z1
24,82
16,6
28,05
19,31
27,25
19,56
20,45
15,46
20,77
21,95
25,6
28,27
19,7
18,09
13,28
33,17
30,93
27,66
28,21
34,15
26,79
26,31
25,44
32,01
31,43
32,54
31,25
34,97
30,12
38,48
33,34
28,64
32,64
Z2
16,15
33,42
14,47
12,83
23,05
7,28
33,94
15,01
20,1
18,55
17,68
21,2
28,69
8,21
14,92
17,92
28,55
26,99
30,93
23,68
25,77
12,04
14,29
18,23
25,86
29,25
27,31
24,43
23,96
28,3
26,62
32,03
25,54
Z3
41,79
45,39
42,53
37,65
27,59
34,82
30,84
30,58
37,31
29,47
53,67
54,85
35,75
30,48
28,71
60,19
48,22
52,96
39,99
70,26
61,73
41,59
47,74
30,94
69,48
81,55
69,16
67,96
50,6
71,92
66,99
55,27
53,74
Z4
21,6
17,89
18,41
17,73
17,49
15,57
18,9
18,43
23,57
11,31
21,56
12,57
14,44
13,31
12,07
21,54
22,04
18,42
20,66
18,08
18,67
16,89
23,42
20,42
15,7
23,96
20,71
25,58
28,68
25,58
27,3
31,93
19,43
Z5
36,32
42,13
34,8
35,67
36,59
30,89
36,21
36,42
37,59
34,48
40,37
34,19
38,61
35,6
33,51
20,76
16,7
27,65
31,83
32,19
19,63
21,29
24,96
32,05
20,5
31,21
26,04
28,77
32,08
23,08
26,64
31,08
35,65
24
Z6
21,47
29,93
24,23
20,52
15,82
18,9
24,13
18,12
25,67
31,75
25,47
24,14
19,85
18,53
16,41
29,95
38,45
31,41
29,54
26,01
34,61
28,64
22,32
30,07
32,4
37,03
35,18
28,78
28,71
24,67
21,32
34,03
23,74
Z7
44,91
45,48
55,06
53,39
46,96
27,11
29,24
31,25
35,26
25,3
32,7
57,62
18,02
19,46
41,89
50,27
61,9
32,38
31,64
50,78
40,43
46,61
23,01
43,17
37,49
55,72
40,14
49,12
36,74
32,09
23,93
36,02
17,85
Z8
18,67
32,85
35,16
33,62
23,79
18,96
24,11
19,41
27,39
22,14
29,71
32,24
33,67
23,43
32,51
21,34
22,24
20,02
16,46
27,29
18,31
18,04
22,9
16,82
20,21
29,16
20,51
24,9
24,39
25,79
17,78
23,66
23,12
Z9
20,28
18,76
16,17
18,78
16,32
18,37
16,48
17,57
13,21
16,9
17,92
10,63
11,56
15,32
13,84
42,73
26,07
11,45
29,24
23,93
37,17
30,55
21,99
39,68
36,66
51,35
31,58
34,92
21,89
18,76
39,84
29,23
24,36
Продолжение таблицы 2
Z1
22,87
28,94
34,9
32,2
34,54
22,28
40,06
24,72
27,85
34,67
26,77
37,41
30,77
32,21
26,9
28,97
29,96
28,03
32,5
28,67
32,97
29,1
35,62
26,97
34,78
27,97
27
28,63
27,05
32,19
31,17
25,57
17,93
Z2
20,18
30,72
22,46
30,77
28,88
16,34
17,01
29,77
18,64
18,71
24,29
37,33
19,9
24,81
19,04
23,97
15,46
15,21
24,32
16,6
25,84
16,56
20,28
26,55
26,83
25
18,12
28,09
27,97
22,13
13,66
14,96
16,92
Z3
26,67
62,33
48,67
71,91
35,67
49,72
72,94
46,69
55,97
62,15
52,72
83,81
29,83
49,88
46,02
44,86
67,43
29,18
36,14
20,35
50,7
54,01
55,15
40,13
27,58
59,34
18,18
60,99
42,98
76,33
72,15
27,73
24,07
Z4
18,17
20,67
29,56
20,54
21,38
16,14
30,66
22,69
11,28
16,68
17,18
23,92
20,44
16,81
17
22,23
20,06
15,84
23
24,02
28,05
15,49
22,85
9,2
24,3
18,31
16,85
22,02
20,78
25,88
16,97
20,98
25,8
Z5
22,94
38,82
32,27
33,65
31,79
21,82
26,52
32,67
26,75
32,01
28,25
38,12
34,46
29,89
13,28
33,16
33,72
18,91
29,8
25,86
31,86
20,18
30,38
28,38
28,53
27,3
33,01
25,93
23,65
36,01
33,15
34,25
30,84
25
Z6
21,46
31,17
29,95
41,91
30,66
27,1
30,25
28,14
20,05
29,24
36,81
35,28
25,73
23,83
22,72
32,64
32
30,78
35,65
21,13
36,09
31,13
32,06
32,69
31,84
20,07
25,2
26,24
30,97
23,95
26,95
34,9
27,05
Z7
36,29
41,5
38,19
28,62
66,97
41,56
67,33
48,01
26,91
43,37
45,36
57,47
41,51
15,5
24,51
31,23
35,33
29,35
34,94
31,62
58,02
27,67
22,49
32,91
41,19
39,56
38,23
57,79
58,97
63,53
38,74
44,15
41,28
Z8
15,35
19
19,45
22,11
23,48
17,92
17,06
20,8
18,61
18,34
21,89
29,01
21,84
21,81
18,65
17,81
26,04
18,06
21,59
17,93
22,67
18,71
29,69
22,99
21,56
25,4
21,7
23,55
18,54
26,14
21,36
22,03
16,68
Z9
21,16
37,62
25,11
28,74
30,04
22,99
34,48
18,45
26,39
36,38
23,76
48,8
25,04
25,31
27,06
24,87
21,17
30,22
40,48
14,81
27,98
40,35
26,72
23,89
16,61
10,09
11,27
29,95
40,03
19,83
39,13
14,25
31,64
Продолжение таблицы 2
Z1
Z2
Z3
Z4
27,73 21,48 66,77 25,5
35,05 23,22 52,39 32,85
27,38 25,18 70,58 25,45
31,7 26,76 59,88 22,09
28,43 19,59 54,44 11,25
30,85 18,87 41,31 25,3
32,22 23,13 36,84 21,44
33,96 21,92 66,23 17,12
30,81 21,05 61,97 20,03
31,35 22,66 52,32 15,05
32,32 21,79 63,24 22,79
26,98 23,15 34,08 28,46
33,02 16,36 47,65 19,37
35,71 22,24 80,98 17,11
31,76 15,92 69,93 20,6
31,27 23,26 47,82 22,7
27,43 30,1 59,33 26,86
24,73 18,56 29,82 12,85
33,76 14,85 38,82 21,94
29,59 30,56 56,89 28,96
29,46 26,6 80,41 15,53
39,89 34,55 71,77 16,44
27,75 26,36 46,16 18,02
26,8 20,52 38,9 24,66
31,5 27,8 70,25 24,49
39,09 27,61 41,65 31,17
30,65 16,76 69,96 25,86
31,44 26,9 72,32 15,38
29,35 19,07 33,83 26,01
23,4 23,14 53,51 22,85
28,49 15,35 32,62 22,16
30,97 20,25 59,31 20,69
39,5 28,42 75,67 22,28
24,88 55,51 15,54 27,62
Z5
34,66
43,38
27,96
25,66
23,95
26,81
27,39
30,32
34,65
29,67
35,97
36,78
27,02
35,56
19,8
18,15
29,6
22,93
32,35
29,3
35,22
39,42
28,83
26,82
36,12
41,43
32,92
33,91
37,01
26,54
24,64
22,68
36,07
29,05
26
Z6
32,19
34,19
36,38
28,58
21,62
29,8
23,24
28,84
30,18
27,5
40,36
33,25
20,33
35,59
25,38
19,52
26,49
32,49
25,25
30,33
30,43
37,59
22,73
36,21
35,47
35,5
38,5
35,89
33,71
21,92
35,98
33,18
24,65
54,94
Z7
39,54
35,6
44,08
30,05
33,71
45,37
46,92
59,08
45,67
39,26
33,36
36,47
39,66
47,63
42,51
18,32
23,73
38,32
45,85
38,59
28,75
41,04
20,05
47,95
29,1
40,66
42,65
28,13
45,63
47,02
40,32
43,88
72,47
18,65
Z8
18,99
18,42
24,06
22,82
21,27
19,56
20,84
23,47
15,05
19,69
20,69
15,03
17,99
24,77
23,7
16,84
30,04
21,6
20,02
26,82
21,87
23,67
21,76
21,19
20,04
25,17
16,03
22,06
24,44
17,97
15,27
24,31
23,08
16,88
Z9
37,07
39,75
12,51
40,04
11,4
30,62
27,34
18,04
29,29
29,2
30,6
16,03
23,3
28,02
17,99
29,12
37,86
11,91
22,4
40,43
17,02
34,89
32,24
10,97
32,7
27,59
37,32
31,97
32,26
18,96
18,82
35,23
25,18
29,79
2.2 Самостоятельная работа по дисперсионному анализу
Задание 1. С помощью пакета программ “STATISTICA” проверить при
уровне значимости 0.05 гипотезу о влиянии рекламы на прибыль предприятия, предварительно проверив однородность дисперсий. Какая часть изменения прибыли обусловлена рекламой?
Вариант 1
Тип рекламы
A
B
C
D
1991
215
215
222
242
1992
224
222
237
242
Тип рекламы
A
B
C
D
1992
207.33
239.27
217.80
256.51
1993
221.83
216.28
222.71
243.92
1993
222
207
221
238
Годы
1994
221
214
233
250
1995
206
224
229
239
1996
207
217
232
1996
221.83
209.76
216.37
1997
221.60
235.13
1995
240.17
218.61
235.54
1996
222.34
215.31
1997
231 95
224 08
233 51
1998
215 19
224 87
1996
222.19
1997
217.20
Вариант 2
Годы
1994
1995
241.34
223.13
220.53
207.15
225.32
193.85
234.56
244.94
Вариант 3
Тип рекламы
A
B
C
D
Годы
1991
232.35
225.61
248.46
224.88
1992
230.84
222.26
229.51
231.90
1993
225.14
220.40
214.23
238.82
1994
216.20
235.20
215.34
243.59
Вариант 4
Тип рекламы
A
B
C
D
Годы
1993
224 85
215 31
232 26
247 09
1994
238 64
205 01
240 63
238 20
1995
222 86
223 35
226 25
238 91
1996
221 81
189 37
215 57
235 53
Вариант 5
Тип рекламы
A
Годы
1992
215.19
1993
224.97
1994
235.58
27
1995
211.15
B
C
D
213.61
212.35
215.42
236.47
214.91
208.40
238.55
221.44
227.59
212.78
227.28
229.52
224.66
230.34
229.00
1995
228.08
223.42
219.37
1996
213.07
234.16
1994
235.75
231.84
232.74
1995
229.09
240.47
Вариант 6
Тип рекламы
A
B
C
D
Годы
1991
221.82
205.38
248.91
244.76
1992
233.26
226.84
221.06
239.35
1993
225.66
218.96
220.78
233.18
1994
225.59
216.52
251.27
243.94
Вариант 7
Тип рекламы
A
B
C
D
Годы
1990
228.08
223.42
219.37
227.00
1991
213.07
234.16
217.77
225.29
1992
201.07
205.96
218.48
243.25
1993
232.94
234.04
234.35
240.81
Вариант 8
Тип рекламы
Годы
1991
1992
1993
1994
1995
1996
A
B
C
D
235.75
231.84
232.74
241.19
229.09
240.47
225.62
225.51
215.30
225.63
252.79
248.01
220.50
214.86
244.56
236.42
248.46
229.73
234.89
218.27
243.61
1996
242 61
219 59
214 55
1997
229 80
221 27
1997
236.38
224.19
234.87
1998
235.37
210.96
Вариант 9
Тип рекламы
A
B
C
D
Годы
1992
220 15
201 31
218 54
242 49
1993
235 60
226 23
219 72
230 79
1994
234 69
208 01
236 49
252 28
1995
213 86
212 02
230 72
258 23
1993
242.61
203.74
220.63
1994
229.80
242.10
210.11
Годы
1995
1996
218.36
223.89
220.57
229.62
223.19
224.36
Вариант 10
Тип рекламы
A
B
C
28
D
234.83
243.85
244.86
244.71
Тип рекламы
A
B
C
D
1992
224.19
212.19
234.87
243.65
1993
210.96
229.79
242.22
233.64
Годы
1994
1995
233.70
220.25
235.49
220.67
237.09
223.85
244.29
249.91
Вариант 11
1996
215.96
212.68
224.41
1997
205.11
226.58
Вариант 12
Тип рекламы
A
B
C
D
1991
232.63
205.38
237.68
243.08
1992
220.86
207.78
227.69
241.23
Годы
1993
1994
216.70
216.35
228.74
232.09
224.84
233.95
243.86
219.11
1995
204.55
219.36
218.23
1996
220.24
228.82
Вариант 13
Тип рекламы
A
B
C
D
Годы
1990
215.96
219.11
227.69
241.23
1991
205.11
230.07
224.84
243.86
1992
232.63
224.70
233.95
219.11
1993
220.86
213.32
218.23
240.53
1994
216.70
227.08
221.92
1995
216.35
228.29
1995
228 29
226 58
234 01
1996
219 54
215 63
1996
228.74
230.07
224.84
1997
232.09
224.70
Вариант 14
Тип рекламы
A
B
C
D
Годы
1991
230 07
229 79
242 22
233 64
1992
224 70
235 49
237 09
244 29
1993
213 32
220 67
223 85
249 91
1994
227 08
212 68
224 41
244 29
1992
204.55
225.89
234.59
250.22
1993
220.24
221.60
233.97
246.63
Годы
1994
1995
205.38
207.78
231.94
219.11
237.68
227.69
243.08
241.23
Вариант 15
Тип рекламы
A
B
C
D
29
Вариант 16
Тип рекламы
A
B
C
D
Годы
1993
219.36
213.32
218.23
240.53
1994
228.82
227.08
221.92
234.71
1995
241.84
228.29
229.96
241.64
1996
225.77
219.54
235.59
223.11
1997
232.40
220.41
231.93
249.54
1998
211.66
216.58
229.57
230.98
1992
214.64
234.41
221.09
243.94
1993
214.67
216.47
229.87
239.63
Годы
1994
1995
222.74
227.60
224.85
215.05
238.87
225.70
244.09
265.25
1996
212.36
217.21
228.47
234.05
1997
242.42
233.43
1991
242.42
225.77
217.21
213.89
1992
217.98
232.40
233.43
219.45
Годы
1993
1994
212.19
229.33
211.66
214.64
216.77
235.69
241.32
225.38
1995
227.39
214.67
219.77
1996
214.93
222.74
1994
240.23
231.19
1995
222.63
214.54
1995
232.91
237.58
230.99
1996
220.15
230.13
Вариант 17
Тип рекламы
A
B
C
D
Вариант 18
Тип рекламы
A
B
C
D
Вариант 19
Тип рекламы
A
B
C
D
Годы
1990
239.52
231.64
234.14
241.26
1991
231.84
229.17
236.16
247.46
1992
225.21
224.81
234.24
239.55
1993
233.43
221.88
236.58
240.08
Вариант 20
Тип рекламы
A
B
C
D
Годы
1991
240.23
231.19
237.31
261.66
1992
222.63
214.54
246.79
241.93
1993
208.66
221.37
229.22
232.66
1994
219.18
225.85
227.59
229.58
Вариант 21
Тип рекламы
A
1992
21589.78
1993
22462.79
Годы
1994
1995
22224.45
22139.56
30
1996
20644.05
1997
20732.94
B
C
D
21529.21
22235.77
24277.80
22217.05
23741.13
24276.62
20743.64
22139.17
23834.02
21484.79
23331.27
25067.19
22427.30
22952.21
21780.19
Вариант 22
Тип рекламы
A
B
C
D
Годы
1993
22182
22270
22407
24392
1994
24133
22532
24170
23456
1995
22313
19384
23816
24494
1996
22183
21637
22347
22861
1992
22159
20975
22638
22638
1993
21339
23513
23347
23347
Годы
1994
1995
23927
21627
23235
23083
23207
24846
23207
24846
1997
22159
22237
23327
1998
21339
22122
1996
22052
22514
22951
22951
1997
20714
21619
Вариант 23
Тип рекламы
A
B
C
D
Вариант 24
Тип рекламы
A
B
C
D
Годы
1991
22514 21
22225 98
22951 13
23190 09
1992
21619 72
22039 69
21423 50
23882 36
1993
24016 72
23519 86
21534 19
24359 34
1994
22233 65
21861 24
23554 48
25609 16
1995
22485 26
21531 15
23225 51
1996
23863 57
20501 24
Вариант 25
Тип рекламы
A
B
C
D
Годы
1990
10759
11243
11904
11336
1991
11248
11283
11315
12584
1992
11778
10617
11852
12582
1993
10557
10889
11268
12241
1994
11109
10416
11394
11900
1996
10860
10363
11080
12930
1995
11490
11364
10268
11371
1996
10917
11516
11341
Вариант 26
Тип рекламы
A
B
C
D
Годы
1991
11780
10114
10771
12158
1992
11734
10617
10419
13292
1993
10692
10745
11379
12394
31
1994
12130
11072
11476
11831
Вариант 27
Тип рекламы
A
B
C
D
Годы
1992
10638
11091
11346
11371
1993
11233
11663
11218
11739
1994
11449
11283
12287
11513
1995
11263
11279
11184
11719
1996
11453
11403
11315
1997
11313
10653
1997
11279
10826
12563
1998
11403
11170
1996
11787
11007
11591
10065
1997
11454
11780
12023
11311
1995
12130
10979
10727
1996
11490
11063
Вариант 28
Тип рекламы
A
B
C
D
Годы
1993
11313
11476
11456
11346
1994
11091
10268
12445
12237
1995
11663
11341
11052
11967
1996
11283
10948
11039
11659
Вариант 29
Тип рекламы
A
B
C
D
Годы
1992
11403
10764
11170
11281
1993
10653
11024
11708
10743
1994
10053
12423
10297
11486
1995
11647
10913
11702
12180
Вариант 30
Тип рекламы
A
B
C
D
Годы
1991
11007
10065
10927
12124
1992
11780
11311
10986
11539
1993
11734
10400
11824
12613
1994
10692
10601
11535
12911
Задание 2. С помощью пакета программ “STATISTICA” проверить при
уровне значимости 0.05 гипотезы о влиянии каждого фактора А, В. Определить коэффициенты детерминации факторов.
Вариант 1
A1
A2
A3
B1
2.335
3.77
2.974
B2
3.071
3.497
3.042
B3
3.719
5.38
5.233
B4
4.654
4.476
5.238
B1
B2
B3
B4
Вариант 1
32
A1
A2
A3
2.335
3.77
2.974
3.071
3.497
3.042
3.719
5.38
5.233
4.654
4.476
5.238
A1
A2
A3
B1
4.76
5.911
6.966
B2
5.449
6.13
6.653
B3
5.733
6.425
7.068
B4
7.057
6.382
7.153
A1
A2
A3
B1
5.693
5.768
7.259
B2
6.437
6.716
7.545
B3
6.066
8.049
7.989
B4
6.374
8.312
8.631
A1
A2
A3
B1
6.77
7.832
8.76
B2
7.073
7.974
9.158
B3
7.624
8.415
9.274
B4
8.147
9.075
9.533
A1
A2
A3
B1
2.609
4.191
6.067
B2
3.055
4.452
5.446
B3
5.013
5.683
3.665
B4
4.53
4.647
5.621
A1
A2
A3
B1
3.871
5.68
6.432
B2
3.389
5.408
6.397
B3
3.858
4.998
6.057
B4
4.723
5.628
7.201
A1
A2
A3
B1
6.417
6.087
6.498
B2
4.323
5.186
5.695
B3
4.567
7.393
8.256
B4
6.608
6.151
7.669
A1
A2
A3
B1
5.661
7.845
6.774
B2
6.629
6.9
7.106
B3
7.079
7.733
7.795
B4
5.453
7.232
7.938
Вариант 3
Вариант 4
Вариант 5
Вариант 6
Вариант 7
Вариант 8
Вариант 9
33
Вариант 10
A1
A2
A3
B1
6.014
7.305
8.764
B2
7.907
7.514
8.51
B3
6.628
8.079
9.255
B4
7.882
8.219
9.773
B1
3.676
4.969
6.241
B2
4.838
5.807
6.234
B3
3.876
5.919
6.364
B4
4.223
7.903
5.888
B1
3.836
5.978
7.098
B2
5.468
6.131
6.954
B3
5.784
6.724
7.346
B4
5.593
7.264
8.136
B1
4.36
5.622
7.278
B2
6.763
6.062
7.508
B3
6.001
8.202
8.831
B4
3.935
7.596
7.603
B1
5.082
5.622
7.278
B2
6.763
6.062
7.508
B3
6.001
8.202
8.831
B4
3.935
7.596
7.603
B1
5.265
9.656
9.16
B2
6.998
7.239
8.084
B3
6.032
7.552
10.504
B4
8.851
9.684
9.045
B1
7.566
7.952
9.562
B2
7.098
8.948
9.723
B3
8.521
11.464
10.42
B4
8.484
11.139
12.53
B1
2.887
6.917
5.218
B2
3.46
5.433
6.804
B3
6.206
6.272
5.767
B4
5.975
7.404
8.859
Вариант 11
A1
A2
A3
Вариант 12
A1
A2
A3
Вариант 13
A1
A2
A3
Вариант 14
A1
A2
A3
Вариант 15
A1
A2
A3
Вариант 16
A1
A2
A3
Вариант 17
A1
A2
A3
34
Вариант 18
A1
A2
A3
B1
7.278
5.829
7.652
B2
4.691
4.144
9.663
B3
6.00
5.517
6.699
B4
7.25
8.567
7.994
B1
8.304
8.155
9.926
B2
7.532
6.605
10.092
B3
6.213
8.469
9.143
B4
6.939
7.14
10.383
B1
8.208
8.262
10.516
B2
7.943
8.593
7.808
B3
7.453
10.689
10.31
B4
8.69
11.233
11.254
B1
2.976
3.769
4.541
B2
3.938
4.407
4.334
B3
2.776
4.319
4.264
B4
2.923
6.103
3.588
B1
3.136
4.787
5.398
B2
4.568
4.731
5.054
B3
4.684
5.124
5.246
B4
4.293
5.464
5.836
B1
3.66
4.422
5.578
B2
5.863
4.662
5.608
B3
4.901
6.602
6.731
B4
2.635
5.796
5.303
B1
4.382
6.718
8.127
B2
7.149
5.913
7.558
B3
6.846
6.178
6.836
B4
6.202
6.889
7.282
B1
4.565
8.456
7.46
B2
6.098
5.839
6.184
B3
4.932
5.952
8.404
B4
7.551
7.884
6.745
Вариант 19
A1
A2
A3
Вариант 20
A1
A2
A3
Вариант 21
A1
A2
A3
Вариант 22
A1
A2
A3
Вариант 23
A1
A2
A3
Вариант 24
A1
A2
A3
Вариант 25
A1
A2
A3
35
Вариант 26
A1
A2
A3
B1
6.866
6.752
7.862
B2
6.198
7.548
7.823
B3
7.421
9.864
8.32
B4
7.184
9.339
10.23
B1
2.187
5.717
3.518
B2
2.56
4.033
4.904
B3
5.106
4.672
3.667
B4
4.675
5.604
6.559
Вариант 27
A1
A2
A3
Задание 3.
1. Смоделировать выборку 80 значений случайной величины X, имеющей
равномерное распределение на промежутке [0, 4], проверив гипотезу о форме
распределения.
2. Смоделировать выборку 100 значений случайной величины X, распределенной нормально с параметрами (20, 10), проверив гипотезу о форме распределения.
3. Смоделировать выборку 60 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 40, р = 0.1, проверив гипотезу о форме распределения.
4. Смоделировать выборку 90 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 40, р = 0.3, проверив гипотезу о форме распределения.
5. Смоделировать выборку 80 значений случайной величины X, имеющей
равномерное распределение на промежутке [–3, 2], проверив гипотезу о форме распределения.
6. Смоделировать выборку 80 значений случайной величины X, имеющей
равномерное распределение на промежутке [2, 4], проверив гипотезу о форме
распределения.
7. Смоделировать выборку 100 значений случайной величины X, распределенной нормально с параметрами (20, 15), проверив гипотезу о форме распределения.
8. Смоделировать выборку 60 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 30, р = 0.1, проверив гипотезу о форме распределения.
36
9. Смоделировать выборку 90 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 30, р = 0.3, проверив гипотезу о форме распределения.
10. Смоделировать выборку 80 значений случайной величины X, имеющей равномерное распределение на промежутке [–1, 2], проверив гипотезу о
форме распределения.
11. Смоделировать выборку 80 значений случайной величины X, имеющей равномерное распределение на промежутке [1, 4], проверив гипотезу о
форме распределения.
12. Смоделировать выборку 100 значений случайной величины X, распределенной нормально с параметрами (20, 5), проверив гипотезу о форме распределения.
13. Смоделировать выборку 60 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 60, р = 0.1, проверив
гипотезу о форме распределения.
14. Смоделировать выборку 90 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 20, р = 0.3, проверив
гипотезу о форме распределения.
15. Смоделировать выборку 80 значений случайной величины X, имеющей равномерное распределение на промежутке [–3, 0], проверив гипотезу о
форме распределения.
16. Смоделировать выборку 80 значений случайной величины X, имеющей равномерное распределение на промежутке [–2, 4], проверив гипотезу о
форме распределения.
17. Смоделировать выборку 100 значений случайной величины X, распределенной нормально с параметрами (10, 5), проверив гипотезу о форме распределения.
18. Смоделировать выборку 60 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 20, р = 0.3, проверив
гипотезу о форме распределения.
19. Смоделировать выборку 90 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 25, р = 0.4, проверив
гипотезу о форме распределения.
20. Смоделировать выборку 80 значений случайной величины X, имеющей равномерное распределение на промежутке [–2, 3], проверив гипотезу о
форме распределения.
37
21. Смоделировать выборку 80 значений случайной величины X, имеющей равномерное распределение на промежутке [–2, 3], проверив гипотезу о
форме распределения.
22. Смоделировать выборку 100 значений случайной величины X, распределенной нормально с параметрами (15, 8), проверив гипотезу о форме распределения.
23. Смоделировать выборку 60 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 15, р = 0.2, проверив
гипотезу о форме распределения.
24. Смоделировать выборку 90 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 25, р = 0.2, проверив
гипотезу о форме распределения.
25. Смоделировать выборку 80 значений случайной величины X, имеющей равномерное распределение на промежутке [–7, 0], проверив гипотезу о
форме распределения.
26. Смоделировать выборку 80 значений случайной величины X, имеющей равномерное распределение на промежутке [–2, 5], проверив гипотезу о
форме распределения.
27. Смоделировать выборку 100 значений случайной величины X, распределенной нормально с параметрами (12, 5), проверив гипотезу о форме распределения.
28. Смоделировать выборку 60 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 35, р = 0.2, проверив
гипотезу о форме распределения.
29. Смоделировать выборку 90 значений случайной величины X, распределенной по биномиальному закону с параметрами n = 45, р = 0.4, проверив
гипотезу о форме распределения.
30. Смоделировать выборку 80 значений случайной величины X, имеющей равномерное распределение на промежутке [–3, 3], проверив гипотезу о
форме распределения.
38
3 АТТЕСТАЦИОННЫЕ ТЕСТЫ ДЛЯ ПРОМЕЖУТОЧНОГО КОНТРОЛЯ
ЗНАНИЙ
Тест по теории вероятностей и математической статистике
ВАРИАНТ ЗАДАНИЯ
ВАРИАНТ ОТВЕТА
1.
2.
3.
4.
5.
6.
1 АКСИОМАТИКА ТЕОРИИ ВЕРОЯТНОСТЕЙ
1.1 Комбинаторика
1.1.1 Сочетания и размещения
В кондитерском магазине продаются 4 вида пирожных.
1) 4
Тогда 3 вида пирожных можно выбрать …….. способами.
3) 12
В каждом задании даны 4 варианта ответов. Тогда в двух
1) 4
заданиях можно выбрать…… разных пар ответов.
3) 16
В кондитерском магазине продаются 4 вида пирожных.
1) 4
Тогда 3 порции пирожных можно выбрать …….. способа3) 12
ми.
Флаг страны состоит из 3 разноцветных горизонтальных
1) 120
полос. Такой флаг могут иметь……… стран, если исполь3) 620
зуются 7 цветов спектра и белый цвет.
Код компьютера состоит из 3 цифр от 0 до 9 каждая. Та- 1) 24
ких кодов существует ровно
3) 720
«Соответствие между понятием комбинаторики и выражением»
2) 6
4) 20
2) 8
4) 24
2) 6
4) 20
2) 336
4) 5040
2) 120
4) 1000
m
сочетания с повторением С n
nm
n!
m!( n  m )!
размещения Anm
m
n!
( n  m )!
( n  m  1)!
сочетания Сnm
m! ( n  1)!
1.1.2 Распределение предметов на группы
7. Два грибника собрали 5 белых грибов и 6 подберезовиков.
1) 6
Тогда эти грибы можно разделить……. способами.
3) 24
8. Два грибника собрали 5 белых грибов и 6 подберезовиков.
1) 6
Тогда эти грибы можно разделить……. способами, чтобы 3) 24
каждому грибнику досталось не менее 2 грибов каждого
вида.
9. Четыре рыбака выловили 5 щук. Тогда они могут разде1) 5
лить улов между собой…. способами.
3) 56
1.1.3 Перестановки
10. Рассматриваются перестановки букв слова «свет». Тогда
1) 12
получится…… разных слов.
3) 36
11. Рассматриваются перестановки букв слова «решение». То- 1) 840
гда получится…… разных слов.
3) 120
12. Рассматриваются перестановки букв слова «ответ», при
1) 12
которых гласные не стоят рядом. Тогда получится……
3) 36
разных слов.
13. Рассматриваются перестановки букв слова «гром», при
1) 9
которых ни одна из букв не остается на месте. Тогда по3) 18
лучится…… разных слов.
размещения с повторением А n
39
2) 12
4) 42
2) 12
4) 42
2) 20
4) 120
2) 24
4) 60
2) 720
4) 24
2) 24
4) 72
2) 12
4) 24
1.2 Случайное событие и вероятность
1.2.1 Определение вероятности
14. На квадрат наудачу брошена точка. Тогда вероятность
1) /2
2) /4
попадания точки в круг, вписанный в квадрат, равна
3) /8
4) (4 – )/4
15. В каждом задании даны 4 варианта ответов. Тогда веро1)1/4
2) 1/8
ятность того, что случайные ответы в трех заданиях
3) 1/64
4) 1/24
окажутся верными, равна
16. Вероятность правильного ответа в одном задании – ¼ .
1) 3/4
2) 9/64
Тогда вероятность правильного ответа хотя бы в одном из 3) 27/64
4) 37/64
трех независимых заданий равна
17. Вероятность правильного ответа в одном задании – ¼ .
1) 3/4
2) 9/64
Тогда вероятность правильных ответов в двух из трех не- 3) 27/64
4) 37/64
зависимых заданий равна
18. Выбирают наудачу число от 1 до 100. Найдите вероят1) 0,9
2) 0,81
ность того, что в этом числе не окажется цифры 3
3) 0,91
4) 0,86
19. В группе 16 студентов. Из них 8 студентов сдали тест по
1) 1/16
2) 1/8
математике, 9 – по истории, а 2 – по обоим предметам.
3) 3/16
4) 1/4
Тогда вероятность того, что наудачу выбранный студент
не сдал оба теста, равна
20. В студенческой группе 12 человек, среди которых 8 отлич- 1)5/8
2) 7/12
ников. Наудачу отобраны 7 студентов. Тогда вероятность 3)7/99
4) 14/33
того, что среди отобранных студентов 5 отличников,
равна
21. На плоскость с нанесенной сеткой квадратов со стороной 1) 0,2
2) 0,4
10 см наудачу брошена монета радиуса 2 см. Тогда вероят- 3) 0,36
4) 0,16
ность того, что монета не пересечет ни одной из сторон
квадрата, равна
22. На полке случайным образом расставлены 10 книг. Тогда
1) 0,2
2) 2/9
вероятность того, что два тома «Теории вероятностей»
3) 0,1
4) 0,16
окажутся рядом, равна
23. «Соответствие между определением и выражением вероятности»
аксиоматическое
р(А) = m/n
статистическое
р(А) = длина l / длина L
классическое
р(А) = относительная частота появления события
р(е)
геометрическое
р(А) =

еА
1.2.2 Виды случайных событий
24. «…………. двух событий А и В называется событие, состоящее в появлении события А, или
события В, или обоих событий».
25. «…………нескольких событий называется событие, состоящее в появлении всех этих событий».
26. «Два события называются …………… , если появление одного из них исключает появление
другого в одном и том же испытании».
27. «Два события называются …………., если появление одного из них не влияет на вероятность
появления другого.
1.2.3 Теоремы сложения и умножения вероятностей
28. «Соответствие между типом событий и формулой сложения вероятностей»
противоположные
р(А + В) = р(А) + р(В) – р(АВ)
несовместные
р(А + В) = 1
совместные
р(А + В) = 1  р ( А ) р ( В )
независимые
р(А + В) = р(А) + р(В)
40
29. «Соответствие между типом событий и формулой умножения вероятностей»
зависимые
р(АВ) = 0
несовместные
р(АВ) = р(А)  р(В)
независимые
р(АВC) = р(А)  р(В)  р(C )
независимые в совокупности
р(АВ) = р(А)  р(В А)
30. Стрелок стреляет в мишень. Вероятность выбить 10 оч1) 0,18
2) 0,49
ков равна 0,3, а вероятность выбить 9 очков равна 0,6. То- 3) 0,63
4) 0,9
гда вероятность выбить не менее 9 очков равна
31. Вероятность того, что початки кукурузы имеют 12 рядов, 1) 0,37
2) 0,49
равна 0,49, 14 рядов – 0,37, от 16 до 18 рядов – 0,14. Какова 3) 0,63
4) 0,86
вероятность того, что наудачу выбранный початок будет
иметь 12 или 14 рядов
1.2.4 Следствия из теорем
32. В потоке ПМИ учатся 24 студента в гр. МПИ-1 и 26 студентов в гр. ПМИ-2. Экзамен по
ТВиМС в этих группах с первого раза сдали 18 и 12 студентов соответственно. Соответствие
между условными вероятностями и значениями, если события: А – студент ПМИ сдал экзамен, В1 – студент из первой гр., В2 – студент из второй гр.
0,4
р( А В1 )
р( А В2 )
0,6
р( В1 А)
0,75
6/13
р( В2 А)
33. Три стрелка производят по одному выстрелу. Вероятности
попаданий стрелков в цель соответственно равны 0,1 0,2 и
0,3. В цель попали только 2 стрелка. Тогда вероятность
того, что первый стрелок промахнулся, равна
34. Три стрелка производят по одному выстрелу. Вероятности
попаданий стрелков в цель соответственно равны 0,1 0,2 и
0,3. В цель попал только 1 стрелок. Тогда вероятность того, что это первый стрелок, равна
35. Рабочий обслуживает два станка, на которых обрабатываются детали и складываются в один ящик. Производительность первого станка вдвое больше, чем второго, а
вероятности брака на станках равны 0,4 и 0,1 соответственно. Тогда вероятность качественной детали в ящике
равна
36. Летом вероятность дождливого дня равна 0,2. Для некоторой футбольной команды вероятность выиграть в ясный день равна 0,7, но зато в дождливый день эта вероятность равна лишь 0,4. Известно, что команда выиграла
матч. Тогда вероятность того, что в этот день шёл
дождь, равна
1.2.5 Повторение испытаний
37. Вероятность того, что в семье четверо детей и только
один мальчик, равна
38. Вероятность попадания стрелком в цель равна 0,7. Сделано 25 выстрелов. Тогда наивероятнейшее число попаданий
в цель равно
39. Игральная кость бросается 9 раз подряд. Тогда наиболее
вероятное количество выпадений числа очков, кратного
трём, равно
41
1) 0,054
3)27/46
2) 0,024
4) 19/46
1) 0,056
3)126/398
2) 0,044
4) 28/199
1) 0,3
3) 0,6
2) 0,5
4) 0,7
1) 0,125
3) 0,08
2) 0,14
4) 0,64
1) 1/8
3) 1/4
1) 16
3) 18
2) 1/6
4) 1/2
2) 17
4) 19
1) 3
3) 4
2) 2
4) 5
40. Из орудия производится стрельба по цели до первого попа- 1) 0,064
2) 0,096
дания. Вероятность попадания в цель р = 0,6. Какова веро- 3) 0,144
4) 0,216
ятность того, что попадание произойдет при третьем
выстреле
2 СЛУЧАЙНАЯ ВЕЛИЧИНА, РАСПРЕДЕЛЕНИЕ, ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ
2.1 Закон распределения
2.1.1 Дискретная случайная величина
41. «…………………….…..случайная величина принимает отдельные, изолированные значения».
42. « ……… ……………. случайной величины называется соответствие между возможными значениями и их вероятностями».
43. «Сумма вероятностей всех возможных значений случайной величины равна …….».
44. «Соответствие между законами распределения и вероятностями
биномиальный
k exp(–)/k!
пуассоновский
p q(n – 1)
геометрический
CkK Cn – kN – K / CnN
гипергеометрический
Ckn pk q(n – k)
45. «Монета подбрасывается 5 раз. Тогда вероятности выпадения орла 0, 1 и 2 раза соответственно равны……………..».
46. «Пуассоновское распределение получается путем предельного перехода в…………..… распределении».
2.1.2 Непрерывная случайная величина
47. « …………… случайная величина принимает все значения из некоторого промежутка».
48. « ………………….- это случайная величина, равномерно распределенная на интервале (0, 1)».
49.
«Соответствие между числовой характеристикой и формулой, в которой f(x) –
плотность распределения»
х
х , при котором

f (t )dt 

1
2
математическое ожидание

 xf ( x)dx
дисперсия

локальный максимум f(x)
медиана

(x  M )
2
f ( x ) dx
мода

50. «Соответствие между законом распределения и плотностью»
нормальный
f(x) = 1/(b – a)
при x  (a , b)
«хи квадрат»
f(x) = exp(–(x – m)2/(22)) /  2 
равномерный
f(x) =  exp(–x) при x > 0
x k / 21 exp(  x / 2 )
показательный
f(x) =
при x > 0
2 k / 2 Г( k/2)
51. «Соответствие между законом распределения и математическим ожиданием»
нормальный
1/
нормированный
(a + b)/2
равномерный
m
показательный
0
52. «Функция …………..является неубывающей, значения которой заключены в пределах
от ….. до ……».
42
53. «Соответствие между функцией и плотностью распределения»
F(x)
f(x)
x
F(x)
 f ( t )dt

b
 f ( x ) dx
F(b) = 1 ; F(a) = 0
a
f(x) = 0 при х  [a, b]
2.1.3 Поток случайных событий
54. «Случайным ………… называется последовательность событий, которые наступают в случайные моменты времени».
55. «Среднее число случайных событий, которые появляются в единицу времени, называется
………… случайного потока».
56. «Вероятностные характеристики ………………. случайного потока не зависят от момента
времени».
57. «Вероятность появления более одного события за малый промежуток времени для ……………
случайного потока событий много меньше вероятности появления одного события».
58. «……………называется поток событий, который обладает свойствами стационарности, отсутствия последействия и ординарности».
59. «Среднее число вызовов, поступающих на АТС за 1 мин, равно 5. Тогда вероятность того, что
за 2 мин поступят 5 вызовов, больше соответствующей вероятности для 4 вызовов в
……раза».
2.2 Числовые характеристики
2.2.1 Математическое ожидание, теоретические моменты
60. «В случае………………случайных величин M(X Y) = M(X) M(Y)»
F(b) – F(a)
61. «………….. моментом k-го порядка величины Х называется математическое ожидание величины Хк ».
62. «……………моментом k -го порядка величины Х называется математическое ожидание величины [Х – М(Х)]к ».
63.
«Соответствие между числовой характеристикой и формулой»
математическое ожидание
3 / 3
дисперсия
4 / 4 – 3
асимметрия
2 (центральный момент 2-го порядка)
эксцесс
1 (начальный момент 1-го порядка)
64. «Несобственный интеграл от ………….. распределения с бесконечными пределами равен 1».
65. «…………… математическим ожиданием называется сумма произведений возможных значений на их условные вероятности».
66. «……………….моментом двух величин называется математическое ожидание произведения
их отклонений от соответствующих ожиданий».
67. «………………. момент двух независимых случайных величин равен……».
68. «Две величины называются ……………… , если их……………….момент отличен от нуля».
69. Математическое ожидание случайной величины, плотность которой f ( x )  0,5e  x / 2 при х > 0, равно
70. Математическое ожидание числа появлений события А,
вероятность которого р = 0,2, в серии n = 80 испытаний
равно
71. Математическое ожидание случайной величины, плотность которой f ( x )  e
 ( x5)2 / 8
/ 2 2 , равно
43
1) 0
3) 1
2) 0,5
4) 2
1) 10
3) 20
2) 16
4) 40
1) 2
3) 4
2) 3
4) 5
72. Математическое ожидание случайной величины, плотность которой отлична от 0 на интервале (2, 4), где
f ( x )  0,5 , равно
73. Стрелок попадает в мишень с вероятностью р = 0,2 и
стреляет до первого попадания. Тогда математическое
ожидание числа использованных патронов равно
74. Вероятностный смысл математического ожидания случайной величины в том, что оно приближенно равно
1) 2
3) 4
2) 3
4) 5
1) 2
3) 4
2) 3
4) 5
1) наиболее вероятному значению
2) среднему возможному значению
3) среднему арифметическому
значений, наблюдаемых в серии
испытаний
4) разбросу значений случайной
величины
2.2.2 Дисперсия, отклонение
75. Дисперсия числа появлений события А, вероятность кото- 1) 10
2) 20
рого р = 0,5, в серии n = 40 испытаний равна
3) 30
4) 40
76. «……………… называется разность между случайной величиной и ее математическим ожиданием».
77. «В случае……………случайных величин Х, У справедливо свойство D(X + Y) = D(X) + D(Y)»
78. Среднее квадратическое отклонение случайной величины,
1) 2
2) 4
2
x / 8
3) 8
4) 16
/ 2 2 , равно
плотность которой f ( x )  e
79. Дисперсия случайной величины, плотность которой отлич- 1) 1/2
2) 1/3
3) 1/4
4) 1/5
на от 0 на интервале (0, 2), где f ( x )  0,5 , равна
80. Среднее квадратическое отклонение случайной величины,
1) 2
2) 3
x / 2
3)
4
4) 5
плотность которой f ( x )  0,5e
при х > 0, равно
81. «Соответствие между плотностями компонент и двумерной плотностью»

 f ( x , y )dx
плотность компоненты Х


плотность компоненты У
f ( x, y ) /
 f ( x , y )dx


условная плотность компоненты Х
f ( x, y ) /
 f ( x , y )dy


 f ( x , y )dy
условная плотность компоненты У

2.3 Нормальное и показательное распределение
82.
«Нормальное распределение с параметрами m  0,   1 называется ……………».
83.
84.
«Плотность распределения e  x / 2 / 2 определяет …………. распределение».
«Плотность f(x) нормального распределения с параметром m обладает симметрией f(x) 
……….».
«Плотность нормированного распределения (х) и нормального распределения f(x) с параметрами m ,  связаны выражением f(x) = ……….».
x
1) четной
«Функция Лапласа  ( x )    ( t )dt является ……………...
2) нечетной
0
3) возрастающей
функцией».
4) убывающей
85.
86.
2
44
x
87.
«График функции Лапласа  ( x )    ( t )dt имеет две асимптоты с уравнением у = ……».
0
88.
«Нормальная кривая имеет ………………. асимптоту».
89.
90.
«Нормальная кривая с параметрами m  3,   1 имеет точки перегиба с абсциссами х =
……..».
«Нормальная кривая с постоянным параметром  и переменным m ………. свою форму».
91.
«При убывании параметра  максимальная ордината нормальной кривой …………..».
92.
93.
«При возрастании параметра  форма нормальной кривой становится более …………..».
«Эксцесс нормального распределения равен ……..».
94.
«Если асимметрия распределения положительна, то правое плечо графика плотности ……...
левого плеча».
«Если Х, У независимые нормальные случайные величины, то величина Х + У распределена по ………………... закону».
«Если Х распределена по нормальному закону, то вероятность P Х - m   ………..от
95.
96.

значений параметров m ,  ».
97.
«Если Х распределена по нормальному закону, то вероятность P
……».
Случайная величина, которая заведомо распределена не по нормальному закону, определяет следующий показатель абитуриента дневного отделения НФИ КемГУ

 Х - m  3  равна
1) рост
2) вес
3) возраст
4) суммарный балл
99. «Математическое ожидание и среднее квадратическое отклонение ………. распределения
равны между собой».
100. «Если функция надежности равна 0,6, то функция показательного распределения равна….».
98.
101. «Плотность случайной величины Х отлична от 0 в интервале (1, е), где f(x)= 1/х. Тогда
плотность случайной величины У = ln X в интервале (0, 1) равна ……».
3 ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
102. «Предметом…………………является изучение массовых однородных случайных событий».
103. «Соответствие между вероятностью появления события А k раз в серии n испытаний и
предельной формулой»
Бернулли
р(А) = 0,2 ; k > 20 ; n = 55
Пуассона
р(А) = 0,2 ; k = 2 ; n = 55
Лапласа, локальная
р(А) = 0,02 ; k = 2 ; n = 55
Лапласа, интегральная
р(А) = 0,2 ; k = 2 ; n = 5
104.
«Соответствие между вероятностью появления события А
k раз в серии n испытаний, где р(А) = р, а  = np, и предельной формулой»
Бернулли
Пуассона
Лапласа, локальная
Лапласа, интегральная
 k - np 


    k1 - np 
P ( k1  k  k 2 )    2
 npq 
 npq 




Pn(k) = 1   k  np 
npq  npq 
Pn(k) = Ckn pk q(n – k)
Pn(k) = k exp(–)/k!
45
105.
«Соответствия между событием и предельной вероятностью, где n – количество испытаний, k – число появлений события А , р – его вероятность, m
– математическое ожидание,  - среднее квадратическое отклонение»
{a  k  b}
2 ( n / ( pq) )
{
k/n - p  
{ х - m   };
2 ( / ( n ))
} ; р(А) = р
b-m
a -m
  

  
  
х - выборочная средняя

{a  X  b}; X – нормальная случайная величина
 b - np 
 a - np 
  


 npq 
 npq 


 
106.
«Сумма очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, распределена по закону близкому к ………………..».
107.
Если D(X) = 0,001, то вероят1) 0,2
2) 0,4
3) 0,8
4) 0,9
ность события X - M ( X )  0,1 больше
Если вероятность
1) 0,2
2) 0,4
3)
0,8
4) 1,6
P X - M ( X )    0,9 , а дисперсия D(X) = 0,004, то 
равно
4 ТОЧЕЧНОЕ И ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ
4.1 Выборка из генеральной совокупности
109. «………….называется совокупность случайно отобранных объектов из генеральной совокупности».
110. «Последовательность действий»
получение практических выводов
сбор статистических данных
группировка данных
статистическая обработка данных
111. «Если отобранный объект возвращается в генеральную совокупность, то выборка называется
…….. , а если нет, то - ………………».
112. «Выборка называется ………………….. , если она правильно представляет пропорции генеральной совокупности».
113. «Статистическим ……………….выборки называется перечень вариант и соответствующих
им частот».
114.При изображении интервального ряда
1) диаграмма сравнения
распределения выборки строится
2) гистограмма частот
3) линейная диаграмма
4) круговая диаграмма
115.
« Задача …………………….состоит в создании методов сбора
и обработки данных».
108.


46
1) 45
2) 50
3) 55
4) 60
a
частота
116. На рисунке
изображен полигон частот
для выборки
объема 170.
Тогда параметр a равен
40
20
0
0
10
20
варианта
30
40
4.2 Точечная оценка
117. «Последовательность расчета выборочной средней и дисперсии методом произведений»
составление столбца частот
составление столбца вариант
расчет столбца условных вариант
расчет столбца произведений частот на квадраты условных вариант
расчет столбца произведений частот на квадраты условных вариант, увеличенных на 1
расчет столбца произведений условных вариант на частоты
118.
«……………..… оценка выражается одним числом».
119. «Если оценка  параметра * ………………………, то М( ) = *».
120. «Если оценка  параметра * ………………………, то D( ) – минимальна».


*
121. «Если оценка  параметра * ………………………, то P  -     1 при n   ».
122. «Соответствие между параметром и точечной оценкой»
вероятность события
выборочная средняя
генеральная средняя
выборочная исправленная дисперсия
генеральная дисперсия
выборочное исправленное отклонение
генеральное отклонение
относительная частота события
123. Исправленная дисперсия выборки 1 3 4 5 7 равна
1) 3
2) 4
3) 5
4) 6
124. Выборочная средняя выборки 1 3 4 5 7 равна
1) 3
2) 4
3) 5
4) 6
125. Медиана выборки 1 2 5 7 15 равна
1) 5
2) 6
3) 7
4) 8
126. «Соответствие между выборочной характеристикой и формулой метода произведений»
варианта
h
шаг переменной
C
ложный нуль
u
Du
условная варианта
условная средняя
(xi – C)/h
условная дисперсия
C + hu
выборочная средняя
h2 Du
выборочная дисперсия
xi
4.3 Интервальная оценка
127.
« ………………. оценка выражается двумя числами, которые являются концами интервала».
128. «………………... интервальной оценки – это вероятность того, что оцениваемый параметр
принадлежит этому интервалу».
47
129. «Соответствие между параметром доверительного интервала для математического
ожидания и его выражением»
точность оценки
(xв –  , xв +  )
надежность оценки

оцениваемый параметр

доверительный интервал
М(Х)
130. «Увеличение надежности оценки математического ожидания влечет за собой ……… ее
точности».
131. Доверительный интервал для математического ожидания
1) (10, 12)
2) (10, 13)
случайной величины, выборочная средняя которой равна 12,
3) (12, 13)
4) (10, 14)
имеет вид
132. «Случайная величина распределена по нормальному закону с параметром   5 . Тогда выборка значений с параметрами x  10, n  25,   0,95 определяет следующий доверительный интервал для математического ожидания…………….».
5 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
5.1 Основные понятия
133. «Если принимается неправильная гипотеза, то происходит ошибка ……. рода, а если отвергается правильная гипотеза, – то ошибка ……. рода».
134. «…………. …………… называется случайная величина, которая служит для проверки статистической гипотезы».
135. «Уровень значимости статистического критерия - вероятность ошибки ……….рода».
136. «……….
…………. называется совокупность значений статистического критерия, при которых нулевая гипотеза отвергается».
137. «Критерием ……………. называется критерий проверки гипотезы о предполагаемом законе
неизвестного распределения».
138. «Если 2набл ………. , то нет основания отвергнуть нулевую гипотезу, а если 2набл ……… –
нулевая гипотеза отвергается».
 5  5  5  5
139. Простая гипотеза имеет вид
140. Конкурирующая гипотеза
к нулевой гипотезе Н0 :   5
141. «Если
 5  5  5  3
гипотеза Н0 ………………. с уровнем значимости 0,05, то она………….. с уровнем значимости 0,01».
142. «Если гипотеза Н0 …………. с уровнем значимости 0,01, то она………….. с уровнем значимости 0,05».
5.2 Критерии проверки гипотез в случае нормального распределения
143. «Гипотеза о значимости выборочного коэффициента корреляции двух нормально распределенных величин проверяется с помощью критерия …………….».
144. «Коэффициент корреляции для выборки Х,У объема 100 из нормальной генеральной совокупности равен 0,3. Тогда величины Х,У ……………. при уровне значимости 0,05».
145. «Коэффициент корреляции для выборки Х,У объема 100 из нормальной генеральной совокупности равен 0,1. Тогда величины Х,У ……………. при уровне значимости 0,05».
146. «Гипотеза о сравнении дисперсий двух нормально распределенных величин проверяется с помощью критерия ………………..».
2
2
1) 2/3
2) 1,5
147. «Исправленные выборочные дисперсии S x  2, S y  3 , Тогда
3) 2
4) 3
наблюдаемое значение критерия Фишера-Снедекора равно
48
148. «Соответствие между Х
, У и критерием проверки Н0 : М(Х) = М(У)
Х,У по нормальному закону
( x  y ) nm(n  m  2)/( n  m)
с известными Dx , D y
(n  1) S 2  (m  1) S 2
x
обе выборки большого объема
n  30, m  30
х у
Dx / n  D y / m
Х,У по нормальному закону
с Dx  D y и неизвестны
S / n  S y2 / m
y
х у
2
x
обе выборки малого объема
непараметрические критерии
149. Статистическое распределение выборки содержит эмпириче1) 1
2) 2
ские частоты 3 5 20 15 10 2 .Число степеней свободы крите- 3) 3
4) 4
рия согласия Пирсона для нормального распределения равно
5.3 Непараметрические критерии проверки гипотезы об отсутствии корреляционной зависимости
150. «Если все ранги значений величин Х, У совпадают, то выборочный коэффициент ранговой
корреляции Спирмена равен……».
151. «Если ранги значений величины Х расположены в порядке возрастания, а соответствующие
ранги У - в порядке убывания, то выборочный коэффициент ранговой корреляции Спирмена
равен…….».
152. «Если все ранги значений величин Х, У совпадают или противоположны, то величины …….».
153. «Корреляция
трех и более случайных величин проверяется с помощью коэффициента ……..».
154. «Если
х12 345
, то выборочный коэффициент ранговой корреляции Спирмена рау132 5 4
ранги
вен…….».
155. «Если
ранги
х12 345
, то выборочный коэффициент ранговой корреляции Кендала рау132 5 4
вен…….».
5.4 Непараметрические критерии проверки гипотезы о совпадении математических ожиданий
156. Предприятия А и В выпускают типовую продукцию со следующими показателями качества
А 24 23 22 19 20
. Наблюдаемое значение критерия серий для этих показателей равно……..».
В 16 15 14 17 18
157. Предприятия А и В выпускают типовую продукцию со следующими показателями качества
А 24 23 22 19 20
. Наблюдаемое значение критерия серий для этих показателей равно……..».
В 16 15 21 17 18
158. Предприятия А и В выпускают типовую продукцию со следующими показателями качества
А 24 23 22 19 20
. Наблюдаемое значение медианного критерия для этих показателей равВ 16 15 21 17 18
но……..».
159. Предприятия А и В выпускают типовую продукцию со следующими показателями качества
А 24 18 22 16 20
. Наблюдаемое значение медианного критерия для этих показателей равВ 19 15 21 17 23
но……..».
49
А и В выпускают типовую продукцию со следующими показателями качества
А 24 23 22 19 20
. Наблюдаемое значение критерия Вилкоксона для этих показателей равВ 16 15 21 17 18
но……..».
161. Предприятия А и В выпускают типовую продукцию со следующими показателями качества
А 24 18 22 16 20
. Наблюдаемое значение критерия Вилкоксона для этих показателей равВ 19 15 21 17 23
но……..».
162. Предприятия А и В выпускают типовую продукцию со следующими показателями качества
А 24 23 22 19 20
. Наблюдаемое значение критерия Манна-Уитни для этих показателей равВ 16 15 21 17 18
но……..».
163. Предприятия А и В выпускают типовую продукцию со следующими показателями качества
А 24 23 22 19 20
. Наблюдаемое значение критерия Манна-Уитни для этих показателей равВ 16 15 14 17 18
но……..».
164. Предприятия А и В выпускают типовую продукцию со следующими показателями качества
А 24 23 22 19 20
. Наблюдаемое значение критерия Тьюки для этих показателей равно……..».
В 16 15 21 17 18
165. Предприятия А и В выпускают типовую продукцию со следующими показателями качества
А 24 23 22 19 20
. Наблюдаемое значение критерия Тьюки для этих показателей равно……..».
В 16 15 14 17 18
6 ЛИНЕЙНЫЕ СТАТИСТИЧЕСКИЕ МОДЕЛИ
6.1 Основные понятия
166.«Случайные величины Х, У связаны…………….зависимостью, если каждому значению Х соответствует определенное значение У ».
167.«Случайные величины Х, У связаны…………….зависимостью, если каждому значению Х соответствует определенное распределение У ».
168.«Случайные величины Х, У связаны…………….зависимостью, если каждому значению Х соответствует определенное среднее значение У ».
169.«………….средней у х случайной величины У называется среднее арифметическое наблюдаемых значений У, соответствующих значению Х = х».
170.«Если выборочный коэффициент корреляции равен 1 , то случайные величины Х, У связаны
…………зависимостью».
171.«Выборочным корреляционным отношением  называется отношение ………………. среднего квадратического отклонения к общему среднему квадратическому отклонению величины
У».
172.«Выборочное корреляционное отношение удовлетворяет двойному неравенству 1    ….».
6.2 Выборочное уравнение прямой линии регрессии
173.«Облако данных объема
80
100 и соответствующая
прямая линия регрессии,
60
приведенные на рисун40
ке, показывают, что случайные величины Х, У
20
……………………...».
У
160. Предприятия
20
30
Х
50
40
60
у
174.«Облако данных объема
100 и соответствующая
прямая линия регрессии,
приведенные на рисунке, показывают, что случайные величины Х, У
………………………».
40
20
10
20
30
Х
175. «Последовательность расчета выборочного уравнения прямой линии регрессии»
составление корреляционной таблицы
группировка данных выборки
расчет выборочных средних и выборочных дисперсий
расчет выборочного коэффициента корреляции
подстановка найденных величин в выборочное уравнение регрессии
176. Выборочный коэффициент корреляции равен 0,5. Тогда 1) у = 2 – х
2) у = х – 2
выборочное уравнение прямой линии регрессии имеет вид
3) у = 1,2 – 0,5х
4) у = 1,1 – 0,1х
х 01
177. «Дана выборка значений двумерной случайной величины
. Соответствующий выборочу 31
ный коэффициент корреляции равен ……».
х 01
178. «Дана выборка значений двумерной случайной величины
. Соответствующее уравнение
у 31
прямой линии регрессии имеет вид у = ……………».
6.3 Выборочное корреляционное отношение
179. «Если выборочное корреляционной отношение  = 1, то признаки Х, У связаны ………… зависимостью».
180. «Если выборочное корреляционной отношение  равно модулю выборочного коэффициента
корреляции, то признаки Х, У связаны ………… зависимостью».
181. «Теснота множественной регрессии признака Z на признаки Х, У оценивается выборочным
………….. коэффициентом корреляции».
6.4 Разыгрывание событий и случайных величин
182. «Вероятность события р(А) = 0,35 . Тогда розыгрыш противоположных событий А и А в пяти испытаниях с помощью следующих случайных чисел 0,1 0,4 0,2 0,9 0,3 имеет вид
…………….».
183. «Вероятность получить оценку “отлично” – 0,1, “хорошо” – 0,4, “удовлетворительно” – 0,3 и
“неудовлетворительно” – 0,2. Розыгрыш возможных экзаменационных оценок с помощью
следующих случайных чисел 0,11 0,4 0,2 0,9 0,3 имеет вид…………………..».
184. «Случайная величина Х равномерно распределена в интервале (2, 12). Розыгрыш трех возможных значений Х с помощью случайных чисел 0,1 0,2 0,7 имеет вид………………….».
185. «Розыгрыш возможного значения нормированного распределения с помощью 12 случайных
чисел, сумма которых равна 7,2 , имеет вид……..».
186. «Розыгрыш возможного значения нормального распределения с параметрами m = 3,  = 2 при
помощи 12 случайных чисел, сумма которых равна 4,8 , имеет вид……..».
7 СЛУЧАЙНЫЕ ПРОЦЕССЫ
7.1 Основные определения
187. «Задача определения характеристики на выходе устройства называется………………….».
51
188. «Задача проектирования оптимального устройства, осуществляющего преобразование заданной входной функции в заданную выходную функцию называется……………………».
189. «Случайной функцией X(t) называется функция неслучайного аргумента t, которая при каждом фиксированном значении t является …………..…………….. величиной, называемой
…………………. случайной функции».
190. «Реализацией случайной функции X(t) называется ……………… функцией аргумента t , которая является возможным наблюдением случайной функции в испытании».
191. «Случайным процессом называется случайная функция X(t), в которой t истолковывается как
…………………….. » .
192. «Значения случайной функции X(t) образуют случайную последовательность х1(t) ,…, хn(t) ,
если аргумент t изменяется………………..».
193. «Характеристиками случайной функции X(t) называются ………………. 1-го и 2-го порядка».
7.2 Характеристики случайной функции
194. «Математическое ожидание случайной функции X(t) = U sint, где U - случайная величина и
M(U) = 2, равно ………..».
195. «Дисперсия случайной функции X(t) = U sint, где U - случайная величина и D(U) = 4, равна
………..».

196. «Центрированная случайная функция Х (t ) для случайной функции X(t) = U sint, где U - случайная величина и M(U) = 3, равна ……….».
197. «Для случайной функции X(t) = U t, где U - случайная величина и дисперсия D(U) = 3, корреляционная функция равна ………».
198. «Корреляционная функция для случайной функции X(t) равна 2t1 t2 , а случайная функция
У(t) = sint X(t) . Тогда корреляционная функция для случайной функции У(t) равна ………».
199. «Случайные функции X(t) = U t, У(t) = U t2, в которых U - случайная величина и дисперсия
D(U) = 4. Тогда взаимная корреляционная функция для случайных функций X(t) ,У(t) равна
…………………».
200. «Взаимная корреляционная функция для случайных функций X(t) , У(t) имеет вид t1 t2 . Тогда взаимная корреляционная функция для случайных функций sintX(t) , costУ(t) равна…………………».
52
4 ВОПРОСЫ ДЛЯ ЭКЗАМЕНА
ТЕМА 1. «Разведочный» анализ данных
1. Задачи математической статистики. Генеральная и выборочная совокупности.
2. Репрезентативная выборка. Способы отбора.
3. Задачи предварительного анализа данных. Протокол наблюдений. Тест однородности и независимости выборок. Тестирование статистических связей.
4. Статистическое распределение выборки. Полигон и гистограмма.
5. Статистическая оценка параметров распределения. Оценка генеральной средней.
6. Оценка генеральной дисперсии и среднего квадратического отклонения.
7. Оценка генеральной асимметрии и эксцесса.
8. Интервальная оценка средней нормальной генеральной совокупности. Точность и
надежность оценки. Случай известного и неизвестного среднего квадратического отклонения.
9. Методы расчета сводных характеристик выборки.
10. Метод произведений расчета выборочных характеристик.
11. Определение выборочных характеристик с помощью пакета программ
«СТАТИСТИКА».
ТЕМА 2. Планирование эксперимента и дисперсионный анализ
12.Сравнение нескольких средних. Понятие об однофакторном дисперсионном анализе.
13.Общая, факторная и остаточная суммы квадратов отклонений.
14.Общая, факторная и остаточная дисперсии.
15.Понятие о двухфакторном дисперсионном анализе. Коэффициенты детерминации факторов.
16.Проверка предположений. Факторный анализ с помощью пакета программ
«СТАТИСТИКА».
ТЕМА 3. Порядковые статистики
17.Исчисление рангов. Ранговая корреляция. Ранговые распределения и безэталонные измерения.
18.Ранговая корреляция Спирмена для двух выборок. Проверка гипотезы о значимости рангового коэффициента корреляции. Коэффициент конкордации Кендалла
для нескольких выборок. Проверка гипотезы о значимости рангового коэффициента корреляции. Ранговая корреляция Кендалла. Проверка гипотезы о значимости рангового коэффициента корреляции.
19.Исследование ранговой корреляции и конкордации с помощью пакета программ
«СТАТИСТИКА».
20.Криволинейная корреляция. Простейший случай. Понятие о множественной корреляции.
21.Исследование множественной и нелинейной корреляции с помощью пакета программ «СТАТИСТИКА».
53
ТЕМА 4. Непараметрическая статистика
22.Проверка вероятностей, задающих полиномиальное распределение. Проверка независимости двух признаков по таблице сопряженности.
23.Методы проверки гипотез, свободные от распределения. Критерии, основанные
на знаках. Критерий Вальда-Вольфовица. Серии знаков для проверки гипотезы о
случайности выборки. Критерии Вилкоксона, Манна-Уитни, Тьюки, Колмогорова-Смирнова.
24.Проверки гипотез с помощью пакета программ «СТАТИСТИКА».
ТЕМА 5. Задачи классификации
25.Элементы кластерного анализа. Таксономия в механике, горном деле, биологии,
психологии и экономике. Иерархическое дерево.
26.Проведение кластерного анализа с помощью пакета программ «СТАТИСТИКА».
27.Деревья классификаций. Идея метода. Корень дерева, дочерняя вершина, вершина ветвления и терминальная вершина. Задача распознавания образов.
28.Построение иерархического дерева и дерева классификации с помощью пакета
программ «СТАТИСТИКА».
ТЕМА 6. Компьютерное обеспечение статистических процедур
29.Обзор пакетов прикладных программ «СТАТИСТИКА» и «SPSS». Графические
методы анализа.
30.Двумерные и трехмерные графики. Гистограммы, диаграммы рассеяния и круговые диаграммы.
31.Последовательные графики. Гистограммы 2-х переменных, карты линии уровня,
всплески поверхностей и последовательные поверхности.
32.Тернарные и категоризованные графики. Линии тренда. Линии и поверхности
рассеяния. Тернарные карты зон и линий. Тернарные диаграммы рассеяния.
33.Многомерные пиктографики. Лица Чернова, профили, звезды, лучи.
34.Матричные графики. Столбчатые диаграммы, линейные графики, диаграммы
рассеяния.
ТЕМА 7. Статистическое оценивание
35. Несмещенные, эффективные и состоятельные оценки.
36. Оценка точности измерений.
37. Оценка вероятности по относительной частоте.
38. Метод моментов для точечной оценки параметров распределения.
39. Метод наибольшего правдоподобия.
ТЕМА 8. Теория корреляции
40. Функциональная, статистическая и корреляционная зависимости.
41. Условные средние. Выборочное уравнение регрессии.
54
42. Выборочный коэффициент корреляции. Выборочное корреляционное отношение.
43. Криволинейная и множественная корреляция.
ТЕМА 9. Теория статистических гипотез
44. Основная и альтернативная гипотеза. Виды гипотез. Статистический критерий
значимости, критическая область, ошибки 1-го и 2-го рода, уровень значимости и
мощность критерия.
45. Сравнение двух дисперсий нормальных генеральных совокупностей. Критерий
Фишера. Критическое значение в зависимости от альтернативной гипотезы.
46. Сравнение нескольких дисперсий нормальных распределений. Критерий Бартлетта.
47. Сравнение двух выборочных средних нормальных генеральных совокупностей,
дисперсии которых известны и равны; не равны; неизвестны, но предполагаются
равными. Практический смысл задачи.
48. Сравнение более двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы.
49. Проверка гипотезы о значимости выборочного коэффициента корреляции двумерной нормальной генеральной совокупности.
50. Проверка гипотезы о нормальном распределении генеральной совокупности.
Критерий согласия Пирсона. Методика расчета теоретических частот для показательного, равномерного распределения, биномиального и пуассоновского распределения. Эмпирическая и теоретическая кумуляты.
51. Проверка вероятностей, задающих полиномиальное распределение. Проверка
независимости двух признаков по таблице сопряженности.
52. Проверка гипотез с помощью пакета программ «СТАТИСТИКА».
ТЕМА 10. Метод статистических испытаний
53. Случайные числа. Разыгрывание дискретной св.
54. Разыгрывание противоположных событий, полной группы событий.
55. Разыгрывание непрерывной св. Метод обратных функций.
56. Метод суперпозиции.
57. Моделирование выборок с помощью пакета программ «СТАТИСТИКА».
ТЕМА 11. Случайные процессы
58. Случайная функция. Корреляционная теория случайных функций. Математическое ожидание и дисперсия случайных функций. Свойства
59. Корреляционная функция случайной функции. Свойства. Взаимная корреляционная функция. Свойства.
60. Стационарная случайная функция. Корреляционная функция стационарной случайной функции. Свойства. Нормированная корреляционная функция стационарной случайной функции.
61. Спектральная теория стационарной случайной функции. Дискретный и непре55
рывный спектр. Спектральная плотность.
62. Стохастические модели управления запасами. Основные факторы, учитываемые
в модели. Модели с выпуклой или линейной функцией затрат. Теорема об оптимальной стратегии пополнения запасов. Случай единовременного штрафа.
56
5 СПРАВОЧНИК
для изучения дисциплины ДС.Р «Прикладные задачи математической статистики»
студентами специальности 010501 «Прикладная математика и информатика»
Исследование зависимостей в сравнении с экспериментальными исследованиями. Большинство эмпирических исследований данных можно отнести к одному
из названных типов. В исследовании корреляций (зависимостей, связей...) вы не
влияете (или, по крайней мере, пытаетесь не влиять) на переменные, а только измеряете их и хотите найти зависимости (корреляции) между некоторыми измеренными
переменными, например, между кровяным давлением и уровнем холестерина. В
экспериментальных исследованиях, напротив, вы варьируете некоторые переменные
и измеряете воздействия этих изменений на другие переменные. Например, исследователь может искусственно увеличивать кровяное давление, а затем на определенных уровнях давления измерить уровень холестерина. Анализ данных в экспериментальном исследовании также приходит к вычислению "корреляций" (зависимостей) между переменными, а именно, между переменными, на которые воздействуют, и переменными, на которые влияет это воздействие. Тем не менее, экспериментальные данные потенциально снабжают нас более качественной информацией.
Только экспериментально можно убедительно доказать причинную связь между переменными. Например, если обнаружено, что всякий раз, когда изменяется переменная A, изменяется и переменная B, то можно сделать вывод - "переменная A оказывает влияние на переменную B", т.е. между переменными А и В имеется причинная зависимость. Результаты корреляционного исследования могут быть проинтерпретированы в каузальных (причинных) терминах на основе некоторой теории, но
сами по себе не могут отчетливо доказать причинность.
Зависимые и независимые переменные. Независимыми переменными называются переменные, которые варьируются исследователем, тогда как зависимые переменные - это переменные, которые измеряются или регистрируются. Может показаться, что проведение этого различия создает путаницу в терминологии, поскольку
как говорят некоторые студенты "все переменные зависят от чего-нибудь". Тем не
менее, однажды отчетливо проведя это различие, вы поймете его необходимость.
Термины зависимая и независимая переменная применяются в основном в экспериментальном исследовании, где экспериментатор манипулирует некоторыми переменными, и в этом смысле они "независимы" от реакций, свойств, намерений и т.д.
присущих объектам исследования. Некоторые другие переменные, как предполагается, должны "зависеть" от действий экспериментатора или от экспериментальных
условий. Иными словами, зависимость проявляется в ответной реакции исследуемого объекта на посланное на него воздействие. Отчасти в противоречии с данным
разграничением понятий находится использование их в исследованиях, где вы не
варьируете независимые переменные, а только приписываете объекты к "экспериментальным группам", основываясь на некоторых их априорных свойствах. Например, если в эксперименте мужчины сравниваются с женщинами относительно числа
лейкоцитов (WCC), содержащихся в крови, то Пол можно назвать независимой переменной, а WCC зависимой переменной.
57
Шкалы измерений. Переменные различаются также тем "насколько хорошо"
они могут быть измерены или, другими словами, как много измеряемой информации обеспечивает шкала их измерений. Очевидно, в каждом измерении присутствует некоторая ошибка, определяющая границы "количества информации", которое
можно получить в данном измерении. Другим фактором, определяющим количество
информации, содержащейся в переменной, является тип шкалы, в которой проведено измерение. Различают следующие типы шкал:(a) номинальная, (b) порядковая
(ординальная), (c) интервальная (d) относительная (шкала отношения). Соответственно, имеем четыре типа переменных: (a) номинальная, (b) порядковая (ординальная), (c) интервальная и (d) относительная.
a. Номинальные переменные используются только для качественной классификации. Это означает, что данные переменные могут быть измерены только в
терминах принадлежности к некоторым, существенно различным классам; при
этом вы не сможете определить количество или упорядочить эти классы.
Например, вы сможете сказать, что 2 индивидуума различимы в терминах переменной А (например, индивидуумы принадлежат к разным национальностям). Типичные примеры номинальных переменных - пол, национальность,
цвет, город и т.д. Часто номинальные переменные называют категориальными.
b. Порядковые переменные позволяют ранжировать (упорядочить) объекты, указав какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. Однако они не позволяют сказать "на сколько
больше" или "на сколько меньше". Порядковые переменные иногда также
называют ординальными. Типичный пример порядковой переменной - социоэкономический статус семьи. Мы понимаем, что верхний средний уровень
выше среднего уровня, однако сказать, что разница между ними равна, скажем, 18% мы не сможем. Само расположение шкал в следующем порядке: номинальная, порядковая, интервальная является хорошим примером порядковой шкалы.
c. Интервальные переменные позволяют не только упорядочивать объекты измерения, но и численно выразить и сравнить различия между ними. Например,
температура, измеренная в градусах Фаренгейта или Цельсия, образует интервальную шкалу. Вы можете не только сказать, что температура 40 градусов
выше, чем температура 30 градусов, но и что увеличение температуры с 20 до
40 градусов вдвое больше увеличения температуры от 30 до 40 градусов.
d. Относительные переменные очень похожи на интервальные переменные. В
дополнение ко всем свойствам переменных, измеренных в интервальной шкале, их характерной чертой является наличие определенной точки абсолютного
нуля, таким образом, для этих переменных являются обоснованными предложения типа: x в два раза больше, чем y. Типичными примерами шкал отношений являются измерения времени или пространства. Например, температура
по Кельвину образует шкалу отношения, и вы можете не только утверждать,
что температура 200 градусов выше, чем 100 градусов, но и что она вдвое вы58
ше. Интервальные шкалы (например, шкала Цельсия) не обладают данным
свойством шкалы отношения. Заметим, что в большинстве статистических
процедур не делается различия между свойствами интервальных шкал и шкал
отношения.
Связи между переменными. Независимо от типа, две или более переменных
связаны (зависимы) между собой, если наблюдаемые значения этих переменных
распределены согласованным образом. Другими словами, мы говорим, что переменные зависимы, если их значения систематическим образом согласованы друг с другом в имеющихся у нас наблюдениях. Например, переменные Пол и WCC (число
лейкоцитов) могли бы рассматриваться как зависимые, если бы большинство мужчин имело высокий уровень WCC, а большинство женщин - низкий WCC, или
наоборот. Рост связан с Весом, потому что обычно высокие индивиды тяжелее низких; IQ (коэффициент интеллекта) связан с Количеством ошибок в тесте, т.к. люди
высоким значением IQ делают меньше ошибок и т.д.
Почему зависимости между переменными являются важными? Вообще говоря, конечная цель всякого исследования или научного анализа состоит в нахождение связей (зависимостей) между переменными. Философия науки учит, что не существует иного способа представления знания, кроме как в терминах зависимостей
между количествами или качествами, выраженными какими-либо переменными. Таким образом, развитие науки всегда заключается в нахождении новых связей между
переменными. Исследование корреляций по существу состоит в измерении таких
зависимостей непосредственным образом. Тем не менее, экспериментальное исследование не является в этом смысле чем-то отличным. Например, отмеченное выше
экспериментальное сравнение WCC у мужчин и женщин может быть описано как
поиск связи между переменными: Пол и WCC. Назначение статистики состоит в
том, чтобы помочь объективно оценить зависимости между переменными. Действительно, все сотни описанных в данном руководстве процедур могут быть проинтерпретированы в терминах оценки различных типов взаимосвязей между переменными.
Две основные черты всякой зависимости между переменными. Можно отметить два самых простых свойства зависимости между переменными: (a) величина
зависимости и (b) надежность зависимости.
a. Величина. Величину зависимости легче понять и измерить, чем надежность.
Например, если любой мужчина в вашей выборке имел значение WCC выше
чем любая женщина, то вы можете сказать, что зависимость между двумя переменными (Пол и WCC) очень высокая. Другими словами, вы могли бы
предсказать значения одной переменной по значениям другой.
b. Надежность ("истинность"). Надежность взаимозависимости - менее наглядное понятие, чем величина зависимости, однако чрезвычайно важное. Надежность зависимости непосредственно связана с репрезентативностью определенной выборки, на основе которой строятся выводы. Другими словами,
надежность говорит нам о том, насколько вероятно, что зависимость, подобная найденной вами, будет вновь обнаружена (иными словами, подтвердится)
59
на данных другой выборки, извлеченной из той же самой популяции. Следует
помнить, что конечной целью почти никогда не является изучение данной
конкретной выборки; выборка представляет интерес лишь постольку, поскольку она дает информацию обо всей популяции. Если ваше исследование
удовлетворяет некоторым специальным критериям (об этом будет сказано
позже), то надежность найденных зависимостей между переменными вашей
выборки можно количественно оценить и представить с помощью стандартной статистической меры (называемой p-уровень или статистический уровень
значимости, подробнее см. в следующем разделе).
Что такое статистическая значимость (p-уровень)? Статистическая значимость результата представляет собой оцененную меру уверенности в его "истинности" (в смысле "репрезентативности выборки"). Выражаясь более технически, pуровень (этот термин был впервые использован в работе Brownlee, 1960) это показатель, находящийся в убывающей зависимости от надежности результата. Более высокий p- уровень соответствует более низкому уровню доверия к найденной в выборке зависимости между переменными. Именно, p-уровень представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю
популяцию. Например, p- уровень = .05 (т.е. 1/20) показывает, что имеется 5% вероятность, что найденная в выборке связь между переменными является лишь случайной особенностью данной выборки. Иными словами, если данная зависимость в популяции отсутствует, а вы многократно проводили бы подобные эксперименты, то
примерно в одном из двадцати повторений эксперимента можно было бы ожидать
такой же или более сильной зависимости между переменными. (Отметим, что это не
то же самое, что утверждать о заведомом наличии зависимости между переменными, которая в среднем может быть воспроизведена в 5% или 95% случаев; когда
между переменными популяции существует зависимость, вероятность повторения
результатов исследования, показывающих наличие этой зависимости называется
статистической мощностью плана). Во многих исследованиях p-уровень .05 рассматривается как "приемлемая граница" уровня ошибки.
Как определить, является ли результат действительно значимым? Не существует никакого способа избежать произвола при принятии решения о том, какой
уровень значимости следует действительно считать "значимым". Выбор определенного уровня значимости, выше которого результаты отвергаются как ложные, является достаточно произвольным. На практике окончательное решение обычно зависит от того, был ли результат предсказан априори (т.е. до проведения опыта) или
обнаружен апостериорно в результате многих анализов и сравнений, выполненных с
множеством данных, а также на традиции, имеющейся в данной области исследований. Обычно во многих областях результат p 0.05 является приемлемой границей
статистической значимости, однако следует помнить, что этот уровень все еще
включает довольно большую вероятность ошибки (5%). Результаты, значимые на
уровне p 0.01 обычно рассматриваются как статистически значимые, а результаты
с уровнем p 0.005 или p 0.001 как высоко значимые. Однако следует понимать,
что данная классификация уровней значимости достаточно произвольна и является
всего лишь неформальным соглашением, принятым на основе практического опыта
в той или иной области исследования.
60
Статистическая значимость и количество выполненных анализов. Понятно,
что чем больше число анализов вы проведете с совокупностью собранных данных,
тем большее число значимых (на выбранном уровне) результатов будет обнаружено
чисто случайно. Например, если вы вычисляете корреляции между 10 переменными
(имеете 45 различных коэффициентов корреляции), то можно ожидать, что примерно два коэффициента корреляции (один на каждые 20) чисто случайно окажутся
значимыми на уровне p 0.05, даже если переменные совершенно случайны и некоррелированы в популяции. Некоторые статистические методы, включающие много сравнений, и, таким образом, имеющие хороший шанс повторить такого рода
ошибки, производят специальную корректировку или поправку на общее число
сравнений. Тем не менее, многие статистические методы (особенно простые методы
разведочного анализа данных) не предлагают какого-либо способа решения данной
проблемы. Поэтому исследователь должен с осторожностью оценивать надежность
неожиданных результатов.
Величина зависимости между переменными в сравнении с надежностью зависимости. Как было уже сказано, величина зависимости и надежность представляют две различные характеристики зависимостей между переменными. Тем не менее, нельзя сказать, что они совершенно независимы. Говоря общим языком, чем
больше величина зависимости (связи) между переменными в выборке обычного
объема, тем более она надежна (см. следующий раздел).
Почему более сильные зависимости между переменными являются более
значимыми? Если предполагать отсутствие зависимости между соответствующими
переменными в популяции, то наиболее вероятно ожидать, что в исследуемой выборке связь между этими переменными также будет отсутствовать. Таким образом,
чем более сильная зависимость обнаружена в выборке, тем менее вероятно, что этой
зависимости нет в популяции, из которой она извлечена. Как вы видите, величина
зависимости и значимость тесно связаны между собой, и можно было бы попытаться вывести значимость из величины зависимости и наоборот. Однако указанная
связь между зависимостью и значимостью имеет место только при фиксированном
объеме выборки, поскольку при различных объемах выборки одна и та же зависимость может оказаться как высоко значимой, так и незначимой вовсе (см. следующий раздел)
Почему объем выборки влияет на значимость зависимости? Если наблюдений мало, то соответственно имеется мало возможных комбинаций значений этих
переменных и таким образом, вероятность случайного обнаружения комбинации
значений, показывающих сильную зависимость, относительно велика. Рассмотрим
следующий пример. Если вы исследуете зависимость двух переменных (Пол: мужчина/женщина и WCC: высокий/низкий) и имеете только 4 субъекта в выборке (2
мужчины и 2 женщины), то вероятность того, что чисто случайно вы найдете 100%
зависимость между двумя переменными равна 1/8. Более точно, вероятность того,
что оба мужчины имеют высокий WCC, а обе женщины - низкий WCC, или наоборот, - равна 1/8. Теперь рассмотрим вероятность подобного совпадения для 100
субъектов; легко видеть, что эта вероятность равна практически нулю. Рассмотрим
более общий пример. Представим популяцию, в которой среднее значение WCC
61
мужчин и женщин одно и тоже. Если вы будете повторять эксперимент, состоящий
в извлечении пары случайных выборок (одна выборка - мужчины, другая выборка женщины), а затем вычислите разности выборочных средних WCC для каждой пары
выборок, то в большинстве экспериментов результат будет близок к 0. Однако время
от времени, будут встречаться пары выборок, в которых различие между средним
количеством лейкоцитов у мужчин и женщин будет существенно отличаться от 0.
Как часто это будет происходить? Очевидно, чем меньше объем выборки в каждом
эксперименте, тем более вероятно появление таких ложных результатов, которые
показывают существование зависимости между полом и WCC в данных, полученных из популяции, где такая зависимость на самом деле отсутствует.
Пример: "отношение числа новорожденных мальчиков к числу новорожденных девочек" Рассмотрим следующий пример. Имеются 2 больницы. Предположим, что в первой из них ежедневно рождается 120 детей, во второй только 12. В
среднем отношение числа мальчиков, рождающихся в каждой больнице, к числу девочек 50/50. Однажды девочек родилось вдвое больше, чем мальчиков. Спрашивается, для какой больницы данное событие более вероятно? Ответ очевиден для статистика, однако, он не столь очевиден неискушенному. Конечно, такое событие гораздо более вероятно для маленькой больницы. Объяснение этого факта состоит в том,
что вероятность случайного отклонения (от среднего) возрастает с уменьшением
объема выборки.
Почему слабые связи могут быть значимо доказаны только на больших выборках? Пример из предыдущего раздела показывает, что если связь между переменными "объективно" слабая (т.е. свойства выборки близки к свойствам популяции), то не существует иного способа проверить такую зависимость кроме как исследовать выборку достаточно большого объема. Даже если выборка, находящаяся в
вашем распоряжении, совершенно репрезентативна, эффект не будет статистически
значимым, если выборка мала. Аналогично, если зависимость "объективно" (в популяции) очень сильная, тогда она может быть обнаружена с высокой степенью значимости даже на очень маленькой выборке. Рассмотрим пример. Представьте, что
вы бросаете монету. Если монета слегка несимметрична, и при подбрасывании орел
выпадает чаще решки (например, в 60% подбрасываний выпадает орел, а в 40%
решка), то 10 подбрасываний монеты было бы не достаточно, чтобы убедить кого
бы то ни было, что монета асимметрична, даже если был бы получен, казалось, совершенно репрезентативный результат: 6 орлов и 4 решки. Не следует ли отсюда,
что 10 подбрасываний вообще не могут доказать что-либо? Нет, не следует, потому
что если эффект, в принципе, очень сильный, то 10 подбрасываний может оказаться
вполне достаточно для его доказательства. Представьте, что монета настолько
несимметрична, что всякий раз, когда вы ее бросаете, выпадает орел. Если вы бросаете такую монету 10 раз, и всякий раз выпадает орел, большинство людей сочтут это
убедительным доказательством того, что с монетой что-то не то. Другими словами,
это послужило бы убедительным доказательством того, что в популяции, состоящей
из бесконечного числа подбрасываний этой монеты, орел будет встречаться чаще,
чем решка. В итоге этих рассуждений мы приходим к выводу: если зависимость
сильная, она может быть обнаружена с высоким уровнем значимости даже на малой
выборке.
62
Можно ли отсутствие связей рассматривать как значимый результат? Чем
слабее зависимость между переменными, тем большего объема требуется выборка,
чтобы значимо ее обнаружить. Представьте, как много бросков монеты необходимо
сделать, чтобы доказать, что отклонение от равной вероятности выпадения орла и
решки составляет только .000001%! Необходимый минимальный размер выборки
возрастает, когда степень эффекта, который нужно доказать, убывает. Когда эффект
близок к 0, необходимый объем выборки для его отчетливого доказательства приближается к бесконечности. Другими словами, если зависимость между переменными почти отсутствует, объем выборки, необходимый для значимого обнаружения
зависимости, почти равен объему всей популяции, который предполагается бесконечным. Статистическая значимость представляет вероятность того, что подобный
результат был бы получен при проверке всей популяции в целом. Таким образом,
все, что получено после тестирования всей популяции было бы, по определению,
значимым на наивысшем, возможном уровне и это относится ко всем результатам
типа "нет зависимости".
Как измерить величину зависимости между переменными? Статистиками
разработано много различных мер взаимосвязи между переменными. Выбор определенной меры в конкретном исследовании зависит от числа переменных, используемых шкал измерения, природы зависимостей и т.д. Большинство этих мер, тем не
менее, подчиняются общему принципу: они пытаются оценить наблюдаемую зависимость, сравнивая ее с "максимальной мыслимой зависимостью" между рассматриваемыми переменными. Говоря технически, обычный способ выполнить такие
оценки заключается в том, чтобы посмотреть как варьируются значения переменных
и затем подсчитать, какую часть всей имеющейся вариации можно объяснить наличием "общей" ("совместной") вариации двух (или более) переменных. Говоря менее
техническим языком, вы сравниваете то "что есть общего в этих переменных", с тем
"что потенциально было бы у них общего, если бы переменные были абсолютно зависимы". Рассмотрим простой пример. Пусть в вашей выборке, средний показатель
(число лейкоцитов) WCC равен 100 для мужчин и 102 для женщин. Следовательно,
вы могли бы сказать, что отклонение каждого индивидуального значения от общего
среднего (101) содержит компоненту связанную с полом субъекта и средняя величина ее равна 1. Это значение, таким образом, представляет некоторую меру связи
между переменными Пол и WCC. Конечно, это очень бедная мера зависимости, так
как она не дает никакой информации о том, насколько велика эта связь, скажем относительно общего изменения значений WCC. Рассмотрим крайние возможности:
a. Если все значения WCC у мужчин были бы точно равны 100, а у женщин 102,
то все отклонения значений от общего среднего в выборке всецело объяснялись бы полом индивидуума. Поэтому вы могли бы сказать, что пол абсолютно коррелирован (связан) с WCC, иными словами, 100% наблюдаемых различий между субъектами в значениях WCC объясняются полом субъектов.
b. Если же значения WCC лежат в пределах 0-1000, то та же разность (2) между
средними значениями WCC мужчин и женщин, обнаруженная в эксперименте,
составляла бы столь малую долю общей вариации, что полученное различие
(2) считалось бы пренебрежимо малым. Рассмотрение еще одного субъекта
63
могло бы изменить разность или даже изменить ее знак. Поэтому всякая хорошая мера зависимости должна принимать во внимание полную изменчивость индивидуальных значений в выборке и оценивать зависимость по тому,
насколько эта изменчивость объясняется изучаемой зависимостью.
Общая конструкция большинства статистических критериев. Так как конечная цель большинства статистических критериев (тестов) состоит в оценивании
зависимости между переменными, большинство статистических тестов следуют общему принципу, объясненному в предыдущем разделе. Говоря техническим языком,
эти тесты представляют собой отношение изменчивости, общей для рассматриваемых переменных, к полной изменчивости. Например, такой тест может представлять
собой отношение той части изменчивости WCC, которая определяется полом, к
полной изменчивости WCC (вычисленной для объединенной выборки мужчин и
женщин). Это отношение обычно называется отношением объясненной вариации к
полной вариации. В статистике термин объясненная вариация не обязательно означает, что вы даете ей "теоретическое объяснение". Он используется только для обозначения общей вариации рассматриваемых переменных, иными словами, для указания на то, что часть вариации одной переменной "объясняется" определенными
значениями другой переменной и наоборот.
Как вычисляется уровень статистической значимости? Предположим, вы
уже вычислили меру зависимости между двумя переменными (как объяснялось выше). Следующий вопрос, стоящий перед вами: "насколько значима эта зависимость?" Например, является ли 40% объясненной дисперсии между двумя переменными достаточным, чтобы считать зависимость значимой? Ответ: "в зависимости от
обстоятельств". Именно, значимость зависит в основном от объема выборки. Как
уже объяснялось, в очень больших выборках даже очень слабые зависимости между
переменными будут значимыми, в то время как в малых выборках даже очень сильные зависимости не являются надежными. Таким образом, для того чтобы определить уровень статистической значимости, вам нужна функция, которая представляла
бы зависимость между "величиной" и "значимостью" зависимости между переменными для каждого объема выборки. Данная функция указала бы вам точно
"насколько вероятно получить зависимость данной величины (или больше) в выборке данного объема, в предположении, что в популяции такой зависимости нет". Другими словами, эта функция давала бы уровень значимости (p -уровень), и, следовательно, вероятность ошибочно отклонить предположение об отсутствии данной зависимости в популяции. Эта "альтернативная" гипотеза (состоящая в том, что нет
зависимости в популяции) обычно называется нулевой гипотезой. Было бы идеально, если бы функция, вычисляющая вероятность ошибки, была линейной и имела
только различные наклоны для разных объемов выборки. К сожалению, эта функция
существенно более сложная и не всегда точно одна и та же. Тем не менее, в большинстве случаев ее форма известна, и ее можно использовать для определения
уровней значимости при исследовании выборок заданного размера. Большинство
этих функций связано с очень важным классом распределений, называемым нормальным.
64
Почему важно нормальное распределение? Нормальное распределение важно
по многим причинам. В большинстве случаев оно является хорошим приближением
функций, определенных в предыдущем разделе (более подробное описание см. в
разделе Все ли статистики критериев нормально распределены?). Распределение
многих статистик является нормальным или может быть получено из нормальных с
помощью некоторых преобразований. Рассуждая философски, можно сказать, что
нормальное распределение представляет собой одну из эмпирически проверенных
истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы. Точная форма нормального распределения (характерная "колоколообразная кривая") определяется
только двумя параметрами: средним и стандартным отклонением.
Характерное свойство нормального распределения состоит в том, что 68% всех его
наблюдений лежат в диапазоне ±1 стандартное отклонение от среднего, а диапазон
±2 стандартных отклонения содержит 95% значений. Другими словами, при нормальном распределении, стандартизованные наблюдения, меньшие -2 или большие
+2, имеют относительную частоту менее 5% (Стандартизованное наблюдение означает, что из исходного значения вычтено среднее и результат поделен на стандартное отклонение (корень из дисперсии)). Если у вас имеется доступ к пакету
STATISTICA, Вы можете вычислить точные значения вероятностей, связанных с различными значениями нормального распределения. Используя вероятностный калькулятор, например, если задать z-значение (т.е. значение случайной величины, имеющей стандартное нормальное распределение) равным 4, соответствующий вероятностный уровень, вычисленный STATISTICA будет меньше .0001, поскольку при
нормальном распределении практически все наблюдения (т.е. более 99.99%) попадут в диапазон ±4 стандартных отклонения.
Иллюстрация того, как нормальное распределение используется в статистических рассуждениях (индукция). Напомним пример, обсуждавшийся выше,
когда пары выборок мужчин и женщин выбирались из совокупности, в которой
среднее значение WCC для мужчин и женщин было в точности одно и то же. Хотя
наиболее вероятный результат таких экспериментов (одна пара выборок на эксперимент) состоит в том, что разность между средними WCC для мужчин и женщин
для каждой пары близка к 0, время от время появляются пары выборок, в которых
эта разность существенно отличается от 0. Как часто это происходит? Если объем
выборок достаточно большой, то разности "нормально распределены" и зная форму
нормальной кривой, вы можете точно рассчитать вероятность случайного получения
результатов, представляющих различные уровни отклонения среднего от 0 - значения гипотетического для всей популяции. Если вычисленная вероятность настолько
мала, что удовлетворяет принятому заранее уровню значимости, то можно сделать
65
лишь один вывод: ваш результат лучше описывает свойства популяции, чем "нулевая гипотеза". Следует помнить, что нулевая гипотеза рассматривается только по
техническим соображениям как начальная точка, с которой сопоставляются эмпирические результаты. Отметим, что все это рассуждение основано на предположении о
нормальности распределения этих повторных выборок (т.е. нормальности выборочного распределения). Это предположение обсуждается в следующем разделе.
Все ли статистики критериев нормально распределены? Не все, но большинство из них либо имеют нормальное распределение, либо имеют распределение, связанное с нормальным и вычисляемое на основе нормального, такое как t, F или хиквадрат. Обычно эти критериальные статистики требуют, чтобы анализируемые переменные сами были нормально распределены в совокупности. Многие наблюдаемые переменные действительно нормально распределены, что является еще одним
аргументом в пользу того, что нормальное распределение представляет "фундаментальный закон". Проблема может возникнуть, когда пытаются применить тесты, основанные на предположении нормальности, к данным, не являющимся нормальными (смотри критерии нормальности в разделах Непараметрическая статистика и
распределения или Дисперсионный анализ). В этих случаях вы можете выбрать одно
из двух. Во-первых, вы можете использовать альтернативные "непараметрические"
тесты (так называемые "свободно распределенные критерии", см. раздел Непараметрическая статистика и распределения). Однако это часто неудобно, потому что
обычно эти критерии имеют меньшую мощность и обладают меньшей гибкостью.
Как альтернативу, во многих случаях вы можете все же использовать тесты, основанные на предположении нормальности, если уверены, что объем выборки достаточно велик. Последняя возможность основана на чрезвычайно важном принципе,
позволяющем понять популярность тестов, основанных на нормальности. А именно,
при возрастании объема выборки, форма выборочного распределения (т.е. распределение выборочной статистики критерия , этот термин был впервые использован в
работе Фишера, Fisher 1928a) приближается к нормальной, даже если распределение
исследуемых переменных не является нормальным. Этот принцип иллюстрируется
следующим анимационным роликом, показывающим последовательность выборочных распределений (полученных для последовательности выборок возрастающего
размера: 2, 5, 10, 15 и 30), соответствующих переменным с явно выраженным отклонением от нормальности, т.е. имеющих заметную асимметричность распределения.
66
Однако по мере увеличения размера выборки, используемой для получения распределения выборочного среднего, это распределение приближается к нормальному.
Отметим, что при размере выборки n=30, выборочное распределение "почти" нормально (см. на близость линии подгонки). Этот принцип называется центральной
предельной теоремой (впервые этот термин был использован в работе Polya, 1920;
по-немецки "Zentraler Grenzwertsatz").
Как узнать последствия нарушений предположений нормальности? Хотя
многие утверждения других разделов Элементарных понятий статистики можно доказать математически, некоторые из них не имеют теоретического обоснования и
могут быть продемонстрированы только эмпирически, с помощью так называемых
экспериментов Moнте-Кaрло. В этих экспериментах большое число выборок генерируется на компьютере, а результаты полученные из этих выборок, анализируются
с помощью различных тестов. Этим способом можно эмпирически оценить тип и
величину ошибок или смещений, которые вы получаете, когда нарушаются определенные теоретические предположения тестов, используемых вами. Исследования с
помощью методов Монте- Карло интенсивно использовались для того, чтобы оценить, насколько тесты, основанные на предположении нормальности, чувствительны к различным нарушениям предположений нормальности. Общий вывод этих исследований состоит в том, что последствия нарушения предположения нормальности менее фатальны, чем первоначально предполагалось. Хотя эти выводы не означают, что предположения нормальности можно игнорировать, они увеличили общую популярность тестов, основанных на нормальном распределении.
67
Скачать