РОССИЙСКАЯ ГОСУДАРСТВЕННАЯ АКАДЕМИЯ

реклама
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Программа дисциплины для аспирантов
СОДЕРЖАНИЕ
I. Организационно-методический раздел ………………..………..
II. Содержание курса .……………………………………………….
III. Распределение часов по темам и видам работ …………………
IV. Форма итогового контроля ……………………………………...
2
I. ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЙ РАЗДЕЛ
Программа предназначена для обучения аспирантов Российского
государственного университета физической культуры, спорта и туризма.
1. Цель курса
Ознакомить аспирантов с методами сбора, статистической обработки
и анализа данных при проведении научных исследований.
2. Задачи курса
1. Овладеть теоретическими знаниями и практическими умениями выбора и
использования методов статистической обработки и анализа данных,
полученных в результате научных исследований.
2. Разобраться
в
достоинствах
и
ограничениях
того
или
иного
статистического метода и области его применения.
3. Освоить технологию статистического анализа данных с использованием
пакета прикладных программ STATISTICA (StatSoft).
3. Место курса в профессиональной подготовке
Необходимость введения учебного курса «Математическая статистика»
обусловлена
тем,
что
современный
уровень
научных
исследований
практически в любой области знаний, особенно в науках о человеке,
предполагает
обязательное
использование
методов
математической
статистики, в противном случае достоверность результатов и выводов нельзя
считать научно обоснованными.
Понимание сущности методов математической статистики является
необходимым условием правильного планирования исследования, что дает
возможность ученому правильно организовать свою работу еще на этапе
формулирования цели и задач исследования, а значит повысить ее
эффективность и экономичность.
Знание методов математической статистики необходимо не только для
проведения собственных научных исследований, но и для понимания и
усвоения огромного потока научной информации, публикуемой в учебной и
научной литературе.
3
4. Требования к уровню освоения содержания курса
В результате изучения курса аспирант должен знать основные понятия
и методы математической статистики, разбираться в том, для решения каких
исследовательских
задач
могут
быть
использованы
те
или
иные
статистические процедуры, в чем их особенности и возможности, уметь
применять соответствующие методы обработки и анализа данных в
практической работе.
Аспирант должен:
- знать основные типы данных, с которыми исследователь сталкивается
в работе и особенности шкал измерений, в которых они получены. Уметь
подготавливать данные для статистического анализа и управлять ими,
используя пакеты статистических программ;
- знать основную идею выборочного метода исследования, виды
распределения изучаемых признаков и основные описательные статистики
качественных и количественных данных, уметь их рассчитывать с помощью
компьютерных программ;
- знать методы проверки статистических гипотез для количественных и
качественных
данных
и
уметь
их
использовать
при
решении
соответствующих исследовательских задач;
- знать методы анализа связей (корреляция) и вида зависимости одного
признака от одного или нескольких признаков (регрессионный анализ) и
уметь их применять на практике;
- знать основную идею и область применения однофакторного
дисперсионного анализа;
-
знать
основные
методы
многомерной
статистики.
Овладеть
технологией статистического анализа данных с использованием пакета
прикладных программ STATISTICA.
II. СОДЕРЖАНИЕ КУРСА
Организация учебного процесса предусматривает лекционный курс,
4
семинарские занятия и самостоятельную работу аспиранта, включающие в
себя закрепление теоретических знаний и практическую работу по
овладению технологиями обработки данных и их анализе на компьютере в
системе STATISTICA.
1. Темы и краткое содержание
Тема 1. Выборочный метод. Статистические оценки параметров
распределения. Задачи математической статистики. Понятие о случайной
величине, генеральной и выборочной совокупности. Способы формирования
выборки. Эмпирическая и теоретическая функции распределения и их
графическое
представление
(полигон
частот
и
гистограмма).
Виды
распределений признака (равномерное, биномиальное, Паретто, Хи-квадрат и
др.). Закон нормального распределения.
Типы
данных
и
соответствующие
им
шкалы
измерений:
количественные (дискретные, непрерывные, интервальные, относительные) и
качественные (номинальные, дихотомические, порядковые).
Классификация статистических методов: по количеству анализируемых
признаков (одномерные, двухмерные, многофакторные); по статистическим
принципам,
лежащим
в
основе
методов
(параметрические
и
непараметрические); по зависимости или независимости сопоставляемых
выборок (связанные и несвязанные).
Меры
центральной
количественных
(среднее
тенденции
и
показатели
арифметическое,
вариативности
дисперсия,
среднее
квадратическое отклонение, размах вариации) и качественных (медиана,
мода, перцентили, квартили, децили) данных.
Тема 2. Параметрические методы проверки статистических
гипотез. Понятие о статистической гипотезе. Нулевая и конкурирующая
(альтернативная) гипотезы. Критерий проверки статистической гипотезы.
5
Сравнение двух независимых выборок по одному признаку (t-критерий
Стьюдента для независимых выборок). Сравнение двух зависимых выборок
по одному признаку (t-критерий Стьюдента для связанных выборок).
Сравнение двух дисперсий по критерию Фишера. Сравнение трех и более
независимых выборок по одному признаку (однофакторный дисперсионный
анализ). Сравнение трех и более зависимых выборок по одному признаку
(критерий Кокрана).
Тема 3. Непараметрические методы проверки статистических
гипотез. Причины использования непараметрической статистики. Критерии
проверки статистической значимости различий двух несвязанных (критерий
Манна-Уитни, Колмогорова-Смирнова) и зависимых (критерий Вилкоксона,
критерий знаков) выборок по одному признаку.
Критерии проверки статистической значимости различий трех и более
несвязанных (ANOVA по Краскелу-Уолису, медианный критерий) и
связанных (ANOVA по Фридману) выборок по одному признаку.
Тема 4. Корреляционный анализ. Функциональная и корреляционная
зависимости. Оценка величины, направления и формы связи. Графическое
представление связи. Парная, множественная и частная корреляции.
Параметрические
(коэффициенты
корреляции
Браве-Пирсона
и
корреляционное отношение) и непараметрические (Спирмена, Кендалла,
гамма, критерий Хи-квадрат) методы оценки связи.
Доверительные
границы
коэффициента
корреляции,
оценка
статистической значимости коэффициента корреляции, сравнение двух
коэффициентов корреляции.
Различие между причинно-следственными и статистическими связями.
Проблема ложных корреляций.
Тема 5. Регрессионный анализ. Регрессионный анализ – один из
6
методов статистического моделирования. Парная и множественная линейная
регрессия. Расчет уравнения регрессии и интерпретация его коэффициентов.
Нелинейная регрессия (логистическая регрессия). Порядковая регрессия.
Область применения регрессионного анализа.
Тема 6. Дисперсионный анализ. Основные задачи дисперсионного
анализа. Классическая модель однофакторного дисперсионного анализа по
Фишеру. Понятие об общей, факторной (межгрупповой) и остаточной
(внутригрупповой)
дисперсии.
Отличие
классической
модели
от
«обобщенной линейной модели» дисперсионного анализа. Однофакторный
дисперсионный анализ с повторными измерениями. Оценка силы влияния и
статистической значимости изучаемого фактора на зависимую переменную.
Понятие о внутриклассовом коэффициенте корреляции и область его
применения.
Тема 7. Методы многомерной статистики. Многофакторный анализ
данных.
Основные
идеи
многофакторного
дисперсионного
анализа,
дискриминантного анализа, кластерного анализа, факторного анализа.
Проверка
работоспособности
многофакторных
моделей.
Понятие
о
планировании эксперимента.
Области применения и ограничения в использовании методов
многомерной статистики в научных исследованиях.
2. Перечень примерных контрольных вопросов и заданий для
самостоятельной работы
Тема 1. Что изучает математическая статистика? В чем суть
выборочного метода исследования? Что такое репрезентативность выборки?
Что собою представляет функция распределения случайной величины? В чем
особенность закона нормального распределения случайной величины?
Дайте определение понятию «измерение». Какие шкалы измерений Вы
7
знаете и какие типы данных соответствуют этим шкалам? Приведите
примеры данных, относящиеся к порядковому типу. Как связаны между
собой типы данных и статистические методы их обработки?
Какие меры центральной тенденции используют для описания
количественных
вариативности
и
качественных
предпочтительнее
данных?
Какой
использовать
при
из
показателей
характеристике
выборочных данных, имеющих нормальное распределение?
Тема 2. Чем отличаются статистические гипотезы от научных или тех,
которые мы формулируем в обычной жизни?
Приведите примеры
статистических гипотез. Что такое критерий проверки статистической
гипотезы? Как выбирается уровень значимости при проверке гипотез?
Как проверить соответствие эмпирического распределения выборки
закону нормального распределения случайной величины? Чем отличаются
связанные выборки от несвязанных? В чем отличие процедуры проверки
значимости различий между двумя средними арифметическими по tкритерию Стьюдента для связанных и несвязанных выборок? Как сравнить
между собой две дисперсии? Как проверить значимость различий дисперсий,
используя статистические таблицы?
Как определить статистическую значимость различий между тремя и
более средними арифметическими для независимых выборок, имеющих
нормальное распределение?
Тема 3. В чем особенность непараметрических критериев проверки
статистических гипотез и их отличие от параметрических критериев? Можно
ли непараметрические критерии применять для проверки значимости
различий количественных данных? В каких случаях используются критерии
Манна-Уитни и Вилкоксона? Каков алгоритм проверки статистической
гипотезы?
8
Тема
4.
В
чем
отличие
функциональной
зависимости
от
корреляционной? Как определить направление и форму связи? Как
графически представить зависимость между двумя переменными? Чем
отличается множественная корреляция от частной? Приведите примеры
использования множественной корреляции. В чем отличие причинноследственных связей от корреляционных?
В каких случаях используется коэффициент корреляции БравеПирсона? В чем особенность коэффициентов корреляции, применяемых в
шкалах наименований и порядка? В каких случаях при оценке связи
используется критерий Хи-квадрат?
О чем говорят доверительные границы коэффициента корреляции и как
они связаны с объемом выборки? Как оценить статистическую значимость
коэффициента корреляции? Как сравнить между собой два коэффициента
корреляции?
Тема 5. В чем отличие регрессионного анализа от корреляционного?
Как определить коэффициенты линейного уравнения регрессии для
количественных данных? Как определить дисперсию результатов измерений
относительно линии регрессии? Для решения каких исследовательских задач
можно использовать парную регрессию? Приведите примеры использования
множественной регрессии в решении исследовательских задач? Перечислите
возможные ограничения в использовании
множественных уравнений
регрессии в качестве статистических моделей.
Тема 6. В чем основная идея дисперсионного анализа. Чем отличается
классическая модель дисперсионного анализа от «обобщенной линейной
модели»? Между какими статистическими показателями определяется
статистическая значимость различий в дисперсионном анализе?
Что такое результативный признак, фактор и его градации? Из каких
частей
состоит
общая
дисперсия
в
однофакторном
дисперсионном
9
комплексе?
Как
определит
силу
влияния
изучаемого
фактора
на
результативный признак? Как доказать статистическую значимость влияния
фактора? В чем особенность процедуры определения силы влияния фактора в
непараметрическом однофакторном дисперсионном анализе для порядковых
данных?
Тема
7.
Раскройте
основную
идею
использования
методов
многофакторного анализа данных. В чем сущность многофакторного
дисперсионного анализа, дискриминантного анализа, кластерного анализа и
факторного анализа? Приведите примеры использования этих методов в
научных исследованиях.
Каждая из тем курса должна быть проработана с использованием
пакета прикладных программ STATISTICA. Данные для анализа можно взять
из примеров, содержащихся в статистическом пакете, или использовать
результаты собственных научных исследований.
3. Примерный перечень вопросов к экзамену по всему курсу
1. Понятие
об
измерении.
количественные
относительные)
Шкалы
(дискретные,
измерений.
Типы
непрерывные,
данных:
интервальные,
и качественные (номинальные, дихотомические,
порядковые).
2. Предмет
и
задачи
математической
статистики.
Генеральная
совокупность и выборка. Виды распределений случайной величины и
их графическое представление. Закон нормального распределения.
3. Меры
центральной
тенденции
и
показатели
вариативности
и
показатели
вариативности
количественных данных.
4. Меры
центральной
тенденции
качественных данных.
5. Проверка
статистических
непараметрические
критерии
гипотез.
проверки
Параметрические
статистических
Уровень значимости и доверительная вероятность.
и
гипотез.
10
6. Оценка
статистической
арифметических
значимости
связанных
и
различий
двух
несвязанных
средних
выборок
по
количественному признаку (параметрические критерии).
7. Оценка статистической значимости различий связанных и несвязанных
выборок по качественному признаку (непараметрические критерии).
8. Параметрические и непараметрические критерии проверки значимости
различий трех и более связанных и несвязанных выборок по
количественному и качественному признакам.
9. Корреляционный
анализ.
Функциональная
и
корреляционная
зависимости. Корреляционное поле. Оценка величины, направления и
формы связи. Разновидности коэффициентов корреляции и область их
применения.
10.Парная (линейная и нелинейная), множественная и частная корреляция.
Оценка
доверительных
границ
и
статистической
значимости
коэффициентов корреляции.
11.Методы оценки статистических связей для качественных признаков,
относящихся к номинальной шкале и шкале порядка. Проблема
ложных корреляций.
12.Регрессионный
множественная
анализ.
регрессия.
Парная
(линейная
Уравнение
и
и
линия
нелинейная)
регрессии
и
для
количественных данных. Практическое использование регрессионного
анализа.
13. Дисперсионный
дисперсионного
анализ.
анализа
Классическая
по
модель
Фишеру.
однофакторного
Общая,
факторная
(межгрупповая) и остаточная (внутригрупповая) дисперсии. Оценка
силы влияния и значимости изучаемого фактора на результативный
признак.
14.Обобщенная
линейная
модель
дисперсионного
анализа.
Однофакторный дисперсионный анализ с повторными измерениями.
15.Однофакторный дисперсионный анализ для качественных данных.
11
16.Основные идеи методов многомерной статистики. Многофакторный
дисперсионный анализ. Дискриминантный анализ. Кластерный анализ.
Фактроный анализ.
III. РАСПРЕДЕЛЕНИЕ ЧАСОВ КУРСА ПО ТЕМАМ И ВИДАМ РАБОТ
Курс «Математическая статистика» общим объемом 120 час. изучается
аспирантами в течение второго года обучения.
Наименование тем курса
Всего
Тема 1. Выборочный метод. Статистические оценки
параметров распределения
Тема 2. Параметрические методы проверки
статистических гипотез
Тема 3. Непараметрические методы проверки
статистических гипотез
Тема 4. Корреляционный анализ
Тема 5. Регрессионный анализ
Тема 6. Дисперсионный анализ
Тема 7. Методы многомерной статистики
Всего:
16
Количество часов
в том числе
Лекции Семинары Самост.
Работа
4
6
8
20
4
6
10
16
2
6
8
20
16
24
8
120
2
2
4
2
20
6
6
8
2
40
10
8
12
4
60
IV. ФОРМА ИТОГОВОГО КОНТРОЛЯ
Изучение курса завершается экзаменом. Обязательным условием
допуска аспирантов к экзамену является сдача текущих зачетов по трем
первым темам курса.
УЧЕБНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ КУРСА
1. Боровиков В. STATISTICA. Искусство анализа данных на компьютере:
Для профессионалов. 2-е изд. (+CD). – СПб.: Питер, 2003. – 688с.
2. Гласс Дж., Стенли Дж. Статистические методы в педагогике и
психологии. – М.: Прогресс, 1976. – 495 с.
3. Гмурман В.Е. Теория вероятностей и математическая статистика. – М.:
Высшая школа, 2000. – 473 с.
12
4. Зациорский В.М. Осторожно: статистика! // Теория и практика физ.
культуры. - 1989. - № 2. - С. 52-55.
5. Плохинский
Н.А.
Биометрия.
2-е
издание.
–
М.:
Издательство
Московского университета, 1970. – 367 с.
6. Реброва О.Ю. Статистический анализ медицинских данных. Применение
пакета
прикладных
программ
МедиаСфера, 2006. – 312 с.
STATISTICA.
2-е
издание.
М.:
Скачать