Распределение Стьюдента (t

advertisement
Занятие 2. Распределения и
доверительные интервалы
𝑥1 , 𝑥2 , … , 𝑥𝑛
𝑥1 , 𝑥2 , … , 𝑥𝑛
Теоретическая часть
1. Распределение случайной величины и функция плотности распределения
2. Нормальное распределение, математическое ожидание и дисперсия
3. Распределение Стьюдента (t-распределение)
4. Квантили и доверительные интервалы
Практическая часть
1. Вычисление доверительных интервалов
2. Построение гистограмм нормального распределения или tраспределения (на выбор)
3. Критерий трёх сигм – практическое использование
Рейтинг и получение зачёта
Подшкалы рейтинга:
1. Присутствие и активность на занятии (2 выхода к доске = 1 посещение)
2. Контрольные работы
3. Домашние задания
Условия получения зачёта:
1. Балл по каждой из трёх подшкал – не менее 75% от максимума
2. Все контрольные работы и домашние задания должны быть выполнены
3. Если рейтинг по подшкале 65-75% - учет «избыточных» баллов из других
подшкал
4. Если посещено менее 75% занятий – дополнительные домашние задания
Функции распределения и плотности распределения
Функция распределения вероятностей 𝐹 𝑥 = 𝑃(𝑋 < 𝑥) – вероятность того,
что случайная величина X примет значение меньшее, чем x
Свойства:
• Определена на всей числовой прямой
• Если 𝑥1 < 𝑥2 , то 𝐹 𝑥1 ≤ 𝐹 𝑥2
• 𝐹 −∞ = 0; 𝐹 +∞ = 1
• 𝐹 𝑥 непрерывна справа
Плотность распределения вероятностей непрерывной случайной величины
𝑝 𝑥 =
𝑑𝐹(𝑥)
𝑑𝑥
Свойства:
+∞
• −∞ 𝑝 𝑥 𝑑𝑥 = 1
• 𝐹 𝑥 =
𝑥
𝑝
−∞
𝜉 𝑑𝜉
• 𝑃 𝑎<𝑥<𝑏 =
𝑏
𝑝
𝑎
𝜉 𝑑𝜉
Нормальное распределение
Мат. ожидание
Плотность вероятности
𝑝 𝑥 =
1
𝜎 2𝜋
𝑥−𝜇 2
−
𝑒 2𝜎2
Оценка параметров
нормального распределения
(𝒏 > 𝟐𝟎)
1
𝜇=𝑥=
𝑛
𝜎=𝑠=
𝑥𝑖
𝑖
2
𝑖 𝑥𝑖
𝑛−1
Стандартное норм. распр.
𝜎 = 1; 𝜇 = 0
Полуширина
Оценка дисперсии
𝐷 𝑋 =𝑀 𝑋−𝑀 𝑋
2
= 𝑀 𝑋2 − 𝑀 𝑋
2
X – случайная величина, M – математическое ожидание
Среднеквадратичное отклонение
∗
𝐷 =
𝑖
𝑥𝑖 − 𝑥
𝑁
𝐷∗
=
𝑁
2
1
=
𝑁
2
𝑖 𝑥𝑖
−
𝑥𝑖2
𝑖
− 2𝑥𝑖 𝑥 + 𝑥
2
𝑖 𝑥𝑖 −
𝑁2
2
2
𝑖<𝑗 𝑥𝑖 𝑥𝑗
1
=
𝑁
=
𝑥𝑖2
𝑖
(𝑁 − 1)
2
−𝑥 =
2
𝑖 𝑥𝑖
−2
2
𝑖 𝑥𝑖
𝑁
−
𝑖 𝑥𝑖
𝑁2
2
𝑖<𝑗 𝑥𝑖 𝑥𝑗
𝑁2
Математическое ожидание среднеквадратичного отклонения
𝑁−1
2
𝑁−1
2 𝑁2 − 𝑁
2
∗
2
𝑀𝐷 =
𝑀 𝑥𝑖 − 2
𝑀 𝑥𝑖 𝑀 𝑥𝑗 =
𝑀𝑋 − 2
𝑀𝑋
𝑁2
𝑁
𝑁
𝑁
2
𝑖
=
𝑁−1
𝑀 𝑋2 − 𝑀 𝑋
𝑁
Поправка Бесселя
(Bessel’s correction)
𝑖<𝑗
2
=
𝑁−1
𝐷(𝑋)
𝑁
2
=
Центральная предельная теорема
Если 𝑋𝑖 - независимые и одинаково
распределенные случайные величины с
конечными 𝜎 2 и 𝜇, то
𝑛
𝑖=1 𝑋𝑖
− 𝑛𝜇
→ 𝑁(0; 1) при 𝑛 → ∞
𝜎 𝑛
n=1
n=2
n=3
n=5
Распределение Стьюдента (t-распределение)
Плотность вероятности
𝑛+1
𝑛+1
− 2
2
Γ
𝑦
2
𝑝 𝑦 =
1
+
𝑛
𝑛
𝜋𝑛Γ 2
Оценка доверительного
интервала
1
𝑥=
𝑛
𝑥𝑖
𝑠=
𝑡 𝑓 =
𝑥−𝜇
𝑠/ 𝑛
𝑖
2
𝑖 𝑥𝑖
𝑛−1
𝑛 – число точек
𝑓 = 𝑛 − 1 – число степеней
свободы
𝑡=
𝑌0
1
𝑓
𝑓
2
𝑖=1 𝑌𝑖
Yi – независимые
стандартные нормальные
случайные величины
При 𝑛 → ∞ переходит в нормальное
Квантили
Квантиль (α-квантиль) 𝑥𝛼 – число, такое, что заданная случайная величина превышает
его лишь с фиксированной вероятностью 1 − 𝛼 , т.е. 𝑃 𝑋 ≤ 𝑥𝛼 = 𝛼
Квантиль рассчитывается по уравнению: 𝐹 𝑥𝛼 = 𝛼
Двухсторонний квантиль
Определение
Случай симметричного
распределения
𝑃 𝑥1−𝛼 ≤ 𝑋 ≤ 𝑥1+𝛼 = 𝛼
2
2
𝐹 𝑥1+𝛼 − 𝐹 𝑥1−𝛼 = 𝛼
2
𝑥1+𝛼 = −𝑥1−𝛼
2
2
2
Пример: 𝛼 = 0.95
1 + 𝛼 1 + 0.95
=
= 0.975
2
2
1 − 𝛼 1 − 0.95
=
= 0.025
2
2
𝒙𝟏−𝜶
𝟐
𝒙𝟏+𝜶
𝟐
Доверительные интервалы
1. Рассчитать 𝒙 (среднее значение) и 𝒔 (стандартное отклонение)
Функции MS Excel: СРЗНАЧ, СТАНДОТКЛОН
𝜇=𝑥=
1
𝑛
𝑥𝑖
𝑖
𝑠=
2
𝑖 𝑥𝑖
𝑛−1
2. Найти двухсторонний квантиль t-распределения для заданной вероятности
(обычно p=95%) и числа степеней свободы (f = n – 1)
Функции MS Excel: СРЗНАЧ, СТАНДОТКЛОН
(1) чем выше p, тем больше значение квантиля
(2) чем больше f, тем меньше значение квантиля
(3) для 𝑓 ≈ 100 – квантили как для нормального распределения (например,
t(p=0.95, f=100)=1.98
(4) различайте p и 1-p, одно- и двухсторонние квантили!
3. Рассчитать стандартное отклонение среднего значения и доверительный
интервал
𝑠𝑥 = 𝑠/ 𝑛
Δ𝑥 = 𝑠𝑥 𝑡(𝑝; 𝑛 − 1)
Грубые промахи; критерий 3σ
Алгоритм
1. Рассчитать среднее значение
2. Рассчитать стандартное отклонение
(исключив предполагаемый промах)
3. Если предполагаемый промах за
пределами 3s, то исключить его
4. Применять для n=20-100
Задача: найти промах в выборке
8,07
8,05
8,10
8,16
8,18
8,14
8,06
8,10
8,22
8,06
8,04
8,11
8,09
8,14
8,11
8,15
8,16
8,50
8,09
8,14
8,12
8,13
8,18
8,20
8,17
Download