Лекция 2  Доверительный

реклама
Лекция 2
 Доверительный
интервал в программе
«Описательная
статистика»
 Распределение
Стьюдента
Доверительный интервал
Задача на практике - при ограниченной выборке
оценить точность и надежность вычисления точечной
оценки параметра распределения.
2
НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И ПРЕДПОСЫЛКИ ДЛЯ
ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ
Дано: случайная величина X, закон распределения
которой содержит неизвестный параметр а
(например, матожидание или дисперсию)
3
ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ОЦЕНКИ
МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ
Дано: n значений случайной величины X;
истинные матожидание M
и дисперсия D
неизвестны.
Задача: найти доверительный интервал для
математического ожидания.
4
НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И ПРЕДПОСЫЛКИ ДЛЯ
ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ
~
а
Оценка
– случайная величина, зависит от
закона распределения случайной величины X
и от числа опытов n
5
НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И ПРЕДПОСЫЛКИ ДЛЯ
ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ
~
а
Требования к
:
6
НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И ПРЕДПОСЫЛКИ ДЛЯ
ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ
~
а
Требования к
при увеличении числа опытов оценка параметра
должна
приближаться
(сходиться
по
вероятности) к а - СОСТОЯТЕЛЬНОСТЬ;
7
НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И ПРЕДПОСЫЛКИ ДЛЯ
ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ
~
Требования к а :
при увеличении числа опытов должна приближаться
а(сходиться
по
вероятности)
к
СОСТОЯТЕЛЬНОСТЬ;
не должно быть систематической ошибки при
подсчете оценки–НЕСМЕЩЕННОСТЬ
~
M[ а ] = а ;
8
Основные термины
- доверительная вероятность (confidence coefficient)
=1- - уровень значимости (significance level);
I - доверительный интервал;
- предельное значение ошибки при оценке параметра
a1,a2 – доверительные границы.
I
a1
а
~
а
a2
9
ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ОЦЕНКИ
МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ (ИДЕЯ)
P(x)
0.25
0.2
Площадь
=
0.15
0.1
0.05
0
0
5
M*10
15
20
25
Плотность распределения для оценки
матожидания
10
ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ОЦЕНКИ
МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ (идея)
1,2
F(x)
1
0,8
0,6
0,4
0,2
0
-5
-4
-3
-2
-1
0
1
2
3
4
5
x
Функция распределения оценки матожидания
11
Идея построения доверительного интервала
(интервальной оценки)
1) по сделанной выборке рассчитывают
точечную
оценку
неизвестной
~;
характеристики – а
12
Идея построения доверительного интервала
(интервальной оценки)
2)
задают доверительную вероятность
(статистическую надежность)
- (обычно
выбирают или 0.9, или 0.95, или 0.99);
13
Идея построения доверительного интервала
(интервальной оценки)
3) находят такое число
, чтобы выполнялось
соотношение:
P( а~ < а < а~ + )= ,
14
Идея построения доверительного интервала
(интервальной оценки)
P( а~ -
< а < а~ + )= ,
ВЕРОЯТНОСТЬ ТОГО, ЧТО ИНТЕРВАЛ
~
а
-
; а~ +
НАКРОЕТ ХАРАКТЕРИСТИКУ
а РАВНА .
15
Доверительный интервал – интервал
значений параметра a, совместимый с
опытными данными и не
противоречащий им с вероятностью .
16
Физический смысл: при подсчете
оценки параметра a приблизительно в
*100% случаев эта оценка не выйдет за
границы a .
17
ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ОЦЕНКИ
МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ
Доверительный интервал уменьшается при увеличении
числа опытов n и уменьшении доверительной
вероятности.
Доверительный
интервал
увеличении
дисперсии
отклонения )
увеличивается
при
(среднеквадратического
18
Подсчет доверительного интервала для
математического ожидания (случай, когда дисперсия
генеральной совокупности не известна и число опытов
мало)
19
Доказано, что при НОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ
случайной величины X случайная величина
t
s
X
n
s
1
n 1i
n
( xi
- мат ожид СВ
x)
2
1
Имеет распределение Стьюдента с n-1 степенями свободы
20
Доверительный интервал
I
X
t *s
n
t = СТЬЮДРАСПОБР ( , n-1) для Excel 2003, 2007
t = СТЬЮДЕНТ.ОБР.2Х ( , n-1) для Excel 2010 и выше
t = СТЬЮДЕНТ.ОБР(1- /2, n-1) для Excel 2010 и выше
=1- ;
21
Примечание
Известно,
что
этот
доверительный
интервал
является робастным, т.е. он
нечувствителен к умеренным
отклонениям от предположения о
нормальности распределения.
22
Распределение Стьюдента
Это распределение получило
свое название от псевдонима
Student,
которым
английский
ученый Госсет подписывал свои
работы по статистике.
23
Распределение Стьюдента
Пусть X0, X1, , Xk,
независимы и
имеют
стандартное
нормальное
распределение.
Распределение
случайной величины
tk
X0
2
2
X 1 ...X k
k
X0
2
k
называют
распределением
Стьюдента
с k степенями свободы и обозначают Tk
.
24
Плотность распределения
Стьюдента с k степенями свободы
25
ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ СТЬЮДЕНТА ПО
СРАВНЕНИЮ С ПЛОТНОСТЬЮ СТАНДАРТНОГО
НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ.
26
Функция распределения
Стьюдента
27
Теоретические значения
Математическое ожидание 0
Дисперсия k/(k-2),
k-число степеней свободы
28
Свойства распределения
Стьюдента
Если случайная
величина tk ~Tk, то и -tk ~Tk.
1.Симметричность.
2. Асимптотическая нормальность. Распределение Стьюдента
слабо
сходится к стандартному нормальному распределению при увеличении
числа степеней свободы.
3. Распределение Стьюдента с одной степенью свободы есть стандартное
распределение Коши.
29
Функции и программы в Excel
(OpenOffice)
СТЬЮДЕНТ.РАСП
СТЬЮДРАСП (TDIST);
СТЬЮДРАСПОБР (TINV);
СТЬЮДЕНТ.ОБР;
Анализ данных: Описательная
статистика
Двухвыборочный t-тест
30
Применение
Для построения доверительного
интервала для оценки
математического ожидания
•Для проверки гипотез, связанных с
математическим ожиданием
31
Задание . Распределение Стьюдента и
доверительный интервал для оценки
математического ожидания
1. Для выборки из задания п. 2 (длина
слов) подсчитать доверительный интервал
для оценки М.О. по формуле. Сравнить с
результатом, полученным по программе
«Описательная статистика».
2. Найти -квантили Tn , где n- номер по
журналу, =0,1; 0,05.
Скачать