Лекция 2 Доверительный интервал в программе «Описательная статистика» Распределение Стьюдента Доверительный интервал Задача на практике - при ограниченной выборке оценить точность и надежность вычисления точечной оценки параметра распределения. 2 НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И ПРЕДПОСЫЛКИ ДЛЯ ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ Дано: случайная величина X, закон распределения которой содержит неизвестный параметр а (например, матожидание или дисперсию) 3 ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ Дано: n значений случайной величины X; истинные матожидание M и дисперсия D неизвестны. Задача: найти доверительный интервал для математического ожидания. 4 НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И ПРЕДПОСЫЛКИ ДЛЯ ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ ~ а Оценка – случайная величина, зависит от закона распределения случайной величины X и от числа опытов n 5 НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И ПРЕДПОСЫЛКИ ДЛЯ ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ ~ а Требования к : 6 НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И ПРЕДПОСЫЛКИ ДЛЯ ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ ~ а Требования к при увеличении числа опытов оценка параметра должна приближаться (сходиться по вероятности) к а - СОСТОЯТЕЛЬНОСТЬ; 7 НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И ПРЕДПОСЫЛКИ ДЛЯ ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ ~ Требования к а : при увеличении числа опытов должна приближаться а(сходиться по вероятности) к СОСТОЯТЕЛЬНОСТЬ; не должно быть систематической ошибки при подсчете оценки–НЕСМЕЩЕННОСТЬ ~ M[ а ] = а ; 8 Основные термины - доверительная вероятность (confidence coefficient) =1- - уровень значимости (significance level); I - доверительный интервал; - предельное значение ошибки при оценке параметра a1,a2 – доверительные границы. I a1 а ~ а a2 9 ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ (ИДЕЯ) P(x) 0.25 0.2 Площадь = 0.15 0.1 0.05 0 0 5 M*10 15 20 25 Плотность распределения для оценки матожидания 10 ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ (идея) 1,2 F(x) 1 0,8 0,6 0,4 0,2 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 x Функция распределения оценки матожидания 11 Идея построения доверительного интервала (интервальной оценки) 1) по сделанной выборке рассчитывают точечную оценку неизвестной ~; характеристики – а 12 Идея построения доверительного интервала (интервальной оценки) 2) задают доверительную вероятность (статистическую надежность) - (обычно выбирают или 0.9, или 0.95, или 0.99); 13 Идея построения доверительного интервала (интервальной оценки) 3) находят такое число , чтобы выполнялось соотношение: P( а~ < а < а~ + )= , 14 Идея построения доверительного интервала (интервальной оценки) P( а~ - < а < а~ + )= , ВЕРОЯТНОСТЬ ТОГО, ЧТО ИНТЕРВАЛ ~ а - ; а~ + НАКРОЕТ ХАРАКТЕРИСТИКУ а РАВНА . 15 Доверительный интервал – интервал значений параметра a, совместимый с опытными данными и не противоречащий им с вероятностью . 16 Физический смысл: при подсчете оценки параметра a приблизительно в *100% случаев эта оценка не выйдет за границы a . 17 ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ Доверительный интервал уменьшается при увеличении числа опытов n и уменьшении доверительной вероятности. Доверительный интервал увеличении дисперсии отклонения ) увеличивается при (среднеквадратического 18 Подсчет доверительного интервала для математического ожидания (случай, когда дисперсия генеральной совокупности не известна и число опытов мало) 19 Доказано, что при НОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ случайной величины X случайная величина t s X n s 1 n 1i n ( xi - мат ожид СВ x) 2 1 Имеет распределение Стьюдента с n-1 степенями свободы 20 Доверительный интервал I X t *s n t = СТЬЮДРАСПОБР ( , n-1) для Excel 2003, 2007 t = СТЬЮДЕНТ.ОБР.2Х ( , n-1) для Excel 2010 и выше t = СТЬЮДЕНТ.ОБР(1- /2, n-1) для Excel 2010 и выше =1- ; 21 Примечание Известно, что этот доверительный интервал является робастным, т.е. он нечувствителен к умеренным отклонениям от предположения о нормальности распределения. 22 Распределение Стьюдента Это распределение получило свое название от псевдонима Student, которым английский ученый Госсет подписывал свои работы по статистике. 23 Распределение Стьюдента Пусть X0, X1, , Xk, независимы и имеют стандартное нормальное распределение. Распределение случайной величины tk X0 2 2 X 1 ...X k k X0 2 k называют распределением Стьюдента с k степенями свободы и обозначают Tk . 24 Плотность распределения Стьюдента с k степенями свободы 25 ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ СТЬЮДЕНТА ПО СРАВНЕНИЮ С ПЛОТНОСТЬЮ СТАНДАРТНОГО НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ. 26 Функция распределения Стьюдента 27 Теоретические значения Математическое ожидание 0 Дисперсия k/(k-2), k-число степеней свободы 28 Свойства распределения Стьюдента Если случайная величина tk ~Tk, то и -tk ~Tk. 1.Симметричность. 2. Асимптотическая нормальность. Распределение Стьюдента слабо сходится к стандартному нормальному распределению при увеличении числа степеней свободы. 3. Распределение Стьюдента с одной степенью свободы есть стандартное распределение Коши. 29 Функции и программы в Excel (OpenOffice) СТЬЮДЕНТ.РАСП СТЬЮДРАСП (TDIST); СТЬЮДРАСПОБР (TINV); СТЬЮДЕНТ.ОБР; Анализ данных: Описательная статистика Двухвыборочный t-тест 30 Применение Для построения доверительного интервала для оценки математического ожидания •Для проверки гипотез, связанных с математическим ожиданием 31 Задание . Распределение Стьюдента и доверительный интервал для оценки математического ожидания 1. Для выборки из задания п. 2 (длина слов) подсчитать доверительный интервал для оценки М.О. по формуле. Сравнить с результатом, полученным по программе «Описательная статистика». 2. Найти -квантили Tn , где n- номер по журналу, =0,1; 0,05.