Г о с уд а р с тв е н н о е о б р а з о в а те л ь н о е уч р е ж д е н и е в ы с ше г о п р о ф е с с и о н а л ь н о г о о б р а з о в а н и я Московский гос ударственный индустриальный университет (ГОУ МГИУ) Факультет экономики, менеджмента и информационных технологий Кафедра математических методов в экономике Лекции по учебной дисциплине Теория вероятностей и математическая статистика Часть II. Математическая статистика Составил Алибеков И.Ю. Москва, 2011 Содержание Тема 1. Предмет и основные задачи математической статистики Тема 2. Выборочный метод. Генеральная и выборочная совокупности. Тема 3. Полигон, гистограмма и кумулятивная кривая. 3.1. Контрольные вопросы. Тема 4. Статистические оценки параметров распределения. 4.1. Понятие статистической оценки параметра распределения. 4.2. Требования, предъявляемые к оценкам параметров распределения. Тема 5. Точечные оценки параметров распределения. 5.1. Точечная оценка математического ожидания по выборочному среднему. 5.2. Точечная оценка генеральной дисперсии по выборочной дисперсии. 5.3. Точечная оценка момента связи между двумя случайными величинами. Тема 6. Интервальные оценки параметров распределения. 6.1. Понятие интервальной оценки параметра распределения. 6.2. Методы построения доверительных интервалов параметров распределения 6.2.1. Распределение 𝜒 2 . Точный метод интервальной оценки дисперсии при малых объёмах выборки. 6.2.2. Распределение t. Точный метод интервальной оценки математического ожидания при малых объёмах выборки. Тема 1. Предмет и основные задачи математической статистики. Математическая статистика опирается на методы и понятия теории вероятностей, но решает в каком-то смысле обратные задачи. В теории вероятностей рассматриваются случайные величины, с заданными законами распределения или случайные эксперименты с известными свойствами. Оперируя такими понятиями, как события и их вероятности, случайные величины, их законы распределения и их числовые характеристики, теория вероятностей дает возможность теоретическим путем определять вероятности одних событий через вероятности других событий, законы распределения и числовые характеристики одних случайных величин через законы распределения и числовые характеристики других случайных величин. Такие косвенные методы позволяют экономить время и средства, затрачиваемые на эксперимент, но отнюдь не исключают самого эксперимента. Каждое исследование случайных явлений, выполняемое методами теории вероятностей, прямо или косвенно опирается на экспериментальные данные. Но часто о свойствах эксперимента ничего неизвестно или о них имеется какая-то априорная информация, накопленная до проведения эксперимента. Тогда эксперимент можно сравнить с черным ящиком, выдающим лишь некоторые результаты, по которым требуется сделать вывод о свойствах самого эксперимента. Повторяя один и тот же эксперимент в одинаковых условиях, наблюдатель получает набор однородных объектов, чаще всего в виде числовых значений. При этом возникают вопросы: 1. Наблюдаем одну случайную величину (признак). Как по набору ее числовых значений в ограниченном числе опытов сделать как можно более точный вывод о законе ее распределения или о числовых характеристиках распределения? 2. Наблюдаем одновременно проявление двух (или более) признаков, т. е. имеем набор значений нескольких случайных величин — что можно сказать об их зависимости? Есть она или нет? А если есть, то какова эта зависимость? Какие понятия лежат в основе статистических выводов, направленных на анализ зависимостей и взаимозависимостей? 3. Что является решающим для применения статистических методов на практике? Часто можно высказать некие предположения о распределении, спрятанном в «черном ящике», или о его свойствах. В этом случае по опытным данным требуется подтвердить или опровергнуть эти предположения («гипотезы»). При этом надо помнить, что ответ «да» или «нет» может быть дан лишь с определенной степенью достоверности, и чем дольше мы можем продолжать эксперимент, тем точнее могут быть выводы. Наиболее благоприятной для исследования оказывается ситуация, когда можно уверенно утверждать о некоторых свойствах наблюдаемого эксперимента — например, о наличии функциональной зависимости между наблюдаемыми величинами, о нормальности распределения, о его симметричности, о наличии у распределения плотности или о его дискретном характере, и т. д. Итак, о математической статистике имеет смысл говорить, когда: • имеется случайный эксперимент, свойства которого частично или полностью неизвестны; • мы умеем воспроизводить этот эксперимент в одних и тех же условиях некоторое (а лучше — какое угодно) число раз. Примерами такой серии экспериментов может служить социологический опрос, набор экономических показателей или, наконец, последовательность гербов и решек при многократном подбрасывании монеты. Статистика изучает методы сбора и анализа результатов наблюдений массовых случайных явлений с целью выявления существующих закономерностей. Все задачи математической статистики касаются вопросов обработки наблюдений над массовыми случайными явлениями. Перечислим некоторые задачи математической статистики, наиболее часто встречающиеся в ее приложениях. • Предварительная обработка данных – упорядочение результатов наблюдения или эксперимента, представление их в обозримом виде. • Нахождение неизвестных параметров распределения. • Определение закона распределения случайной величины или системы случайных величин по результатам наблюдения. • Проверка правдоподобия гипотез о виде закона распределения, т.е. установление меры надежности оценки, сделанной на основании опытных данных. Современная математическая статистика может быть определена как теория принятия решений в условиях неопределенности. Она включает также методы определения числа наблюдений, необходимых для достаточно надежной оценки, до начала исследований (планирование эксперимента) или в процессе исследований (последовательный анализ), что позволяет уже на этапе сбора информации уменьшить объем собираемых данных без снижения надежности оценок. В настоящее время статистическая обработка данных проводится, как правило, с помощью соответствующих программных продуктов: Statgraphics, SPSS или Statistica. Тема 2. Выборочный метод. Генеральная и выборочная совокупности. Пусть дана некоторая совокупность объектов и требуется оценить значение некоторого параметра этой совокупности, например, среднее значение прибыли для малых предприятий некоторого региона или долю выборщиков, проголосовавших за данного кандидата на выборах. Предположим, что от полного обследования всей совокупности объектов решили отказаться. Среди возможных причин здесь можно указать разрушение объекта в результате обследования. Например, если требуется узнать средний срок службы лампочек в партии, изготовленной на некотором заводе, полное обследование, конечно, даст исчерпывающую информацию, но сама совокупность перестанет существовать. Другая возможная причина – высокая стоимость полного обследования или его чрезмерная продолжительность. Например, анализ результатов голосования на некоторых выборах требуется получить в кротчайшие сроки, что невозможно при тотальном обследовании. Наконец, вся совокупность может обладать таким свойством как «необозримость». Например, рыба некоторого вида в данном море. Тогда для изучения всей совокупности, из нее выделяют часть или так называемую выборочную совокупность, которую для краткости часто называют выборкой. По ней находят значение исследуемого параметра в выборке. На основании этих результатов делают вывод о значении этого параметра во всей совокупности объектов. При оценке параметров распределения по выборочным данным мы будем также использовать термин «выборочная статистика» или просто « статистика», понимая под ним числовое значение того или иного параметра, подсчитанное по набору наблюдений или измерений случайной переменной. Примерами статистик являются оценки математического ожидания и теоретической дисперсии плотности распределения. Термином «статистика» будем также обозначать некоторую функцию случайной величины. Нужный смысл этого термина будет ясен из контекста. Исходное множество объектов, из которого производится выборка, называют генеральной совокупностью. Генеральная совокупность может быть как конечной, так и бесконечной. Объем совокупности (выборочной или генеральной) – есть число объектов (наблюдений) в данной совокупности. Пример. Из 1000 деталей отобрано для обследования 100 деталей. Тогда объем генеральной совокупности 𝑁 = 1000, а объем выборки 𝑛 = 100. При очень большом объеме генеральной совокупности часто принимают, что ее объем бесконечен. Подобное допущение основано на законе больших чисел. В математической статистике понятие генеральной совокупности трактуется как совокупность всех мыслимых наблюдений, которые могли бы иметь место при данном реальном комплексе условий. В этом смысле понятие генеральной совокупности не следует смешивать с реальными совокупностями, подлежащими статистическому изучению. Так, обследовав даже все предприятия данной отрасли по определенным технико-экономическим показателям, мы можем рассматривать обследованную совокупность как представителя гипотетически возможной более широкой совокупности предприятий, которые могли бы функционировать в рамках того же реального комплекса условий. Исследуемый признак генеральной совокупности является дискретным, если он принимает отдельные, изолированные значения с определенными вероятностями. Исследуемый признак генеральной совокупности является непрерывным, если он может принимать все значения из некоторого конечного или бесконечного промежутка. Теоретической основой выборочного метода является закон больших чисел, согласно которому при неограниченном увеличении объемы выборки практически достоверно, что случайные выборочные характеристики как угодно близко приближаются к определенным параметрам генеральной совокупности. Чтобы по исследованию выборки можно было сделать выводы о поведении интересующего признака генеральной совокупности, нужно, чтобы выборка правильно представляла пропорции генеральной совокупности, то есть была репрезентативной (представительной). Учитывая закон больших чисел, можно утверждать, что это условие выполняется, если каждый объект выбран случайно, причем для любого объекта вероятность попасть в выборку одинакова. При составлении выборки можно поступать двояко: после того, как объект отобран и над ним произведено наблюдение, он может быть возвращен, либо не возвращен в генеральную совокупность. В соответствии со сказанным, выборки подразделяют на повторные и бесповторные выборки. При повторной выборке – каждый отобранный объект перед выбором следующего возвращается в генеральную совокупность; При бесповторной выборке – отобранный объект в генеральную совокупность не возвращается. На практике обычно пользуются бесповторным случайным отбором. Когда объем генеральной совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборками стирается. В предельном случае, когда рассматривается бесконечная генеральная совокупность, а выборка имеет конечный объем, это различие исчезает. В дальнейшем мы будем рассматривать бесповторные выборки, которые составляются следующим образом. Предположим, что объекты генеральной совокупности некоторым образом пронумерованы. Из полной совокупности номеров случайным образом отбирают столько номеров, сколько элементов должно быть в выборке. Элементы генеральной совокупности с такими номерами и подвергаются обследованию. Пусть для изучения дискретной или непрерывной случайной величины X извлечена выборка 𝑥1 , 𝑥2 , . . . , 𝑥𝑚 , объема n. Причем значение 𝑥1 случайной величины X наблюдалось 𝑛1 раз, значение 𝑥2 наблюдалось 𝑛2 раз, …, значение 𝑥𝑚 наблюдалось 𝑛𝑚 раз и ∑𝑚 𝑖=1 𝑛𝑖 = 𝑛. Возможные значения 𝑥1 , 𝑥2 , . . . , 𝑥𝑚 случайной величины X принято называть вариантами, а последовательность вариантов, записанную в порядке возрастания (или убывания) 𝑛 – вариационным рядом. Числа 𝑛1 , 𝑛2 ,…, 𝑛𝑚 называются частотами, а числа 𝑤𝑖 = 𝑛𝑖 – относительными частотами. Перечень вариантов и соответствующих им частот (или относительных частот) называется статистическим распределением выборки или статистическим рядом. ● Замечание: в теории вероятности под распределениями понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике — соответствие между наблюдаемыми вариантами и их частотами или их относительными частотами. Обычно статистический ряд записывается в виде таблицы: 𝑋 Частоты 𝑥1 𝑛1 𝑥2 𝑛2 … … 𝑥𝑖 𝑛𝑖 … 𝑥𝑚 𝑛𝑚 или 𝑋 Относительные частоты 𝑥1 𝑤1 𝑥2 𝑤2 … … 𝑥𝑖 𝑤𝑖 … … 𝑥𝑚 𝑤𝑚 Пример. При 100 подбрасываниях игральной кости единица выпала 𝑛1 =21 раза, двойка 𝑛2 = 17 раз, тройка 𝑛3 =10 раз, четверка 𝑛4 = 27 раз, пятерка 𝑛5 = 11 и шестерка 𝑛6 = 14 раз. Построим статистический ряд случайной величины X – числа выпавших очков: 𝑋 Частоты (𝑛𝑖 ) Относительные частоты (𝑤𝑖 ) 1 22 2 16 3 13 4 24 5 12 6 13 0,22 0,16 0,13 0,24 0,12 0,13 Часто значения вариантов группируют в интервалы (обычно одинаковой длины), которые будем называть частичными интервалами. В первой строке таблицы указываются частичные интервалы, во второй – число наблюдений случайной величины, попавших в данный интервал, или относительные частоты. Полученный таким образом статистический ряд называют интервальным статистическим рядом. Группировка данных в частичные интервалы сглаживает случайные колебания, свойственные выборкам ограниченного объёма, сохраняя основные, характерные черты собранного экспериментального материала. Выбор числа и длины частичных интервалов не должен приводить к большой потере информации об исследуемой случайной величине. Для определения оптимальной длины частичного интервала можно использовать формулу Стерджесса. Пусть значения случайной величины X располагаются на отрезке [a,b], объем выборки – 𝑛. Длина частичного интервала 𝛥= 𝑏−𝑎 . 1 + log 2 𝑛 Здесь 𝑘 = 1 + log 2 𝑛 − число интервалов (берется ближайшее целое число). Первый частичный интервал начинается в точке 𝛥 𝑥𝑚𝑖𝑛 = 𝑎 − . 2 Пример. Пусть измерен рост 50 случайно выбранных человек с точностью до 1 см. В результате измерений получена следующая выборка объема n =50: 175, 179, 170, 163, 159, 171, 170, 152, 168, 172, 160, 167, 165, 167, 156, 170, 181, 153, 163, 167, 179, 172, 170, 186, 180, 187, 178, 175, 168, 168, 171, 173, 178, 170, 183, 181, 180, 160, 165, 158, 173, 160, 167, 172, 180, 169, 168, 170, 188, 176. Рост является непрерывной случайной величиной, но в силу ограниченной точности измерений любые значения этой величины будут принадлежать некоторому дискретному множеству. Значения роста в выборке изменяются от 152 см до 188 см и принимают 𝑚 =37 значений, объем выборки 𝑛 = 50 человек. Нахождение статистических характеристик данной выборки в таком виде представляет заметные вычислительные трудности. Упорядочим данные, входящие в выборку по возрастанию (ранжируем выборку): 152, 153, 156, 158, 159, 160, 160, 160, 163, 163, 165, 165, 167, 167, 167, 167, 168, 168, 168, 168, 169, 170, 170, 170, 170, 170, 170, 171, 171, 172, 172, 172, 173, 173, 175, 175, 176, 178, 178, 179, 179, 180, 180, 180, 181, 181, 183, 186, 187, 188. Построим интервальный статистический ряд. 188−152 2 50 Ширина частичного интервала: Δ=1+log Число частичных интервалов: 𝑘 ≈ 6,644 ≈ 7, Начало первого частичного интервала в точке: X 𝑛𝑖 𝑤𝑖 [149; 155) 2 0,04 [155; 161) 6 0,12 36 ≈ 6,644 ≈ 6, [161; 167) 4 0,08 6 𝑥𝑚𝑖𝑛 = 152 − 2 = 149. [167; 173) 20 0,4 [173; 179) 7 0,14 [179;185) 8 0,16 [185;191) 3 0,06 При изучении статистических рядов наряду с понятием частоты используется понятие накопленной (кумулятивной) частоты 𝑛𝑖𝛴 . Накопленная частота показывает количество наблюдаемых вариантов, значения которых меньше заданного значения x. Отношение накопленной частоты 𝑛𝑖𝛴 к общему числу наблюдений n будем называть относительной накопленной (кумулятивной) частотой, и обозначать как 𝑤𝑖𝛴 . Накопленные частоты (относительные накопленные частоты) находятся последовательным суммированием частот (относительных накопленных частот) всех предшествующих частичных интервалов, включая данный интервал. Например, для x=173 в рассмотренном примере накопленная частота 𝑛𝑖𝛴 =2 + 6 + 4 + 20 = 32, т.е. 32 человека имели рост менее 173 см. Тема 3. Полигон, гистограмма и кумулятивная кривая. Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Наиболее часто используют следующие виды графического представления вариационных рядов: Графическими изображениями вариационных рядов являются: • полигон частот (относительных частот); • гистограмма частот (относительных частот); • гистограмма накопленных (кумулятивных) частот; • эмпирическая функция распределения. Гистограмма и полигон позволяют выявить преобладающие значения признака и характер распределения частот и относительных частот. Полигон частот (или относительных частот) служит для изображения статистического ряда дискретной случайной величины. Он представляет собой ломаную линию, отрезки которой соединяют точки (𝑥1 ; 𝑛1 ), (𝑥2 ; 𝑛2 ), … , (𝑥𝑖 , 𝑛𝑖 ), … или (𝑥1 ; 𝑤1 ), (𝑥2 ; 𝑤2 ), … , (𝑥𝑖 , 𝑤𝑖 ), … . На рисунке приведен полигон частот статистического ряда: 𝑋 1 2 3 4 5 6 Частоты (𝑛𝑖 ) 22 16 13 24 12 13 Гистограмма частот (относительных частот) служит для изображения только интервальных статистических рядов. Гистограмма частот (относительных частот) есть ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные 𝑛 𝑤 интервалы длиной ∆𝑥𝑖 = 𝑥𝑖+1 − 𝑥𝑖 и высотами ℎ𝑖 = 𝑖 (ℎ𝑖 = 𝑖 ). Площадь всей гистограммы ∆𝑥𝑖 ∆𝑥𝑖 частот равна n (объему выборки), а площадь всей гистограммы относительных частот равна 1. На рисунке приведена гистограмма частот интервального статистического ряда: X [149; 155) [155; 161) [161; 167) [167; 173) [173; 179) [179;185) [185;191) 𝑛𝑖 2 6 4 20 7 8 3 Над прямоугольниками гистограммы обозначены их площади. Таким образом, высота 2 1 6 первого прямоугольника равна = , второго − = 1 и. т. д. 155−149 3 161−155 Построим гистограмму кумулятивных (накопленных) относительных частот для интервального статистического ряда: X 𝑤𝑖 [149; 155) 0,04 [155; 161) 0,12 [161; 167) 0,08 [167; 173) 0,4 [173; 179) 0,14 [179;185) 0,16 [185;191) 0,06 Эмпирическая функция распределения. Пусть задано статистическое распределение случайной величины X. Обозначим через 𝑛𝑥 число вариант, меньших x, n – общее число 𝑛 наблюдений (объем выборки). Относительная частота события (𝑋 < 𝑥) равна 𝑥. При изменении x 𝑛 𝑛 меняется и относительная частота, т.е. 𝑛𝑥 есть функция от x. Поскольку эта функция строится по данным опыта, ее называют эмпирической (опытной). Определение. Эмпирической функцией распределения (функцией распределения выборки) 𝐹 ∗ (𝑥) называется относительная частота события (𝑋 < 𝑥) 𝑭∗ (𝒙) = 𝒏𝒙 , 𝒏 где 𝑛𝑥 – число вариантов, меньших x, n – объем выборки. Определение. Теоретической функцией распределения называется функция распределения 𝐹(𝑥) случайной величины X, вычисленная по генеральной совокупности, т.е., вероятность события (𝑋 < 𝑥). Поскольку эмпирическая и теоретическая функции распределения определяются единообразно (но по различным совокупностям: эмпирическая – по выборочной, а теоретическая – по генеральной совокупности), то свойства эмпирической функции распределения полностью аналогичны свойствам теоретической функции распределения дискретной случайной величины X. При возрастании объема выборки различия между функциями 𝐹 ∗ (𝑥) и 𝐹(𝑥) уменьшаются. Построим эмпирическую функцию распределения для ранее рассмотренного примера (подбрасывание кости). 𝑋 Частоты (𝑛𝑖 ) Относительные частоты (𝑤𝑖 ) 1 22 2 16 3 13 4 24 5 12 6 13 0,22 0,16 0,13 0,24 0,12 0,13 Для 𝑥 ≤ 1 условие (𝑋 < 𝑥) не может быть выполнено, т. е. 𝐹 ∗ (𝑥) = 0 при 𝑥 ≤ 1. Для 1 < 𝑥 ≤ 2 условие (𝑋 < 𝑥) выполняется в 22 случаях из 100, т. е. 𝐹 ∗ (𝑥) = 0,22 при 1 < 𝑥 ≤ 2. Продолжая получаем 0, 0,22 0,38 𝐹(𝑥) = 0,51 0,75 0,87 {1 𝑥 ≤ 1, 1 < 𝑥 ≤ 2, 2 < 𝑥 ≤ 3, 3 < 𝑥 ≤ 4, 4 < 𝑥 ≤ 5, 5 < 𝑥 ≤ 6, 𝑥 > 6. 3.1. Контрольные вопросы. 1. Сформулируйте основные задачи математической статистики. 2. Дайте определение генеральной и выборочной совокупностей. 3. Какие способы отбора выборки Вы знаете? Приведите примеры. 4. Что такое вариационный ряд? 5. Что такое интервальный статистический ряд? 6. Приведите пример статистического распределения выборки. Найдите объем выборки. 7. Напишите формулы для нахождения выборочной средней и дисперсии выборки. 8. В чем различие между полигоном частот и полигоном относительных частот? 9. Чему равна площадь прямоугольника в гистограмме частот? 10. Как определить моду на полигоне частот? 11. Чему равна площадь одного прямоугольника в гистограмме частот? 12. Чему равна сумма площадей всех прямоугольников в гистограмме частот? 13. Какие факторы должны учитываться при выборе числа интервалов гистограммы? 14. Какой смысл вкладывается в термин «статистика»? Тема 4. Статистические оценки параметров распределения. 4.1. Понятие статистической оценки параметра распределения. Пусть распределение признака X генеральной совокупности задается законом распределения, который содержит один или несколько неизвестных параметров. Эти неизвестные параметры условимся обозначать символами 𝛩1 , 𝛩2 , … ., 𝛩𝑘 . Например, закон Пуассона характеризуется одним параметром 𝛩 = 𝜆, нормальный закон распределения характеризуется двумя параметрами: 𝛩1 = 𝑚𝑥 и 𝛩2 = 𝜎𝑥 и т. д. Для нахождения того или иного параметра 𝛩 исследовать все элементы генеральной совокупности не представляется возможным. Поэтому о том или ином параметре 𝛩 судят по выборке, состоящей из конечного набора вариантов. Конкретный набор вариантов 𝑥1 , 𝑥2 , . . . , 𝑥𝑛 полученный при выборе объектов из генеральной совокупности, при каждом следующем отборе будет меняться. Эти значения можно рассматривать как реализации системы 𝒏 независимых случайных величин 𝑿𝟏 , 𝑿𝟐 , . . . , 𝑿𝒏, каждая из которых распределена по тому же закону, что и признак X рассматриваемой генеральной совокупности. Определение. Оценкой 𝛩∗ неизвестного параметра 𝛩 теоретического распределения называют всякую функцию от наблюдаемых случайных величин 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 , с помощью которой судят о неизвестном параметре 𝛩: 𝛩∗ = 𝛩∗ (𝑋1 , 𝑋2 , . . . , 𝑋𝑛 ), Поскольку 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 − случайные величины, то и оценка 𝜣∗ (в отличие от оцениваемого параметра 𝜣), является случайной величиной, зависящей от закона распределения случайной величины X и от объема выборки 𝒏. Существуют два вида статистических оценок параметров (числовых характеристик) теоретического распределения изучаемого объекта по данным выборки – точечные и интервальные. 4.2. Требования, предъявляемые к оценкам параметров распределения. Предъявим к оценке 𝛩∗ ряд требований, которым она должна удовлетворять, чтобы быть в каком-то смысле «доброкачественной» статистикой. 1. Естественно потребовать от оценки 𝛩∗ , чтобы при увеличении числа опытов 𝑛 она приближалась (сходилась по вероятности) к параметру 𝛩: ∀𝜀 lim 𝑃(|𝛩∗ − 𝛩| < 𝜀) = 1. 𝑛→∞ Оценка, обладающая таким свойством, называется состоятельной. В случае использования состоятельных оценок оправдывается увеличение объёма выборки, так как при этом становятся маловероятными значительные ошибки при оценивании. Поэтому практический смысл имеют только состоятельные оценки. Если оценка состоятельная, то практически достоверно, что при большом объеме выборки 𝑛 будет соблюдаться условие 𝛩∗ ≈ 𝛩. 2. Кроме того, желательно, чтобы, пользуясь величиной 𝛩∗ вместо 𝛩, мы не делали систематической ошибки в сторону завышения или занижения, т. е. чтобы выполнялось условие 𝑀[𝛩∗ ] = 𝛩. Оценка, удовлетворяющая такому условию, называется несмещенной. В противном случае оценка называется смещенной. Если оценка является смещенной, то такая оценка будет либо завышать истинное значение 𝛩 (если 𝑀[𝛩∗ ] > 𝛩), либо занижать его (если 𝑀[𝛩∗ ] < 𝛩). Таким образом, требование несмещенности оценки гарантирует отсутствие систематической ошибки при оценивании. Заметим, что несмещенная оценка, дисперсия 𝜎𝛩2∗ которой стремится к нулю при 𝑛 → ∞, является состоятельной оценкой. Это следует из неравенства Чебышева: 𝑃(|𝛩∗ − 𝛩| < 𝜀) ≥ 1 − 𝜎𝛩2∗ . 𝜀2 3. Наконец, желательно, чтобы выбранная несмещенная оценка обладала по сравнению с другими возможными оценками наименьшей дисперсией, т. е. 𝐷[𝛩∗ ] = 𝑚𝑖𝑛. Оценка, обладающая таким свойством, называется эффективной. Совместить выполнение требований несмещенности и эффективности оценки параметра распределения удается не всегда. Условию несмещенности оценки придается важное значение; оно часто фигурирует в требованиях к оценке. Это означает, что мы в первую очередь ограничиваемся рассмотрением только несмещенных оценок, а затем уже пытаемся минимизировать их дисперсию. На практике не всегда удается удовлетворить всем этим требованиям. Например, может оказаться, что, даже если эффективная оценка существует, формулы для ее вычисления оказываются слишком сложными, и приходится удовлетворяться другой оценкой, дисперсия которой несколько больше. Иногда, для упрощения расчетов, применяются незначительно смещенные оценки, обладающие большей дисперсией по сравнению с эффективными оценками. Тема 5. Точечные оценки параметров распределения. Определение. Оценка параметра 𝛩 генеральной совокупности, которая определяется одним числом 𝛩∗ , называется точечной оценкой. Например, математическое ожидание 𝑚𝑥 генеральной совокупности может оцениваться средним арифметическим значением 𝑋̅ выборки, дисперсия генеральной совокупности 𝜎𝑥2 − так называемой выборочной дисперсией 𝑠𝑥2 . С точки зрения общей теории принятия решений точечное оценивание является процедурой, в результате которой мы решаем, какую величину 𝛩∗ принять в качестве оценки для неизвестного параметра 𝛩. Мерой возникающей при этом ошибки является функция потерь 𝑊(𝛩∗ , 𝛩), которая зависит от 𝛩∗ и 𝛩. Оценка 𝛩∗ рассчитывается исходя из критерия минимизации математического ожидания выбранной функции потерь 𝑀[𝑊(𝛩∗ , 𝛩)] = 𝑚𝑖𝑛. Часто функцию потерь 𝑊(𝛩∗ , 𝛩) принимают равной (𝛩∗ − 𝛩). Нередко она определяется абсолютной разностью |𝛩∗ − 𝛩|. Наиболее широкое применение находит критерий, в котором функция потерь пропорциональна (𝛩∗ − 𝛩)2 . Точечная оценка, минимизирующая математическое ожидание величины (𝛩∗ − 𝛩)2 называется оценкой наименьших квадратов. Выбор такого критерия, означает, что мы пытаемся минимизировать дисперсию оценки 𝛩∗ . Такая оценка является эффективной. Точечная оценка 𝛩∗ того или иного неизвестного параметра распределения является лишь его приближенным значением. Для выборки малого объема точечная оценка 𝛩∗ может существенно отличаться от истинного значения параметра 𝛩. Точечные оценки просты в вычислении, но не позволяют установить степень достоверности оценки. 5.1. Точечная оценка математического ожидания по выборочному среднему. Как правило, наиболее эффективной статистикой, которая используется для оценки математического ожидания, является выборочное среднее. Эффективность практически означает, что для получения той же достоверности выборочное среднее требует меньшего объема выборки. Если отдельные значения признака в выборке повторяются, то расчет выборочной средней величины можно провести по сгруппированным данным, представленным в виде вариационного ряда. В этом случае говорят о выборочном среднем взвешенном или средней арифметической взвешенной. Она равна 𝑚 𝑋̅ = ∑𝑚 1 𝑖=1 𝑥𝑖 𝑛𝑖 = ∑ 𝑥𝑖 𝑛𝑖 , ∑𝑚 𝑛 𝑛 𝑖=1 𝑖 𝑖=1 где 𝑚 − число вариантов статистического ряда; 𝑛𝑖 − частоты вариантов (∑𝑚 𝑖=1 𝑛𝑖 = 𝑛 ); 𝑥𝑖 − варианты статистического ряда. Если после проведения эксперимента не проводить объединение повторяющихся значений признака, то 𝑛𝑖 = 1, верхний предел суммы будет равен объему выборки 𝑛 и формула выборочного среднего или средней арифметической примет вид простой средней арифметической 𝑛 1 𝑋̅ = ∑ 𝑥𝑖 , 𝑛 𝑖=1 где 𝑛 − объем выборки; 𝑥𝑖 − элементы выборки (их значения могут повторяться). Обе формулы дают одинаковый результат. Покажем, что эта оценка, вычисленная по одной из этих формул, удовлетворяет требованиям, которые предъявляются к статистическим оценкам параметров распределения, т.е. является несмещенной, состоятельной и эффективной. Найдем математическое ожидание 𝑀[𝑋̅] оценки 𝑋̅. Выше отмечалось, что значения выборки можно рассматривать как реализации системы 𝑛 независимых случайных величин 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 , каждая из которых распределена по тому же закону, что и признак X генеральной совокупности, т.е. 𝑀[𝑋1 ] = 𝑀[𝑋2 ] = ⋯ = 𝑀[𝑋𝑛 ] = 𝑀[𝑋] или 𝑀[𝑋𝑖 ] = 𝑀[𝑋], 𝑖 = 1, 2, … , 𝑛. Тогда 𝑛 𝑛 𝑛 𝑛 1 1 1 1 1 ̅ 𝑀[𝑋] = 𝑀 [ ∑ 𝑋𝑖 ] = 𝑀 [∑ 𝑋𝑖 ] = ∑ 𝑀[𝑋𝑖 ] = ∑ 𝑀[𝑋] = 𝑛 𝑀[𝑋] = 𝑀[𝑋]. 𝑛 𝑛 𝑛 𝑛 𝑛 𝑖=1 𝑖=1 𝑖=1 𝑖=1 Мы получили результат: 𝑀[𝑋̅] = 𝑀[𝑋], следовательно, математическое ожидание 𝑀[𝑋̅] выборочного среднего 𝑋̅ является несмещенной оценкой генерального среднего 𝑀[𝑋]. Выборочное среднее само является случайной величиной, поскольку оно зависит от случайных значений признака в выборке. Найдем дисперсию 𝐷𝑋̅ выборочного среднего: 𝑛 𝑛 𝑛 1 1 1 1 𝐷𝑋 𝐷𝑋̅ = 𝐷 ( ∑ 𝑋𝑖 ) = 2 ∑ 𝐷(𝑋𝑖 ) = 2 ∑ 𝐷𝑋 = 2 ∙ 𝑛𝐷𝑋 = , 𝑛 𝑛 𝑛 𝑛 𝑛 𝑖=1 𝑖=1 𝑖=1 где 𝐷𝑋 − дисперсия случайной величины 𝑋. Таким образом, мы получили соотношение, устанавливающее связь между дисперсией выборочного среднего случайной величины 𝑋 и дисперсией самой случайной величины 𝑋: 𝐷𝑋̅ = 𝐷𝑋 . 𝑛 Отсюда нетрудно получить формулу среднеквадратичного отклонения 𝜎𝑋̅ выборочного среднего: 𝜎𝑋̅ = √𝐷𝑋̅ = 𝜎𝑋 √𝑛 . Мы видим, что дисперсия и среднеквадратичное отклонение оценки генерального среднего стремятся к нулю, когда число опытов в эксперименте неограниченно возрастает. Тогда из неравенства Чебышёва 𝐷(𝑋̅) 𝑃(|𝑋̅ − 𝑀(𝑋)| < 𝜀) ≥ 1 − 2 𝜀 следует, что несмещенная оценка ̅𝑋, дисперсия 𝐷(𝑋̅) которой стремится к нулю при 𝑛 → ∞, является состоятельной оценкой. Подтвердить состоятельность оценки 𝑋̅ можно и так: По теореме Чебышева 𝑛 𝑛 1 1 ∀𝜀 > 0 lim 𝑃 (| ∑ 𝑋𝑖 − ∑ 𝑀[𝑋𝑖 ]| < 𝜀) = 1 𝑛→∞ 𝑛 𝑛 𝑖=1 или 𝑖=1 lim 𝑃(|𝑋̅ − 𝑀(𝑋)| < 𝜀) = 1. 𝑛→∞ т.е., выборочное среднее 𝑋̅ является состоятельной оценкой генерального среднего 𝑀(𝑋). Можно доказать, что если случайная величина X распределена нормально, то оценка ̅ генерального среднего 𝑴(𝑿) будет эффективной, т.е. дисперсия 𝐷(𝑋̅) этой оценки будет 𝑿 минимальной по сравнению с любыми другими оценками: 𝐷𝑋̅ = 𝑚𝑖𝑛. Пример. Пусть необходимо рассчитать средний курс акций акционерного общества на торгах фондовой биржи. Известно, что сделки осуществлялись в течение 5 дней (5 сделок). Цена акций, проданных по курсу продаж, распределилась следующим образом: 1. 2. 3. 4. 5. 𝑥1 =1010 руб., 𝑛1 =800 акций; 𝑥2 = 990 руб., 𝑛2 =650 акций; 𝑥3 =1015 руб., 𝑛3 =700 акций; 𝑥4 = 900 руб., 𝑛4 =550 акций; 𝑥5 =1150 руб., 𝑛5 =850 акций; Исходным соотношением для определения среднего курса стоимости акций является отношение общей суммы сделок (ОСС) к количеству проданных акций (КПА): ОСС = ∑5𝑖=1 𝑥𝑖 𝑛𝑖 =1010 ·800+990·650+1015·700+900·550+1150·850= 3 634 500; КПА = 𝑛 = ∑5𝑖=1 𝑛𝑖 =800+650+700+550+850=3550. В этом случае средний курс стоимости акций был равен 𝑋̅ = ∑5𝑖=1 𝑥𝑖 𝑛𝑖 3 634 500 = = 1024 (руб. ). 𝑛 3550 Пример. Необходимо вычислить среднюю заработную плату работников небольшой фирмы, где заняты 8 человек. Ее можно вычислить по формуле простой средней арифметической: 𝑋̅ = 45000 + 38000 + 41000 + 39000 + 52000 + 48000 + 48000 ≈ 44429 (руб). 7 Определяющими показателями здесь являются заработная плата каждого работника и число работников предприятия. При вычислении средней общая сумма заработной платы осталась прежней, но распределенной как бы между всеми работниками поровну. Для одной и той же выборки обе формулы дают одинаковый результат. Пример. Из генеральной совокупности извлечена выборка объема 𝑛 = 50, представленная статистическим рядом: 𝑋𝑖 𝑛𝑖 3 14 4 18 7 10 11 8 Найти несмещенную оценку генеральной средней. Решение. Несмещенной оценкой генеральной средней является выборочная средняя (средняя арифметическая): 𝑋̅ = ∑4𝑖=1 𝑋𝑖 𝑛𝑖 3 ∙ 14 + 4 ∙ 18 + 7 ∙ 10 + 11 ∙ 8 = = 5,44. ∑4𝑖=1 𝑛𝑖 50 Если варианты 𝑋𝑖 статистического ряда – большие числа, то для упрощения расчетов целесообразно вычесть из каждого варианта одно и то же число 𝐶, т.е. перейти к новым вариантам 𝑢𝑖 = 𝑋𝑖 − 𝐶. Тогда 𝑚 ∑ 𝑢𝑖 𝑛𝑖 1 𝑋̅=𝐶 + ∑𝑖=1 = 𝐶 + 𝑛 ∑𝑚 𝑛 𝑛 𝑖=1 𝑢𝑖 𝑛𝑖 . 𝑖=1 𝑖 Действительно, т.к. 𝑢𝑖 = 𝑋𝑖 − 𝐶, то 𝑥𝑖 = 𝑢𝑖 + 𝐶 и 𝑛𝑖 𝑢𝑖 = 𝑛𝑖 (𝑋𝑖 + 𝐶). Тогда 𝑚 𝑚 𝑚 ∑𝑚 𝑛 𝑢 𝑖=1 𝑖 𝑖 = ∑𝑖=1 𝑋𝑖 𝑛𝑖 + ∑𝑖=1 𝐶𝑛𝑖 = ∑𝑖=1 𝑋𝑖 𝑛𝑖 + 𝐶𝑛. Разделим обе части этого равенства на 𝑛: 1 𝑚 1 1 ∑ 𝑢 𝑛 = ∑𝑚 𝑋 𝑛 + 𝐶 или 𝑋̅= 𝐶 + 𝑛 ∑𝑚 𝑖=1 𝑢𝑖 𝑛𝑖 . 𝑛 𝑖=1 𝑖 𝑖 𝑛 𝑖=1 𝑖 𝑖 Пример. Найти выборочное среднее по данному статистическому ряду выборки объема 𝑛 = 20. 950 1100 1210 𝑋𝑖 5 8 7 𝑛𝑖 Решение. Варианты ряда − большие числа, поэтому перейдем к новым (вспомогательным) вариантам, вычитая из каждого заданного в таблице варианта 𝑥𝑖 одно и то же число 𝐶. В качестве такого варианта целесообразно взять число, близкое к выборочному среднему, но так как оно неизвестно, выберем такое число «на глаз», например, пусть 𝐶=1100. В итоге получим новое распределение 0 110 −150 𝑢𝑖 5 8 7 𝑛𝑖 Найдем искомую выборочную среднюю: 3 (−150) ∙ 5 + 0 ∙ 8 + 110 ∙ 7 1 𝑋̅ = 𝐶 + ∑ 𝑢𝑖 𝑛𝑖 = 1100 + = 1101. 𝑛 20 𝑖=1 5.2. Точечная оценка генеральной дисперсии по выборочной дисперсии. Средняя арифметическая (выборочное среднее) 𝑋̅ характеризует только центр рассеяния опытных данных. Нужны еще какие-то меры, которые характеризовали бы степень рассеяния этих данных вокруг центра. Таких мер существует несколько. Простейшей из них является вариационный размах, т. е. разность между наибольшим и наименьшим значениями признака в выборке. Эта величина легко вычисляется, поэтому ею часто пользуются на практике. Однако эта характеристика, опираясь только на два крайних значения из всего ряда наблюдений, не учитывает, как расположены внутри этого интервала остальные значения. Поэтому чаще используются более эффективные меры для оценки рассеяния. Выборочная дисперсия является наиболее важной из них. Выборочная дисперсия представляет собой случайную величину, которая является наилучшей оценкой генеральной дисперсии 𝐷𝑋 = 𝜎𝑋2 . Она вычисляется по формуле 𝑚 𝑠𝑋2 1 = ∑(𝑥𝑖 − 𝑋̅)2 𝑛𝑖 , 𝑛−1 𝑖=1 где 𝑠𝑋 − выборочное среднее квадратичное отклонение; 𝑥𝑖 − варианты статистического ряда; 𝑚 − число вариантов; 𝑛𝑖 − частоты вариантов (∑𝑚 𝑖=1 𝑛𝑖 = 𝑛 ); 𝑋̅ − ыборочное среднее. Если в исходной выборке не объединять одинаковые значения признака, то верхний предел этой суммы будет равен объему выборки 𝑛 и 𝑛𝑖 = 1, тогда формула примет вид 𝑛 𝑠𝑋2 1 = ∑(𝑥𝑖 − 𝑋̅)2 . 𝑛−1 𝑖=1 То, что в знаменателе этой оценки стоит число 𝑛 − 1, а не 𝑛, можно аргументировать тем, что из 𝑛 степеней свободы, которыми обладает выборка объема 𝑛, пропадает одна степень свободы. Это связано с необходимостью вычисления выборочного среднего 𝑋̅, при котором на данные налагается одна связь и, следовательно, в знаменателе должно стоять число степеней свободы на единицу меньшее, чем 𝑛. Иными словами, число степеней свободы связано с числом независимых величин, остающихся после оценки параметров. Выборочную дисперсию часто удобно вычислять по формуле 𝑛 ̅̅̅̅2 (𝑋 − 𝑋̅ 2 ), 𝑛−1 1 2 где ̅̅̅̅ 𝑋 2 = 𝑛 ∑𝑚 𝑖=1 𝑥𝑖 𝑛𝑖 − выборочное среднее квадрата признака, ̅𝑋 2 − квадрат выборочного среднего. Эту формулу легко получить из базового определения выборочной дисперсии. Докажем, что приведенная выше оценка дисперсии генеральной совокупности является несмещенной оценкой. Представим разность 𝑥𝑖 − 𝑋̅ в виде (𝑥𝑖 − 𝑚𝑥 ) − (𝑋̅ − 𝑚𝑥 ) и подставим её в таком виде в базовую формулу выборочной дисперсии. Получим: 𝑚 𝑚 1 1 2 2 𝑠𝑋 = ∑(𝑥𝑖 − 𝑋̅) 𝑛𝑖 = ∑[(𝑥𝑖 − 𝑚𝑥 ) − (𝑋̅ − 𝑚𝑥 ) ]2 𝑛𝑖 = 𝑛−1 𝑛−1 𝑠𝑋2 = 𝑖=1 𝑖=1 𝑚 𝑚 𝑖=1 𝑚 𝑖=1 𝑚 1 = [∑(𝑥𝑖 − 𝑚𝑥 )2 𝑛𝑖 − 2 ∑(𝑥𝑖 − 𝑚𝑥 ) (𝑋̅ − 𝑚𝑥 )𝑛𝑖 + ∑(𝑋̅ − 𝑚𝑥 )2 𝑛𝑖 ] = 𝑛−1 𝑚 𝑖=1 𝑚 1 1 1 (𝑋̅ − 𝑚𝑥 )2 ∑ 𝑛𝑖 = = ∑(𝑥𝑖 − 𝑚𝑥 )2 𝑛𝑖 − 2(𝑋̅ − 𝑚𝑥 ) ∑(𝑥𝑖 − 𝑚𝑥 ) 𝑛𝑖 + 𝑛−1 𝑛−1 𝑛−1 𝑖=1 𝑚 𝑖=1 𝑚 𝑚 𝑖=1 1 𝑛 1 1 𝑛 (𝑋̅ − 𝑚𝑥 )2 = = ∑(𝑥𝑖 − 𝑚𝑥 )2 𝑛𝑖 − 2(𝑋̅ − 𝑚𝑥 ) ( ∑ 𝑥𝑖 𝑛𝑖 − 𝑚𝑥 ∑ 𝑛𝑖 ) + 𝑛−1 𝑛−1 𝑛 𝑛 𝑛−1 𝑖=1 𝑚 𝑖=1 𝑖=1 1 𝑛 𝑛 (𝑋̅ − 𝑚𝑥 )2 + (𝑋̅ − 𝑚𝑥 )2 = = ∑(𝑥𝑖 − 𝑚𝑥 )2 𝑛𝑖 − 2 𝑛−1 𝑛−1 𝑛−1 𝑖=1 𝑚 1 𝑛 (𝑋̅ − 𝑚𝑥 )2 . = ∑(𝑥𝑖 − 𝑚𝑥 )2 𝑛𝑖 − 𝑛−1 𝑛−1 𝑖=1 Найдем математическое ожидание полученного выражения: 𝑚 1 𝑛 𝑛 𝑛 2] 𝑀[𝑠𝑋 = ∑ 𝑛𝑖 𝑀[(𝑥𝑖 − 𝑚𝑥 )2 ] − 𝑀[(𝑋̅ − 𝑚𝑥 )2 ] = 𝜎𝑋2 − ∙ 𝜎 2̅ = 𝑛−1 𝑛−1 𝑛−1 𝑛−1 𝑋 𝑖=1 = 𝑛 𝑛 𝜎𝑋2 𝜎𝑋2 − ∙ = 𝜎𝑋2 . 𝑛−1 𝑛−1 𝑛 Т.е. математическое ожидание выборочной дисперсии равно генеральной дисперсии: 𝑀(𝑠𝑋2 ) = 𝐷𝑋 . Следовательно, оценка 𝑠𝑋2 является несмещенной. Докажем теперь, что эта оценка является состоятельной. Рассмотрим выражение 𝑛 1 ̅̅̅̅ 𝑋 2 − 𝑋̅ 2 = ∑ 𝑥𝑖2 − 𝑋̅ 2 𝑛 𝑖=1 Первое слагаемое есть среднее арифметическое значение случайной величины 𝑋 2 . Оно сходится по вероятности к математическому ожиданию 𝑀(𝑋 2 ) квадрата случайной величины 𝑋. Второе слагаемое сходится по вероятности к квадрату математического ожидания 𝑚𝑋2 случайной величины 𝑋. Следовательно, это выражение сходится по вероятности к дисперсии 𝑀(𝑋 2 ) − 𝑚𝑋2 = 𝐷𝑋 . Оно отличается от формулы для выборочной дисперсии только множителем 𝑛 , предел которого равен единице, когда 𝑛 → ∞, следовательно, оценка 𝑠𝑋2 − состоятельная. 𝑛−1 Оценка 𝑠𝑋2 для дисперсии генеральной совокупности не является эффективной. Однако в случае нормального распределения случайной величины она является асимптотически эффективной, т.е. при увеличении 𝑛 отношение дисперсии этой оценки к минимально возможной ее дисперсии неограниченно приближается к единице. Выборочная дисперсия и средняя арифметическая имеют разные размерности, что создает затруднения при практических оценках. Поэтому часто прибегают к выборочному среднеквадратичному (стандартному) отклонению: 𝑠𝑋 = √𝑠𝑋2 . В заключение заметим, что если элементы 𝑥𝑖 выборки – большие числа, то целесообразно вычесть из каждого варианта одно и то же число 𝐶, т.е. перейти к новым вариантам 𝑢𝑖 = 𝑥𝑖 − 𝐶. Тогда 2 ∑𝑛𝑖=1 𝑢𝑖 𝑛 ∑𝑛𝑖=1 𝑢𝑖2 2 (𝑋) 2 (𝑢) 𝑠 =𝑠 = −( [ ) ] 𝑛−1 𝑛 𝑛 или, если построить статистический ряд, объединив одинаковые элементы выборки: 2 2 ∑𝑚 𝑛 ∑𝑚 𝑖=1 𝑢𝑖 𝑛𝑖 𝑖=1 𝑢𝑖 𝑛𝑖 𝑠 =𝑠 = −( [ ) ]. 𝑛−1 𝑛 𝑛 Если же элементы выборки или варианты статистического ряда 𝑥𝑖 являются десятичными дробями с 𝑘 десятичными знаками после запятой, то чтобы избежать действий с дробями умножают их на одно и то же постоянное число 𝐶 = 10𝑘 , т.е. переходят к новым вариантам 𝑢𝑖 = 𝐶𝑥𝑖 . При этом дисперсия увеличится в 𝐶 2 раз. Поэтому найдя дисперсию новых вариантов 𝑢𝑖 , для получения окончательного результата следует разделить ее на 𝐶 2 . Такие преобразования помимо упрощения расчетов позволяют избежать серьезных вычислительных погрешностей, которые, как правило, возникают при возведении в квадрат больших или маленьких чисел с последующим вычитанием округленных значений. Например, если рассчитать выборочную дисперсию по формуле 2 𝑛 ∑𝑛𝑖=1 𝑥𝑖 𝑛 1 2 2 𝑠𝑋 = ( ∑ 𝑥𝑖 − ( ) ) 𝑛−1 𝑛 𝑛 𝑖=1 при 𝑥1 = 9000, 𝑥2 = 9001, 𝑥3 = 9003. То расчет этой оценки с точностью до единицы в восьмиразрядном десятичном числе даст значение 0, что очевидно не соответствует действительности. Этой ошибки можно избежать, если воспользоваться приведенными выше рекомендациями. В данном случае можно перейти к новой выборке, вычитая из каждого варианта одно и то же число, скажем 𝐶 = 9001. 2 (𝑋) 2 (𝑢) Рассмотрим несколько примеров на расчет оценок неизвестных параметров распределений. Пример. Проведено пять измерений веса товара на одних и тех же весах. В итоге получены следующие результаты: 36, 38, 32, 34, 35. Найти среднее выборочное значение веса товара и выборочную несмещенную оценку дисперсии веса. Решение. Выборочное среднее: 𝑛 𝑋̅ = 1 36 + 38 + 32 + 34 + 35 ∑ 𝑋𝑖 = = 35. 𝑛 5 𝑖=1 Найдем несмещенную выборочную дисперсию 𝑛 𝑠𝑋2 (36 − 35)2 + (38 − 35)2 + (32 − 35)2 +(34 − 35)2 +(35 − 35)2 1 = ∑(𝑥𝑖 − 𝑋̅)2 = = 5. 𝑛−1 4 𝑖=1 Пример. Результаты измерения роста случайно отобранных 100 студентов представлены интервальным статистическим рядом: Рост [155; 160) [160; 165) [165; 170) [170; 175) [175; 180) [180;185) [185;190) 4 9 16 22 26 15 8 Вес Найти выборочную среднюю и выборочную дисперсию роста студентов. Решение. Перейдем от интервального статистического ряда к вариационному ряду. Для этого вычислим середины каждого интервала и примем их в качестве вариантов: Рост 157,5 162,5 167,5 172,5 177,2 182,5 187.5 4 9 16 22 26 15 8 Вес Полученные варианты большие числа, поэтому перейдем к новым вариантам 𝑢𝑖 = 𝑥𝑖 − 172,5: 𝑢𝑖 −15 −10 −5 0 5 10 15 4 9 16 22 26 15 8 Вес Найдем искомую выборочную среднюю: 𝑚 1 −15 + (−10) + (−5) + 0 + 5 + 10 + 15 𝑋̅ = 𝐶 + ∑ 𝑢𝑖 𝑛𝑖 = 172,5 + = 172,5 + 0 = 172,5. 𝑛 100 𝑖=1 Найдем искомую выборочную дисперсию: 𝑛 𝑠𝑋2 = 𝑠𝑢2 = 𝑛−1 [ 2 ∑𝑛 𝑖=1 𝑢𝑖 𝑛 ∑𝑛 𝑖=1 𝑢𝑖 −( 𝑛 2 100 (−15)2 +(−10)2 +(−5)2 +52 +102 +152 100 ) ]= 99 [ − 0] = 700 99 ≈ 7,07. Пример. Найти выборочные среднее и дисперсию по заданному распределению выборки объема 𝑛 = 20: 𝑋 𝑛𝑖 0, 015 7 0, 020 8 0,023 5 Решение. Найдем выборочное среднее: 3 𝑋̅ = 1 0,015 ∙ 7 + 0,020 ∙ 8 + 0,023 ∙ 5 ∑ 𝑋𝑖 𝑛𝑖 = = 0,019. 𝑛 20 𝑖=1 Найдем выборочную дисперсию. Чтобы избежать действий с дробями перейдем к новым вариантам 𝑢𝑖 = 103 ∙ 𝑥𝑖 . Получим распределение 𝑢𝑖 𝑛𝑖 15 7 20 8 23 5 Вычислим несмещенную выборочную дисперсию этого ряда: 2 2 ∑𝑚 𝑛 ∑𝑚 𝑖=1 𝑢𝑖 𝑛𝑖 𝑖=1 𝑢𝑖 𝑛𝑖 2 𝑠𝑢 = −( [ ) ]= 𝑛−1 𝑛 𝑛 20 152 ∙ 7 + 202 ∙ 8 + 232 ∙ 5 15 ∙ 7 + 20 ∙ 8 + 23 ∙ 5 2 20 7420 380 2 [ −( ) ]= [ −( ) ]= 19 20 20 19 20 20 20 (371 − 361) ≈ 10,526. = 19 Для получения окончательного результата делим полученное значение на 𝐶 2 = 106 : 𝑠𝑢2 10,526 𝑠𝑋2 = 2 = ≈ 10,5 ∙ 10−6 . 𝐶 106 = 5.3. Точечная оценка момента связи между двумя случайными величинами. Как известно из курса теории вероятностей мера линейной связи (ковариация) между двумя случайными величинами характеризуется корреляционным моментом: 𝐾𝑋𝑌 = 𝑀[(𝑋 − 𝑚𝑋 )(𝑌 − 𝑚𝑌 )], Если теоретическая ковариация 𝐾𝑋𝑌 неизвестна, то для ее оценки может быть использована выборочная ковариация, вычисленная по ряду наблюдений: 𝑛 𝑠𝑋𝑌 1 = ∑(𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅), 𝑛−1 𝑖=1 где 𝑛 − объем выборки; 𝑥𝑖 , 𝑦𝑖 − элементы выборки; 𝑋̅, 𝑌̅ − выборочные средние случайных величин 𝑋 и 𝑌. Путем несложных преобразований из этого выражения можно получить формулу, которую часто удобно применять при практических расчетах: 𝑛 𝑠𝑋𝑌 1 = (∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑋̅𝑌̅), 𝑛−1 𝑖=1 где 𝑋̅ и 𝑌̅ − выборочные средние случайных величин 𝑋 и 𝑌, соответстенно. Эти выражения дают точечную оценку 𝑠𝑋𝑌 теоретической ковариации 𝐾𝑋𝑌 . Более точной мерой зависимости между случайными величинами является коэффициент корреляции. Подобно корреляционному моменту 𝐾𝑋𝑌 , коэффициент корреляции имеет две формы − теоретическую и выборочную. Теоретический коэффициент корреляции 𝑟𝑋𝑌 для двух случайных величин 𝑋 и 𝑌 определяется следующим образом: 𝐾𝑋𝑌 𝑟𝑋𝑌 = , 𝜎𝑋 𝜎𝑌 где 𝜎𝑋 и 𝜎𝑌 − теоретические (генеральные) дисперсии случайных величин 𝑋 и 𝑌, соответственно. ∗ Выборочный коэффициент корреляции 𝑟𝑋𝑌 является точечной оценкой для 𝑟𝑋𝑌 и определяется путем замены теоретических средних квадратичных отклонения 𝜎𝑋 и 𝜎𝑌 и ковариации 𝐾𝑋𝑌 в формуле теоретического коэффициента корреляции на их оценки: ∗ 𝑟𝑋𝑌 = 𝑠𝑋𝑌 , 𝑠𝑥 𝑠𝑦 где 𝑠𝑥 и 𝑠𝑦 − оценки теоретических среднеквадратичных отклонений 𝜎𝑋 и 𝜎𝑌 . 𝑠𝑋𝑌 − выборочная ковариация. Если оценки, входящие в формулу выборочного коэффициента корреляции будут смещенными, то это не повлияет на результат, при условии, что одни и те же смещения входят и в числитель и в знаменатель выражения. ∗ По абсолютному значению коэффициента 𝑟𝑋𝑌 оцениваем количественную меру связи: ∗ - если 𝑟𝑋𝑌 = 0 − корреляция отсутствует (данные величины между собой нейтральны); ∗ - если 0,09 ≤ |𝑟𝑋𝑌 | ≤ 0,19 − статистическая взаимосвязь очень слабая; ∗ - если 0,20 ≤ |𝑟𝑋𝑌 | ≤ 0,49 − статистическая взаимосвязь слабая; ∗ - если 0,5 ≤ |𝑟𝑋𝑌 | ≤ 0,69 − статистическая взаимосвязь средняя; ∗ - если 0,70 ≤ |𝑟𝑋𝑌 | ≤ 0,99 − статистическая взаимосвязь сильная. ∗ Таким образом, на основании расчетного 𝑟𝑋𝑌 делается вывод о том, что между исследуемыми признаками существует слабая (средняя, сильная) положительная (отрицательная) связь. Выборочный коэффициент корреляции имеет максимальное значение, равное 1, которое получается при строгой линейной положительной зависимости между выборочными значениями X и Y, и минимальное значение -1, когда существует строгая линейная отрицательная зависимость. ∗ Величина 𝑟𝑋𝑌 = 0 показывает, что корреляция между наблюдениями X и Y в выборке отсутствует. Здесь уместно напомнить, что равенство нулю коэффициента корреляции есть необходимое, но недостаточное условие независимости случайных величин, т.е. из независимости случайных величин следует их некоррелированность; напротив, из некоррелированности случайных величин еще не следует их независимость. Важно заметить, что проверки несмещенности оценки ковариации, которые проводил Р. Фишер в своей работе Fisher R.A., Jates F. Statistical Tables for Biological Agricultural and Medical Research. 3rd ed., Edinburg, 1948 основывались на предположении о том, что совместное распределение случайных величин 𝑋 и 𝑌 является нормальным. Отклонение от нормального закона может привести к сильно смещенным оценкам и как следствие к ошибочным заключениям. При использовании выборочных коэффициентов корреляции нужно помнить следующее. 1. Между двумя переменными может существовать нелинейная связь, которая не будет замечена, если в качестве меры этой связи использовать выборочный коэффициент корреляции. Так, если по данным рисунка вычислить выборочный коэффициент корреляции, то он оказался бы почти равным нулю. 2. Необходимо использовать однородные данные для того, чтобы избежать ложной корреляции, которая возникает, если при вычислении выборочного коэффициента корреляции объединяются две неоднородные группы данных. Это можно проиллюстрировать следующим рисунком 3. Наличие корреляции между двумя переменными еще не доказывает, что между ними существует причинная связь в том смысле, что некоторая совершенно отличная от рассматриваемых в нашем анализе третья величина может быть источником этой корреляции. В любом случае предположение о причинности должно всегда иметь и собственные основания, не связанные со статистикой. Продемонстрируем рассмотренные выше понятия выборочной ковариации и выборочного коэффициента корреляции на примере с реальным массивом экономических данных (http://econ.lse.ac.uk/ie/). В таблице приведены данные о потребительском спросе на бензин и реальных ценах после нефтяного кризиса. (Реальная цена вычисляется путем деления индекса номинальной цены на бензин, на общий индекс потребительских цен и умножением результата на 100). За базисный принят 1972 год. Таким образом, индекс реальной цены в таблице показывает повышение цены бензина относительно общей инфляции, начиная с 1972 г. Эти данные показаны в виде диаграммы рассеяния. Можно видеть отрицательную связь между потребительским спросом на бензин и его реальной ценой. Показатель выборочной ковариации позволяет выразить данную связь единым числом. Для его вычисления мы сначала находим средние значения цены 𝑝 и спроса 𝑦 на бензин. Обозначим эти средние значения, соответственно, как 𝑝̅ и 𝑦̅. Затем для каждого года вычисляем отклонения величин 𝑝 и 𝑦 от средних и перемножаем их. Получим таблицу: Наблюдение 1 2 3 4 5 6 7 8 9 10 Сумма Среднее 𝒑𝒊 103,5 127,0 126,0 124,8 124,7 121,6 149,7 188,8 193,6 173,9 1433,6 143,36 𝒚𝒊 26,2 24,8 25,6 26,8 27,7 28,3 27,4 25,1 25,2 25,6 262,7 26,27 ̅) (𝒑𝒊 − 𝒑 -39,86 -16,36 -17,36 -18,56 -18,66 -21,76 6,34 45,44 50,24 30,54 ̅) (𝒚𝒊 − 𝒚 -0,07 -1,47 -0,67 0,53 1,43 2,03 1,13 -1,17 -1,07 -0,67 ̅ )(𝒚𝒊 − 𝒚 ̅) (𝒑𝒊 − 𝒑 2,79 24,05 11,63 -9,84 -26,68 -44,17 7,16 -53,16 -53,76 -20,46 -162,44 -18,05 В нижней клетке последнего столбца по формуле выборочной ковариации определяется средняя величина произведения (𝑝𝑖 − 𝑝̅ )(𝑦𝑖 − 𝑦̅): 𝑛 𝑠𝑝𝑦 1 = ∑(𝑝𝑖 − 𝑝̅ )(𝑦𝑖 − 𝑦̅) ≈ −18,05 𝑛−1 𝑖=1 Ковариация в данном случае отрицательна, это означает, что между величинами 𝑝 и 𝑦 существует отрицательная связь. Разделим диаграмму рассеяния наблюдений на четыре части вертикальной и горизонтальной линиями, проведенными через средние значения 𝑝 и 𝑦, соответственно. Пересечение этих линий образует точку, которая показывает среднюю цену и средний спрос за период, соответствующий выборке. Для любого наблюдения, лежащего в квадранте A, значения реальной цены и спроса выше соответствующих средних значений. Здесь величины (𝑝 − 𝑝̅ ) и (𝑦 − 𝑦̅) принимают положительные значения, а поэтому должно быть положительным и их произведение (𝑝 − 𝑝̅ )(𝑦 − 𝑦̅). Эта группа наблюдений даёт положительный вклад в ковариацию. В квадранте B наблюдения имеют реальную цену ниже средней и спрос выше среднего. Эти наблюдения дают отрицательный вклад в ковариацию. В квадранте C как реальная цена, так и спрос ниже своих средних значений. Наблюдения дают положительный вклад в ковариацию. Наконец в квадранте D реальная цена выше средней, а спрос ниже среднего. Наблюдения дают отрицательный вклад в ковариацию Поскольку выборочная ковариация является средней величиной произведения для 10 наблюдений, входящих в таблицу она будет положительной, если положительные вклады будут доминировать над отрицательными, и отрицательной, если будут доминировать отрицательные вклады. Положительные вклады исходят из квадрантов A и C , и ковариация будет, скорее всего, положительной, если основной разброс пойдет по наклонной вверх. Точно так же отрицательные вклады исходят из квадрантов B и D. Поэтому если основное рассеяние идет по наклонной вниз, как в данном примере, то ковариация будет, скорее всего, отрицательной. ∗ Перейдем к расчету выборочного коэффициента корреляции 𝑟𝑋𝑌 . Дополним таблицу столбцами, в которых содержатся квадраты отклонений цены 𝑝 и спроса 𝑦 от своих выборочных средних 𝑝̅ и 𝑦̅: Наблюдение 1 2 3 4 5 6 7 8 9 10 Сумма Среднее 𝒑𝒊 103,5 127,0 126,0 124,8 124,7 121,6 149,7 188,8 193,6 173,9 1433,6 143,36 𝒚𝒊 26,2 24,8 25,6 26,8 27,7 28,3 27,4 25,1 25,2 25,6 262,7 26,27 ̅) (𝒑𝒊 − 𝒑 -39,86 -16,36 -17,36 -18,56 -18,66 -21,76 6,34 45,44 50,24 30,54 ̅) (𝒚𝒊 − 𝒚 -0,07 -1,47 -0,67 0,53 1,43 2,03 1,13 -1,17 -1,07 -0,67 ̅ )𝟐 (𝒑𝒊 − 𝒑 1588,82 267,65 301,37 344,47 348,20 473,50 40,20 2064,79 2524,06 932,69 8885,75 987,31 ̅)𝟐 (𝒚𝒊 − 𝒚 0,01 2,16 0,45 0,28 2,05 4,12 1,28 1,37 1,15 0,45 13,30 1,48 Средние значения квадратов этих отклонений, рассчитаны по общей формуле выборочной дисперсии: 1 1 𝑠𝑝2 = 𝑛−1 ∑𝑛𝑖=1(𝑝𝑖 − 𝑝̅ )2 ≈ 987,31 ; 𝑠𝑦2 = 𝑛−1 ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 ≈ 1,48. Соответственно, выборочные среднеквадратичные отклонения равны: 𝑠𝑝 = √𝑠𝑝2 = √987,31 ≈ 31,42; 𝑠𝑦 = √𝑠𝑦2 = √1,48 ≈ 1,22. Тогда выборочный коэффициент корреляции равен: ∗ 𝑟𝑝𝑦 = 𝑠𝑝𝑦 −18,05 ≈ ≈ −0,47. 𝑠𝑝 𝑠𝑦 31,42 ∙ 1,22 Корреляционная связь между ценой на бензин и спросом слабая, т.е. несмотря на рост цен, спрос остается относительно стабильным. При интерпретации результатов исследования зависимости между случайными величинами часто необходимо учитывать следующее. Если одна величина коррелирована с другой, то это может быть всего лишь отражением того факта, что они обе коррелированы с некоторой третьей величиной или с совокупностью величин, которые, образно говоря, остаются за кадром и не введены в рассмотрение. Указанная ситуация приводит к понятию условных корреляций между двумя величинами при фиксированных значениях остальных величин. Это так называемые частные корреляции. Если корреляция между двумя величинами уменьшается, когда мы фиксируем некоторую другую случайную величину, то это означает, что их взаимозависимость возникает частично через воздействие этой величины. Если же частная корреляция равна нулю или очень мала, то мы делаем вывод, что их взаимозависимость целиком обусловлена собственным воздействием и никак не связана с третьей величиной. Наоборот, если частная корреляция больше первоначальной корреляции между двумя величинами, то мы заключаем, что другие величины ослабили связь, или, можно сказать, "скрыли" объективно существующую корреляцию. Рассмотрим более подробно понятие частной корреляции. Пусть при заданной величине 𝑋3 величины 𝑋1 и 𝑋2 имеют двумерное нормальное распределение с коэффициентом корреляции 𝑠12 ∗ 𝑟12 = , 𝑠1 𝑠2 где 𝑠12 − выборочная ковариация между случайными величинами 𝑋1 и 𝑋2 , 𝑠1 и 𝑠2 − выборочные среднеквадратичные отклонения величин 𝑋1 и 𝑋2 , соответственно. Тогда частный коэффициент корреляции между 𝑋1 и 𝑋2 при фиксированном значении 𝑋3 определяется по формуле ∗ 𝑟12|3 = 𝑠12 − 𝑠13 𝑠23 , 2 2 √(1 − 𝑠13 )(1 − 𝑠23 ) ∗ где 𝑟12|3 − выборочный коэффициент частной корреляции между 𝑋1 и 𝑋2 в случае постоянства воздействия величины 𝑋3 , 𝑠12 − выборочная ковариация между случайными величинами 𝑋1 и 𝑋2 , 𝑠13 − выборочная ковариация между случайными величинами 𝑋1 и 𝑋3 , 𝑠23 − выборочная ковариация между случайными величинами 𝑋2 и 𝑋3 . Вернемся к предыдущему примеру. Мы остановились на том, что корреляционная связь между ценой на бензин и спросом слабая, т.е. несмотря на рост цен, спрос остается относительно стабильным. Хотя интуитивно понятно, что спрос должен падать. В терминах математической статистики это означает, что между ценами и спросом должна быть значительная отрицательная корреляция. Причина слабой корреляции между ростом цен на бензин 𝑝 и спросом 𝑦 на него может заключаться в том, что не было учтено влияние увеличения личного дохода 𝑖 на спрос. Проверим справедливость этого предположения. В примере со спросом на бензин можно вычислить корреляцию, с одной стороны, между ∗ ∗ ценой и личным доходом − 𝑟𝑝𝑖 и, с другой стороны, между спросом и доходом − 𝑟𝑦𝑖 . В том же массиве данных, из которых была взята первоначальная таблица, содержится выборка личных ∗ ∗ доходов, необходимая для расчета коэффициентов 𝑟𝑝𝑖 и 𝑟𝑦𝑖 . Мы не будем подробно останавливаться на расчете этих коэффициентов корреляции, поскольку они определяются ∗ аналогично тому, как рассчитывался первоначальный коэффициент корреляции 𝑟𝑝𝑦 . Приведем ∗ ∗ лишь результат этих расчетов: 𝑟𝑝𝑖 ≈ 0,02 и 𝑟𝑦𝑖 ≈0,84. Подставим их в уравнение частной корреляции, вычисленной при фиксированном доходе: ∗ 𝑟𝑝𝑦|𝑖 = 𝑠𝑝𝑦 − 𝑠𝑝𝑖 𝑠𝑦𝑖 2 2 )(1 − 𝑠𝑦𝑖 ) √(1 − 𝑠𝑝𝑖 = −0,47 − 0,02 ∙ 0,84 √(1 − 0,022 )(1 − 0,842 ) ≈ − 0,91, Делаем вывод: полученный ранее низкий уровень статистической взаимосвязи между ∗ ценами на бензин и спросом (𝑟𝑝𝑦 ≈ −0,47) был обусловлен ростом личного дохода, т.е. положительный эффект увеличения личного дохода в основном компенсировал отрицательный эффект роста цен, и, таким образом, спрос на бензин оставался стабильным. Как только личный доход 𝑖 был зафиксирован, проявилась скрытая до этого сильная отрицательная корреляционная связь между ценами 𝑝 и спросом 𝑦. Тема 6. Интервальные оценки параметров распределения. 6.1. Понятие интервальной оценки параметра распределения. В ряде задач требуется найти для параметра 𝛩 не только подходящее численное значение, но и оценить его точность и надежность. Требуется знать — к каким ошибкам может привести замена параметра 𝛩 его точечной оценкой 𝛩∗ , и с какой степенью уверенности можно ожидать, что эти ошибки не выйдут за известные пределы. Такого рода задачи особенно актуальны при малом числе наблюдений, когда точечная оценка 𝛩∗ в значительной мере случайна и приближенная замена 𝛩 на 𝛩∗ может привести к серьезным ошибкам. Чтобы дать представление о точности и надежности оценки 𝛩∗ , в математической статистике используются так называемые интервальные оценки, и связанные с ней понятия доверительного интервала и доверительной вероятности. Определение. Интервальной оценкой неизвестного параметра 𝛩 называется числовой интервал, который с заданной вероятностью накрывает неизвестное значение параметра 𝛩. Пусть для параметра 𝛩 получена из опыта несмещенная оценка 𝛩∗ . Мы хотим определить точность этой оценки. Для этого назначаем достаточно большую вероятность 𝛽, например, 0,9, 0,95 или 0,99 и находим такие значения 𝜀1 и 𝜀2 , для которого 𝑃( 𝛩∗ − 𝜀1 < 𝛩 < 𝛩∗ + 𝜀2 ) = 1 − 𝛼 = 𝛽. Это означает, что интервал (𝛩∗ − 𝜀1 ; 𝛩∗ + 𝜀2 ) заключает в себе (накрывает) неизвестный параметр 𝛩 с вероятностью 𝛽 = 1 − 𝛼. Сам интервал (𝛩∗ − 𝜀1 ; 𝛩∗ + 𝜀2 ) называется доверительным интервалом, а величина 𝛽 = 1 − 𝛼 называется доверительной вероятностью. Числа 𝛩∗ − 𝜀1 и 𝛩∗ + 𝜀2 называются доверительными границами. Число 𝛼 называется уровнем значимости. Диапазон возможных значений ошибки, возникающей при замене 𝛩 на 𝛩∗ будет ∗ ( 𝛩 − 𝜀1 ; 𝛩∗ + 𝜀2 ). Бо́ льшие ошибки, т.е. ошибки, выходящие за пределы этого интервала будут появляться только с вероятностью 𝛼 = 1 − 𝛽. Остановимся подробнее на смысле терминов, связанных с понятием интервальной оценки. Доверительная вероятность 𝛽 характеризует степень доверия к событию, состоящему в том, что неизвестный неслучайный параметр 𝛩 содержится внутри доверительного интервала (𝛩∗ − 𝜀1 ; 𝛩∗ + 𝜀2 ). Иными словами доверительная вероятность 𝛽 характеризует надежность оценки. Уровень значимости α характеризует риск наступления события, состоящего в том, что параметр 𝛩 в интервале (𝛩∗ − 𝜀1 ; 𝛩∗ + 𝜀2 ) не содержится. Чем более существенны последствия ошибки утверждения, что параметр не содержится в доверительном интервале, тем меньшим уровнем значимости 𝛼 нужно задаваться. Доверительные границы 𝛩∗ − 𝜀1 и 𝛩∗ + 𝜀2 , а, значит, и длина доверительного интервала определяются из выборочных данных, т.е. являются функциями случайных величин 𝑥1 , 𝑥2 , … , 𝑥𝑛 и, следовательно, сами являются случайными величинами. Длина доверительного интервала характеризует точность оценки. Она существенно зависит от объем выборки 𝑛 и от значения доверительной вероятности 𝛽: с увеличением 𝑛 доверительный интервал уменьшается (точность оценки увеличивается), с увеличением 𝛽 доверительный интервал увеличивается (точность оценки уменьшается). Естественно, чем больше надежность оценки, тем длиннее доверительный интервал, т.е. меньше точность, и наоборот. Так что практические вычисления являются компромиссом между точностью и надежностью оценки. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999, что соответствует уровням значимости 0,05; 0,01 и 0,001. Выбор надежности (уровня значимости) оценки определяется исходя из условий конкретной решаемой задачи. Особо отметим следующее обстоятельство. В теории вероятностей рассматривалась задача вычисления вероятности попадания случайной величины в заданный неслучайный интервал. Здесь дело обстоит иначе: параметр распределения 𝛩 – неслучайная величина, случайным является интервал (𝛩∗ − 𝜀1 ; 𝛩∗ + 𝜀2 ). Случайно его положение на числовой оси, определяемое величиной 𝛩∗ , случайна и длина интервала, поскольку 𝜀1 и 𝜀2 также являются случайными величинами, зависящими от опытных данных. Поэтому, в данном случае, вероятность 𝛽 следует толковать не как вероятность попадания точки 𝛩 в интервал (𝛩∗ − 𝜀1 ; 𝛩∗ + 𝜀2 ), а как вероятность того, что фиксированная точка 𝛩 будет «накрыта» случайным интервалом (𝛩∗ − 𝜀1 ; 𝛩∗ + 𝜀2 ). Наглядное представление о доверительном интервале (𝛩∗ − 𝜀1 ; 𝛩∗ + 𝜀2 ), доверительной вероятности 𝛽 = 1 − 𝛼 и уровне значимости 𝛼 можно получить из рисунка: Если плотность распределения оценки 𝛩∗ симметрична относительно параметра, 𝛩 применяют следующий способ получения интервальной оценки: 𝑃(| 𝛩∗ − 𝛩 | < 𝜀) = 𝛽 = 1 − 𝛼. Здесь точность оценки характеризуется величиной 𝜀, которая представляет собой наибольшее отклонение несмещенной оценки 𝛩∗ от оцениваемого параметра 𝛩. При несимметричной плотности распределения 𝛩∗ , для нахождения доверительных границ часто пользуются условиями 𝛼 𝑃( 𝛩 < 𝛩∗ − 𝜀1 ) = 𝑃( 𝛩 > 𝛩∗ − 𝜀1 ) = . 2 С интервальной оценкой неизвестного параметра 𝛩 связано решение трех типов задач. 1) Определение доверительного интервала по заданной доверительной вероятности и объему выборки. 2) Определение доверительной вероятности по заданному доверительному интервалу и объему выборки. 3) Определение необходимого объема выборки по заданной доверительной вероятности и заданному доверительному интервалу. Рассмотрим подходы к решению этих задач на примере интервальной оценки для математического ожидания. 6.2. Методы построения доверительных интервалов параметров распределения. Первый подход к построению доверительного интервала основан на знании закона распределения точечной оценки параметра. Этот подход применим для выборок большого объема (порядка нескольких десятков наблюдений). Поскольку величина 𝑋̅ по существу представляет собой сумму 𝑛 одинаково распределенных независимых случайных величин 𝑋𝑖 , то согласно центральной предельной теореме (часть I, п.14.2), при достаточно большом числе наблюдений (𝒏 > 𝟑𝟎), закон распределения суммы случайных величин практически можно считать нормальным, и формула нахождения доверительного интервала примет вид (часть I, п.11.5.2) 𝑃(|𝑋̅ − 𝑚𝑥 | < 𝜀) = 𝛽. 𝜀 2𝑃 (𝜎 ) − 1 = 𝛽, ̅ 𝑋 или, если использовать функцию Лапласа 𝜀 𝜎𝑋̅ Ф ( ) = 𝛽. 𝜀 𝜎𝑋̅ где 𝑃 ( ) − функция нормального распределения нормированного отклонения 𝑢 = генерального среднего 𝑚𝑋 (часть I, приложение); 𝜀 𝜎𝑋̅ оценки 𝑋̅ от 𝜀 Ф (𝜎 ) − функция Лапласа; ̅ 𝑋 𝜀 − максимальная величина нормированного отклонения оценки 𝑋̅ от генерального 𝜎𝑋̅ 𝜎 𝜎𝑋̅ = 𝑋𝑛 − среднеквадратичное отклонение оценки 𝑋̅ от генерального среднего 𝑚𝑋 . √ среднего 𝑚𝑥 , Из этого уравнения следует: 𝑃( 𝜀 1+𝛽 )= . 𝜎𝑋̅ 2 По таблице приложения части I находим такое значение аргумента 𝑢𝛽 функции 𝑃(𝑢) стандартного нормального распределения, при котором она равна 1+𝛽 . 2 𝜀 = 𝑢𝛽 𝜎𝑋̅ = 𝑢𝛽 Отсюда находим доверительный интервал Тогда 𝜎𝑋 √𝑛 . 𝜎 𝜎 (𝑋̅ − 𝜀; 𝑋̅ + 𝜀) = (𝑋̅ − 𝑢𝛽 𝑋 ; 𝑋̅ + 𝑢𝛽 𝑋 ). 𝑛 𝑛 √ √ Если параметр 𝜎𝑋 закона распределения 𝑋 неизвестен, то его заменяют точечной оценкой 𝑠𝑋 : 𝜎𝑋 ≈ 𝑠𝑋 . Такая замена не приведет к сколь-нибудь значительной погрешности, при большом объеме выборки, в силу состоятельности оценки 𝑠𝑋 . Учитывая, что (п.5.1) 𝜎𝑋̅ = можно записать 𝜎𝑋̅ ≈ Тогда 2𝑃 ( Из этого уравнения находим значение 𝜀: 𝜎𝑋 √𝑛 𝑠𝑋 √𝑛 , . √𝑛 ∙ 𝜀 ) − 1 = 𝛽. 𝑠𝑋 𝜀 = 𝑢𝛽 𝑠𝑋 √𝑛 , где 𝑢𝛽 находится по таблице стандартного нормального отклонения из условия 𝑃(𝑢𝛽 ) = 1+𝛽 2 Таким образом, найден доверительный интервал 𝑠 𝑠 (𝑋̅ − 𝜀; 𝑋̅ + 𝜀) = (𝑋̅ − 𝑋 𝑢𝛽 ; 𝑋̅ + 𝑋 𝑢𝛽 ). 𝑛 𝑛 √ √ Пример. В результате обработки данных 50 измерений случайной величины 𝑋 получена точечная несмещенная оценка 𝑋̅ = 10 для её математического ожидания 𝑚𝑥 . Есть основание предполагать, что теоретическая дисперсия 𝑋 равна: 𝜎𝑋2 = 0,09. Требуется: 1) определить с вероятностью 𝛽 = 0,95 доверительный интервал для выборочного среднего значения 𝑋̅; 2) определить при тех же условиях задачи, с какой доверительной вероятностью можно гарантировать ошибку выборки, не превышающую 𝜀 =0,05; 3) определить объем выборки, при котором указанная предельная ошибка ε = 0,05 гарантируется с вероятностью 𝛽 = 0,95. Решение. 1) На основании центральной предельной теоремы предполагаем, что выборочная средняя 𝑋̅ распределена по нормальному закону. Вычисляем выборочное среднеквадратичное отклонение для 𝑋̅: 𝜎𝑋 0,3 √0,09 𝜎𝑋̅ = = ≈ ≈ 0,0424. 7,07 √𝑛 √50 Из условия: 𝑃(𝑢𝛽 ) = 1+𝛽 1,95 = = 0,975 2 2 находим аргумент 𝑢𝛽 = 1,96 (по таблице часть I, приложение) Следовательно, Тогда 𝜀 = 1,96 ∙ 0,424 ≈ 0,083. 𝜀 = 1,96. 𝜎𝑋̅ Таким образом, получаем, что с вероятностью 𝛽 = 0,95 истинное значение математическое ожидание 𝑚𝑋 случайной величины 𝑋 содержится в интервале (9,917; 10,083). Это и есть интервальная оценка математического ожидания. 2) Ответим теперь на следующий вопрос. С какой доверительной вероятностью можно гарантировать ошибку выборки, не превышающую 0,05? По величине ε = 0,05 вычисляем 𝜀 √𝑛 0,05 ∙ √50 𝑢𝛽 = = ≈ 1,18. 𝜎𝑋 0,3 По таблице стандартной функции нормального распределения находим 𝑃(𝑢𝛽 ) = 𝑃(1,18) = 0,881. Искомую доверительную вероятность 𝛽 вычисляем по формуле 𝛽 = 2𝑃(𝑢𝛽 ) − 1 = 2 ∙ 0,881 − 1 = 0,762. 3) Определим объем выборки 𝑛, при котором указанная предельная ошибка ε = 0,05 гарантируется с вероятностью 𝛽 = 0,95. Вычислим 𝑃(𝑢𝛽 ): 1 + 𝛽 1,95 𝑃(𝑢𝛽 ) = = = 0,975. 2 2 Из таблицы стандартной функции нормального распределения находим соответствующее значение 𝑢𝛽 = 1,96. Тогда искомый объем выборки составит 𝑢𝛽 𝜎𝑋 2 1,96 ∙ 0,3 2 𝑛=( ) =( ) ≈ 138,3 ≈ 140. 𝜀 0,05 Пример. Результаты исследования длительности оборота (в днях) оборотных средств торговых фирм города, проведенные по выборке, состоящей из 50 фирм, представлены в виде интервального статистического ряда: Длительность [24 - 32) [32 - 40) [40 - 48) [48 – 56) оборота, 𝑋 Число фирм, 𝑛𝑖 2 4 10 [56 – 64) [64 – 72) [72 – 80) 11 5 3 15 Построить доверительный интервал с надежностью 𝛽 = 0,99 для средней длительности 𝑚𝑋 оборота всех торговых фирм города. Решение. Сразу заметим, что в отличие от предыдущего примера, в данной задаче нам неизвестно среднеквадратичное отклонение 𝜎𝑋 генеральной совокупности. Для нахождения точечных оценок параметров 𝑚𝑥 и 𝜎𝑋 перейдем от интервального статистического ряда к вариационному ряду. Для этого вычислим середины каждого интервала и примем их в качестве вариантов: Длительность оборота, 𝑥𝑖 28 36 44 52 60 68 76 Число фирм, 𝑛𝑖 2 4 10 15 11 5 3 Вычислим выборочную среднюю длительности оборота: 𝑚 1 1 𝑋̅ = ∑ 𝑥𝑖 𝑛𝑖 = (28 ∙ 2 + 36 ∙ 4 + 44 ∙ 10 + 52 ∙ 15 + 60 ∙ 11 + 68 ∙ 5 + 76 ∙ 3) = 52,96. 𝑛 50 𝑖=1 Вычислим выборочную дисперсию длительности оборота. Для упрощения примем при расчете 𝑋̅ ≈53. 𝑚 1 1 2 𝑠𝑋 = ∑(𝑥𝑖 − 𝑋̅)2 𝑛𝑖 = [(28 − 53)2 ∙ 2 + (36 − 53)2 ∙ 4 + (44 − 53)2 ∙ 10 + 𝑛−1 49 𝑖=1 +(52 − 53)2 ∙ 15 + (60 − 53)2 ∙ 11 + (68 − 53)2 ∙ 5 + (76 − 53)2 ∙ 3] ≈ 132,29. Отсюда находим выборочное среднеквадратичное отклонение: 𝑠𝑋 = √𝑠𝑋2 = √132,29 ≈ 11,5. Из условия: 1+𝛽 1,99 = = 0,995 2 2 находим аргумент 𝑢𝛽 = 2,575 (по таблице часть I, приложение). Тогда, принимая во внимание, что для выборки большого объема 𝜎𝑋 ≈ 𝑠𝑋 : 𝑃(𝑢𝛽 ) = 𝜀 = 𝑢𝛽 𝑠𝑋 √𝑛 = 2,575 ∙ 11,5 √50 ≈ 4,19, а, следовательно, доверительный интервал (𝑋̅ − 𝜀; 𝑋̅ + 𝜀) ≈ (48,41; 57,15) с надежностью 0,99. Мы рассмотрели подход к вычислению интервальной оценки математического ожидания, основанный на условиях: − закон распределения случайной величины известен; − имеется выборка большого объема. Попытка вычислить аналогичным образом интервальную оценку дисперсии, приведёт к сложным выкладкам. В этом нет необходимости, тем более что существуют точные методы построения доверительных интервалов, как для математического ожидания, так и для дисперсии случайной величины. Кроме того, на практике часто приходится иметь дело с выборками малого объема, когда 𝑛 < 20. В этом случае рассмотренный выше подход к построению доверительного интервала неприменим даже для математического ожидания, так как при малом объёме выборки: 1) центральная предельная теорема не позволяет сделать обоснованный вывод о нормальном распределении точечной оценки 𝑋̅ математического ожидания 𝑚𝑋 . 2) в силу закона больших чисел будет слишком мала вероятность того, что 𝜎𝑋 ≈ 𝑠𝑋 с приемлемой точностью. Перейдём к описанию точных методов построения доверительных интервалов для параметров 𝑚𝑋 и 𝜎𝑋 . 6.2.1. Распределение 𝝌𝟐 . Точный метод интервальной оценки дисперсии при малых объёмах выборки. Распределение χ2 находит широкое теоретическое и практическое применение, а именно: 1) получение доверительных интервалов для дисперсии и среднего квадратичного отклонения; 2) проверка согласия экспериментальных наблюдений с предполагаемыми распределениями вероятности; 3) проверка независимости переменных; 4) получение выборочного распределения для среднего квадратичного отклонения, ковариации, относительного отклонения и т. д. Рассмотрим общий случай − случай неравноточных наблюдений. Пусть 𝑋1 , 𝑋2 , … , 𝑋𝜈 − набор 𝜈 наблюденных независимых случайных величин, каждая из которых распределена по нормальному закону с соответствующими параметрами (𝑚1 , 𝜎1 ), (𝑚2 , 𝜎2 ), … , (𝑚𝜈 , 𝜎𝜈 ). Закон распределения оценки того или иного параметра зависит от самих неизвестных параметров величин 𝑋1 , 𝑋2 , … , 𝑋𝜈 . Если вычислить соответствующие нормированные случайные величины 𝑈1 , 𝑈2 , … , 𝑈𝜈 𝑋𝑖 − 𝑚𝑖 , 𝑖 = 1, 2, … , 𝜈, 𝜎𝑖 то придем к случайным величинам, закон распределения которых уже не зависит от неизвестных параметров (𝑚1 , 𝜎1 ), (𝑚2 , 𝜎2 ), … , (𝑚𝜈 , 𝜎𝜈 ), а зависит только от числа наблюдений 𝜈 и от вида закона распределения случайной величины 𝑋. Если случайная величина 𝑿 распределена по нормальному закону, то случайные величины 𝑼𝒊 имеют стандартное нормальное распределение с параметрами 𝒎𝑼 = 𝟎 и 𝝈𝑼 = 𝟏. В дальнейшем, стандартное нормальное распределение будем иногда обозначать для краткости как 𝑁(0; 1). Обозначим сумму 𝑈𝑖2 через 𝜒 2 : 𝜈 𝜈 𝑋𝑖 − 𝑚𝑖 2 2 2 2 2 2 𝜒 = 𝑈1 + 𝑈2 + ⋯ + 𝑈𝜈 = ∑ 𝑈𝑖 = ∑ ( ) . 𝜎𝑖 𝑈𝑖 = 𝑖=1 𝑖=1 Число 𝝂 в этой формуле называется числом степеней свободы случайной величины 𝝌𝟐 . Распределение величины 𝜒 2 зависит только от 𝜈, поскольку величины 𝑈𝑖 нормированы. Таким образом, число степеней свобода 𝝂 можно считать параметром распределения 𝝌𝟐 . Плотность распределения вероятностей для 𝜒 2 равна 𝑝(𝜒 2 ) = 1 2 𝜈⁄ 2 Г(𝜈⁄ 𝜒2 𝜈⁄ )−1 −( ⁄2) 2 𝑒 , (𝜒 2 )( 2) ∞ −𝑥 (𝜈⁄ )−1 𝜈 где Г( ⁄2) = ∫0 𝑒 𝑥 2 𝑑𝑥 − гамма функция Эйлера. Интегрируя по частям, можно получить 𝜈 𝜈 Г(𝜈⁄2) = (2 − 1) Г (2 − 1), 𝜈 следовательно, если 2 − целое число, то 𝜈 Г(𝜈⁄2) = (2 − 1) !. График плотности распределения случайной величины 𝜒 2 приведен на следующем рисунке Математическое ожидание распределения 𝜒 2 равно числу степеней свободы: 𝜈 𝑀(𝜒 2) = 𝜈 𝑀 [∑ 𝑈𝑖2 ] 𝑖=1 = ∑ 𝑀[(𝑈𝑖 − 0)2 ] = 1 + 1 + ⋯ + 1 = 𝜈, 𝑖=1 так как дисперсия величины 𝑈𝑖 равна единице, т.е. 𝑀[(𝑈𝑖 − 0)2 ] = 1. Непосредственным интегрированием можно показать, что 𝐷(𝜒 2 ) = 2𝜈. Интегральная функция распределения 𝜒 2 равна 𝜒02 𝑃(𝜒02 ) 2 = 𝑃(𝜒 ≤ 𝜒02 ) =∫ 0 1 2 𝜈⁄ 2 Г(𝜈⁄ 2) 𝜒2 𝜈⁄ )−1 −( ⁄2) ( 2 (𝜒 ) 2 𝑒 𝑑(𝜒 2 ). Таблицы для 𝑃(𝜒02 ) представлены в приложении 1. Ниже приведен фрагмент этой таблицы Число степеней свободы Вероятность того, что значение 𝜒 2 меньше, чем указанные в таблице значения 𝜒02 𝑃(𝜒02 ) = 𝑃(𝜒 2 ≤ 𝜒02 ) 𝜈 0,01 0,05 0,5 0,9 0,95 0,99 0,999 1 1,57∙ 10−4 0,00395 0,455 2,706 3,841 6,635 10,827 10 2,558 3,940 9,342 15,987 18,307 23,209 29,588 Как видим, входами в таблицу 𝜒 2 − распределения являются число степеней свободы 𝜈 и вероятность 𝑃(𝜒02 ) = 𝑃(𝜒 2 ≤ 𝜒02 ). Выходом таблицы являются соответствующие значения 𝜒02 . Например, для 𝜈 = 10 и 𝑃(𝜒 2 ≤ 𝜒02 ) = 0,95 из таблицы получаем 𝜒02 = 18,307. Для нас представляет практический интерес следующий частный случай применения распределения 𝜒 2 . Установлено, что для нормально распределенной переменной 𝑋 с параметрами 𝑚𝑋 , 𝜎𝑋 𝑋𝑖 −𝑋̅ 2 ) 𝜎𝑋 величина ∑𝑛𝑖=1 ( имеет 𝜒 2 − распределение с (𝑛 − 1) степенями свободы, т.е. 𝑛 2 𝑋𝑖 − 𝑋̅ 𝜒 = ∑( ) , 𝜎𝑋 2 если 𝜈 = 𝑛 − 1, 𝑖=1 где 𝑛 – число наблюдений. Тогда, считая, что 𝜈 = 𝑛 − 1 получим 𝑛 𝜒2 1 1 𝑠𝑋2 2 ̅ = 2∙ ∑ (𝑋 − 𝑋) = 2 , 𝜈 𝜎𝑋 𝑛 − 1 𝑖=1 𝑖 𝜎𝑋 Следовательно, 𝑠𝑋2 = 𝜎𝑋2 𝜒2 , 𝜈 = 𝑛 − 1. 𝜈 Установленный факт дает возможность найти закон распределения выборочной дисперсии по распределению 𝜒 2 . Плотность распределения 𝑠𝑋2 для различного числа наблюдений 𝑛 показана на следующем рисунке 𝑠𝑋2 Из рисунка в частности видно, что распределение выборочной дисперсии 𝑠𝑋2 стремится к нормальному с увеличением числа наблюдений 𝑛. Поставим теперь вопрос об интервальной оценке 𝜎𝑋 , т.е., о построении доверительного интервала, покрывающего параметр 𝜎𝑋 с заданной надежностью 𝛽. Чтобы найти доверительный интервал для дисперсии случайной величины X, можно интегральную функцию 𝜒 2 − распределение и записать 𝑃(𝜒12 < 𝜒 2 ≤ 𝜒22 ) = 𝑃(𝜒12 ) − 𝑃(𝜒22 ) На следующем рисунке графически дана интерпретация этого выражения как площади под кривой плотности 𝜒 2 − распределения: Подставив 𝜒 2 = 2 𝑠𝑋 𝜈 2 𝜎𝑋 в неравенство 𝜒12 < 𝜒 2 ≤ 𝜒22 , получим 𝜒12 < 𝑠𝑋2 𝜈 ≤ 𝜒22 , 𝜎𝑋2 где 𝑠𝑋2 − несмещённая точечная оценка дисперсии 𝜎𝑋2 . Откуда следует формула интервальной оценки дисперсии 𝜎𝑋2 : 𝑠𝑋2 𝜈 𝑠𝑋2 𝜈 2 ≤ 𝜎 < . 𝑋 𝜒22 𝜒12 Очевидно, что при одном и том же значении 𝛽 заштрихованной площади величины 𝜒12 и 𝜒22 определяются неоднозначно. Обычно 𝜒12 и 𝜒22 выбирают таким образом, чтобы выполнялось равенство вероятностей событий 𝜒 2 < 𝜒12 и 𝜒 2 > 𝜒22 , т.е.: 𝑃(𝜒 2 < 𝜒12 ) = 𝑃(𝜒 2 > 𝜒22 ) = 1−𝛽 . 2 Тогда, если учесть, что 𝑃(𝜒12 ) = (𝑃(𝜒 2 < 𝜒12 ) = 1−𝛽 2 и 𝑃(𝜒 2 > 𝜒22 ) = 1 − 𝑃(𝜒 2 ≤ 𝜒22 ) = 1 − 𝑃(𝜒22 ) = 1−𝛽 2 → 𝑃(𝜒22 ) = 1 − 1−𝛽 1+𝛽 = , 2 2 можно, по заданной доверительной вероятности 𝛽 вычислить 𝑃(𝜒12 ) и 𝑃(𝜒22 ). Далее, зная значения 𝑃(𝜒12 ) и 𝑃(𝜒22 ) и число степеней свободы 𝜈 = 𝑛 − 1, по таблице приложения 1 находим 𝜒12 и 𝜒22 . Наконец, подставляем найденные значения 𝜒12 и 𝜒22 в выражение для интервальной оценки дисперсии, приведенное выше и получаем искомый доверительный интервал. Пример. Результаты исследования длительности оборота (в днях) оборотных средств торговых фирм города, проведенные по выборке, состоящей из 50 фирм, представлены в виде вариационного ряда: Длительность оборота, 𝑥𝑖 28 36 44 52 60 68 76 Число фирм, 𝑛𝑖 2 4 10 15 11 5 3 Предполагая, что случайная величина 𝑋 − длительность оборота имеет нормальное распределение, найти границы, в которых с вероятностью 𝛽 = 0,9 заключены дисперсия 𝜎𝑋2 и среднеквадратичное отклонение 𝜎𝑋 длительности оборота. Решение. В формуле интервальной оценки дисперсии 𝜎𝑋2 : 𝑠𝑋2 𝜈 𝑠𝑋2 𝜈 2 ≤ 𝜎𝑋 < 2 𝜒22 𝜒1 нам известно число степеней свободы = 𝑛 − 1 = 50 − 1 = 49. Неизвестными величинами являются значения 𝜒12 , 𝜒22 и выборочная дисперсия 𝑠𝑋2 . 1. Найдем выборочную дисперсию 𝑠𝑋2 : 𝑚 𝑚 𝑖=1 𝑖=1 2 1 1 𝑠𝑋2 = [∑ 𝑥𝑖2 𝑛𝑖 − (∑ 𝑥𝑖 𝑛𝑖 ) ] = 𝑛−1 𝑛 1 [282 ∙ 2 + 362 ∙ 4 + 442 ∙ 10 + 522 ∙ 15 + 602 ∙ 11 + 682 ∙ 5 + 762 ∙ 3 − 49 − 1 (28 ∙ 2 + 36 ∙ 4 + 44 ∙ 10 + 52 ∙ 15 + 60 ∙ 11 + 68 ∙ 5 + 76 ∙ 3)2 ] ≈ 132,28. 50 2. Найдем 𝜒12 и 𝜒22 . 𝑃(𝜒12 ) = 1 − 𝛽 1 − 0,9 = = 0,05, 2 2 𝑃(𝜒22 ) = 1 + 𝛽 1 + 0,9 = = 0,95. 2 2 По таблице приложения 2 находим: 𝜒12 ≈ 34,8; 𝜒22 ≈ 67,5. По формуле интервальной оценки дисперсии получаем 132,28 ∙ 49 132,28 ∙ 49 ≤ 𝜎𝑋2 < 67,5 34,76 или 96,02 ≤ 𝜎𝑋2 < 184,5. Отсюда доверительный интервал для среднеквадратичного отклонения: √96,02 < 𝜎𝑋 < √184,5 или 9,8 < 𝜎𝑋 < 13,58. 6.2.2. Распределение t. Точный метод интервальной оценки математического ожидания при малых объёмах выборки. Вторым из числа распределений, широко используемых в статистических проверках, является 𝒕 − распределение Стьюдента или просто распределение t. Это распределение впервые было предложено В. Госсетом (под псевдонимом «Стьюдент») и затем более строго обосновано Р. Фишером. Распределение 𝑡 используется для нахождения доверительных интервалов средних значений, а также при проверке гипотез. Рассмотрим случайную величину 𝑡, представляющую собой отношение двух независимых случайных переменных: нормированной переменной 𝑈, распределенной по нормальному закону 𝜒2 𝜈 𝑁(0; 1) и случайной переменной √ : 𝑡= 𝑈 √𝜒 2 ⁄𝜈 , где 𝜈 − число степеней свободы переменной 𝜒 2 . Отметим, что число степеней свободы 𝜈 для случайной величины 𝑡 на единицу меньше числа наблюдений 𝑛, т.е. 𝜈 = 𝑛 − 1, поскольку число степеней свободы определяется всегда как число наблюдений 𝑛 минус число уравнений, связывающих эти наблюдения. Случайную переменную 𝑡 можно привести к нормированному виду 𝑡= 𝑋̅ − 𝑚𝑋 , 𝑠𝑋̅ где 𝑋̅ − выборочное среднее; 𝑚𝑋 − генеральное среднее; 𝑠𝑋̅ − выборочное среднеквадратичное отклонение 𝑋̅ от 𝑚𝑋 . Действительно, при рассмотрении распределения 𝜒 2 (п. 6.2.1) было установлено, что 𝜒 2 𝑠𝑋2 = 2. 𝜈 𝜎𝑋 Отсюда (𝑋̅ − 𝑚𝑋 )√𝜈 𝑋̅ − 𝑚𝑋 𝑈 𝑋𝑖 − 𝑚𝑋 1 = ∙ = = , 𝑠𝑋 𝑠𝑋̅ 𝜎𝑋 ⁄√𝜈 𝑠𝑋 ⁄𝜎𝑋 √𝜒 2 ⁄𝜈 𝑠𝑋 ⁄𝜎𝑋 где 𝑠𝑋 − несмещенная точечная оценка среднеквадратичного отклонения 𝜎𝑋 случайной величины 𝑋; 𝑠𝑋̅ − несмещенная точечная оценка среднеквадратичного отклонения 𝜎𝑋̅ выборочного среднего 𝑋̅; 𝑡= 𝑈 = Учитывая, что 𝜈 = 𝑛 − 1, получаем: (𝑋̅ − 𝑚𝑋 )√𝑛 − 1 𝑋̅ − 𝑚𝑋 𝑡= = . 𝑠𝑋 𝑠𝑋̅ Таким образом, переменная 𝑡 представляет собой нормированное значение выборочного среднего 𝑋̅. Смысл перехода к этой переменной состоит в том, что её закон распределения, в отличие от закона распределения 𝑋̅ не зависит от неизвестных параметров распределения случайной величины 𝑋, а зависит только от одного параметра 𝜈 − числа степеней свободы, связанного с числом наблюдений 𝑛. Плотность распределения вероятностей случайной величины 𝑡 равна 𝜈+1 𝜈+1 − 2 1 Г( 2 ) 𝑡2 𝑝(𝑡) = , (−∞ < 𝑡 < ∞) (1 + ) 𝜈 √𝜋𝜈 Г(𝜈⁄2) и зависит, как и в случае 𝜒 2 − распределения только от параметра 𝜈. На следующем рисунке приведены графики t − распределения Стьюдента для различных степеней свободы 𝜈. Как и стандартное нормальное распределение, t − распределение Стьюдента также симметрично относительно оси ординат, но по сравнению с нормальным распределением распределение 𝑡 более пологое (её эксцесс E < 0). При 𝜈 → ∞ распределение 𝑡 асимптотически приближается к нормальному. Практически уже при 𝜈 > 30 можно считать 𝑡 − распределение Стьюдента нормальным. Математическое ожидание случайной величины 𝑡 равно нулю, а её дисперсия равна 𝜈⁄(𝜈 − 1), т.е. 𝑀(𝑡) = 0, 𝐷(𝑡) = 𝜈⁄(𝜈 − 1). Таблицы для интегральной функции 𝑃(𝑡0 ) = 𝑃(𝑡 < 𝑡0 ) распределения 𝑡 представлены в приложении 2. Величина 𝑡0 называется критическим значением статистики 𝑡. Зная вероятность 𝑃(𝑡0 ) и число степеней свободы 𝜈 = 𝑛 − 1 по таблице распределения 𝑡 можно найти критическое значение 𝑡0 , такое, что будет выполняться условие 𝑡 < 𝑡0 с вероятностью 𝑃(𝑡0 ). Если задана доверительная вероятность 𝛽 = 𝑃(−𝑡0 < 𝑡 < 𝑡0 ) = 𝑃(|𝑡| < 𝑡0 ), то из симметричности распределения 𝑡 следует: 𝛽 = 2𝑃(𝑡0 ) − 1. Откуда 𝑃(𝑡0 ) = 1+𝛽 . 2 Вычислив по этой формуле 𝑃(𝑡0 ), находим по таблице 𝑡 − распределения Стьюдента критическое значение 𝑡0 , которое будет определять границы доверительного интервала (−𝑡0 ; 𝑡0 ). Учитывая, что 𝑡 = (𝑋̅−𝑚𝑋 )√𝑛−1 , 𝑠𝑋 можно записать |(𝑋̅−𝑚𝑋 )|√𝑛−1 𝑠𝑋 𝑃(|𝑡| < 𝑡0 ) = 𝑃 ( или 𝑃 (|𝑋̅ − 𝑚𝑋 | < 𝑡0 𝑠𝑋 √𝑛 − 1 < 𝑡0 ) = 𝛽 ) = 𝛽, т. е. при заданной доверительной вероятности 𝛽 максимальное отклонение выборочного среднего 𝑋̅ от неизвестного математического ожидания 𝑚𝑋 равно 𝜀= 𝑡0 𝑠𝑋 √𝑛 − 1 . Таким образом, находим доверительный интервал (𝑋̅ − 𝑡0 𝑠𝑋 √𝑛 − 1 ; 𝑋̅ + 𝑡0 𝑠𝑋 √𝑛 − 1 ), покрывающий c надежностью 𝛽 математическое ожидание 𝑚𝑋 генеральной совокупности. Пример. Построить доверительный интервал с надежностью 𝛽 = 0,99 для средней длительности 𝑚𝑋 оборота всех торговых фирм города по вариационному ряду Длительность оборота, 𝑥𝑖 28 36 44 52 60 68 76 Число фирм, 𝑛𝑖 2 4 10 15 11 5 3 Решение. Из данной таблицы находим: Объём выборки 𝑛 = 50. Число степеней свободы 𝜈 = 𝑛 − 1 = 49. Выборочное среднее 𝑚 1 1 𝑋̅ = ∑ 𝑥𝑖 𝑛𝑖 = (28 ∙ 2 + 36 ∙ 4 + 44 ∙ 10 + 52 ∙ 15 + 60 ∙ 11 + 68 ∙ 5 + 76 ∙ 3) = 52,96. 𝑛 50 𝑖=1 Выборочная дисперсия 𝑚 𝑠𝑋2 1 1 = ∑(𝑥𝑖 − 𝑋̅)2 𝑛𝑖 = [(28 − 53)2 ∙ 2 + (36 − 53)2 ∙ 4 + (44 − 53)2 ∙ 10 + 𝑛−1 49 𝑖=1 +(52 − 53)2 ∙ 15 + (60 − 53)2 ∙ 11 + (68 − 53)2 ∙ 5 + (76 − 53)2 ∙ 3] ≈ 132,29. Выборочное среднеквадратичное отклонение 𝑠𝑋 = √𝑠𝑋2 = √132,29 ≈ 11,5. Вычисляем вероятность 𝑃(𝑡0 ): 𝑃(𝑡0 ) = 1 + 𝛽 1 + 0,99 = = 0,995 . 2 2 Зная число степеней свободы 𝜈 = 49 и вероятность 𝑃(𝑡0 ) = 0,995 , по таблице 𝑡 − распределения Стьюдента (приложение 1) находим 𝑡0 ≈ 2,673. Вычисляем максимальное отклонение 𝑋̅ от 𝑚𝑋 : 𝜀= 𝑡0 𝑠𝑋 = 2,673 ∙ 11,5 ≈ 4,39. √𝑛 − 1 √49 Находим доверительный интервал для математического ожидания 𝑚𝑋 , полученный с надежностью 𝛽 = 0,99: (𝑋̅ − 𝜀 ; 𝑋̅ + 𝜀) = (48,57; 57,35). Если сравнить эту интервальную оценку математического ожидания с интервальной оценкой (48,41; 57,15), полученной при решении этой же задачи приближенным методом (п.6.2), то видим, что различие значений границ составляет весьма малую величину − всего ~0,3%. Это объясняется большим объёмом выборки (𝑛 = 50 > 30), при котором, 𝑡 − распределение Стьюдента практически совпадает с нормальным. Различие же вызвано заменой в первом варианте решения (п.6.2) неизвестного среднеквадратичного отклонения 𝜎𝑋 на его выборочное приближение 𝑠𝑋 . Решим приближенным и точным методами задачу нахождения интервальной оценки математического ожидания при малом объёме выборки. Пример. По заданному статистическому ряду 28 36 44 𝑋 2 5 3 𝑛𝑖 построить доверительный интервал для математического ожидания 𝑚𝑋 случайной величины 𝑋 с надежностью 𝛽 = 0,99: Решение. Вычислим искомую интервальную оценку двумя методами. Приближенный метод Точный метод 1.Вычислим выборочное среднее. 1 1 𝑋̅ = ∑𝑚 𝑥 𝑛 = (28 ∙ 2 + 36 ∙ 5 + 44 ∙ 3) = 36,8. 𝑛 𝑖=1 𝑖 𝑖 10 2. Вычислим выборочное среднеквадратичное отклонение 𝑠𝑋 . Выборочная дисперсия 𝑠𝑋2 равна (п. 5.2): 𝑠𝑋2 𝑚 𝑚 𝑖=1 𝑖=1 2 1 1 = [∑ 𝑥𝑖2 𝑛𝑖 − (∑ 𝑥𝑖 𝑛𝑖 ) ] = 𝑛−1 𝑛 1 1 1 135424 = [282 ∙ 2 + 362 ∙ 5 + 442 ∙ 3 − (28 ∙ 2 + 36 ∙ 5 + 44 ∙ 3)2 ] = [13856 − ] = 34,8. 9 10 9 10 Выборочное среднеквадратичное отклонение: 𝑠𝑋 = √34,8 ≈ 5,9. 3. Вычисляем вероятность 𝑃(𝑢𝛽 ): 1+𝛽 1,99 𝑃(𝑢𝛽 ) = = = 0,995 2 2 4. Находим аргумент 𝑢𝛽 ≈ 2,575 (по таблице часть I, приложение). 5. Поскольку 𝜎𝑋 неизвестна, принимаем 𝜎𝑋 ≈ 𝑠𝑋 ≈ 5,9 и вычисляем максимальное отклонение 𝑋̅ от 𝑚𝑋 : 𝑠𝑋 5,9 𝜀 ≈ 𝑢𝛽 ≈ 2,575 ∙ ≈ 4,8. √𝑛 √10 3. Вычисляем вероятность 𝑃(𝑡0 ): 1 + 𝛽 1 + 0,99 = = 0,995 . 2 2 4. Зная число степеней свободы 𝜈 = 𝑛 − 1 = 9 и вероятность 𝑃(𝑡0 ) = 0,995 , по таблице 𝑡 − распределения Стьюдента (приложение 1) находим 𝑡0 = 3,25. 5. Вычисляем максимальное отклонение 𝑋̅ от 𝑚𝑋 : 𝑃(𝑡0 ) = Следовательно, доверительный интервал: (𝑋̅ − 𝜀; 𝑋̅ + 𝜀) ≈ (32; 41,6). 𝜀= 𝑡0 𝑠𝑋 ≈ 3,25 ∙ 5,9 ≈ 6,39 √𝑛 − 1 √9 и доверительный интервал: (𝑋̅ − 𝜀 ; 𝑋̅ + 𝜀) = (30,41; 43,19). Сравнение полученных результатов показывает, что относительное различие в нахождении границ доверительных интервалов, вычисленных приближенным и точным методами, составляет уже величину ~5%, что на порядок больше, чем было получено в примере с выборкой большого объёма. Основными источниками этой погрешности являются: 1) вероятность получения приемлемой точности приближения 𝜎𝑋 ≈ 𝑠𝑋 при малых объёмах выборки мала. 2) в приближенном методе используется нормальное распределение вероятности выборочного среднего, а в точном методе – распределение 𝑡; и при малом объёме выборки есть существенное расхождение между 𝑡 − распределением Стьюдента и нормальным распределением. 6.2.3. Интервальная оценка вероятности наступления случайного события. Контрольные вопросы. 1. Что такое статистическая оценка неизвестного параметра генеральной совокупности? Интервальное оценивание состоит, например, в вычислении доверительной вероятности для заданной предельной ошибке выборки. Лекции 9 – 10 СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ Оценка одного параметра. Задача проверки гипотезы в известном смысле напоминает задачу оценки параметров генеральной совокупности по данным выборки: высказывается не-которое утверждение и на основании данных выборки выносится суждение о справедливости этого утверждения. Статистические гипотезы утверждают что-либо о статистически устойчивых событиях (события, которые могут протекать многократно при идентич-ных условиях). Как правило, речь идет о виде функции распределения слу-чайной величины или о параметрах, характеризующих эту функцию распре-деления. Примеры статистических гипотез: 1) генеральная совокупность распределена по нормальному закону; 2) дисперсии двух нормальных распределений равны; 3) дисперсия признака, распределенного в генеральной совокупности 02D<<. Введем некоторые определения. Если в гипотезе утверждается что-то о значении какого-то параметра, гипотеза называется параметрической. Если гипотеза предполагает что-то, количественно не измеряемое (например, «признак имеет нормальное распределение»), гипотеза называется непараметрической. Основной (нулевой) гипотезой 0H называют выдвинутую гипотезу. Альтернативной (конкурирующей) гипотезой 1 называют гипотезу, которая противоречит выдвинутой. H (дополнить Самарой) Гипотеза называется простой, если ответ Статистический критерий. Критическая область. Область принятия гипотезы. Критические точки Для проверки гипотезы 0H используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Случайная величина , служащая для проверки гипотезы Θ (основ-ной), называется статистическим критерием, или просто критерием. Наблюдаемым значением наблΘ называют значение критерия, вычис-ленное по выборке. 0 H Критической областью называется множество значений критерия, при которых основная гипотеза S0H отклоняется. Уровень значимости и мощность критерия Вероятность совершить ошибку первого рода называют уровнем зна-чимости критерия и обозначают через α, ()10PHHα=. Вероятность ошибки второго рода обычно обозначается β, ()01PHHβ=. Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива альтернатив-ная гипотеза 1H (т.е., мощность критерия – вероятность недопущения ошибки второго рода). Очевидно, мощность критерия равна 1 - β. Обычно для α используются стандартные значения: α = 0,05, Областью принятия гипотезы (допустимой областью) называется множество значений критерия, при которых основная гипотеза не отклоняется. H Критические точки разделяют критическую область и область приня-тия гипотезы. Основной принцип проверки статистических гипотез состоит в следующем: если наблюдаемое значение критерия наблΘ попадает в критическую область, то основную гипотезу 0H отклоняют и принимают альтернативную гипотезу 1H, если принадлежит области принятия гипотезы − гипотезу наблΘ0H при-нимают, гипотезу 1H отклоняют. Методика проверки гипотез Методика проверки статистических гипотез сводится к следующим этапам. 1. Формулируются основная проверяемая гипотеза 0H; одновременно указывается, относительно каких альтернатив должна быть произведена проверка, т.е. формулируется альтернативная гипотеза 1H. 2. Подбирается статистический критерий ()12nX,X,...,XΘ=Θ – случайная величина, вычисляемая по результатам выборки. 3. Формулируется правило проверки, определяется соответствующий объем выборки n по заданным уровню значимости α и мощности критерия 1 – β или из условия минимизации β при данных α и n. 4. В зависимости от проверяемой гипотезы и ее альтернатив выбирается одно- или двусторонняя проверка. Выбор альтернативной гипотезы диктуется существом проверки. Если проверяется гипотеза, что процент брака составляет 5% (т.е. 0H:005,Θ=), то альтернативная гипотеза должна формулироваться как 1H:005,Θ>, так как если процент брака меньше 5, то партия тем более должна быть принята. Если в гипотезе 0H: обозна-чает предел прочности материала на разрыв, то альтернативной гипотезой должна быть :aΘ=Θ1HaΘ<. Наконец, если в гипотезе 0H:aΘ= обозначает вес гири, то должна строиться двусторонняя критическая область и . Θ1Θ<Θ2Θ>Θ 5. По известному распределению критерия вычисляются критические точки. 6. Производится выборка и для полученной реализации выборки 12nX,X,...,X12nx,x,...,x вычисляется наблюдаемое значение критерия ()12наблnx,x,...,xΘ=Θ. Если это значение попадает в критическую область, гипотеза 0H признается не соответствующей данным наблюдения и поэтому отклоняется. Если попадает в допустимую область, то гипотеза призна-ется не противоречащей 0наблΘ H ыборочным данным и может быть признана правдоподобной. Для каждого вида проверяемых гипотез разработаны соответствующие критерии. Чаще всего используются случайные величины, имеющие нор-мальное распределение, распределение 2χ (Пирсона), t – распределение Стьюдента, F - распределение Фишера – Снедекора. (дополнить Самарой) Приведенная выше схема предполагает, что закон распределения генеральной совокупности известен и оценке подлежат один или несколько параметров распределения. Такие гипотезы носят название параметрических. в Проверка статистических гипотез Определение Статистическая гипотеза – гипотеза о виде неизвестного распределения, или о параметрах известных распределений. Нулевая гипотеза представляет собой такое утверждение, которое принимается тогда, когда нет убедительных аргументов для его отклонения. Альтернативную гипотезу принимают только тогда, когда есть убедительное статистическое доказательство, которое отвергает нулевую гипотезу. Определяя, какая из двух гипотез будет альтернативной, надо спросить себя: «Какая из гипотез требует доказательств?».Эта гипотеза и будет альтернативной Признаем, что и принимая, и отвергая 0 H , мы подвергаем себя определѐнному риску. В итоге статистической проверки могут быть допущены ошибки двух типов: 1. Ошибка 1 рода - будет отвергнута правильная гипотеза. Принимается 1 H , тогда как верна 0 H . 2. Ошибка 2 рода – будет принята неправильная гипотеза. Примем 0 H , тогда как на самом деле верна 1 H . Определение Статистический критерий (или просто критерий)- случайная величина , которая служит для проверки нулевой гипотезы. K Эта величина случайная, потому что в различных опытах дисперсии будут принимать различные, наперед неизвестные значения. Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин, и таким образом получают частное (наблюдаемое) значение критерия. Наблюдаемым значением назначают значение критерия, вычисленное по выборкам. набл K Общий алгоритм 1.Сформулировать нулевую и альтернативную гипотезы. 2.Задать уровень значимости (допустимую вероятность ошибки 1 рода). 3.Выбрать подходящий критерий (меру расхождения) K 4. Определить критическую область. 5. По выборочным данным найти фактическое значение критерия.. 6.Если наблюденное значение критерия принадлежит критической области, то нулевая гипотеза отклоняется, иначе – принимается. Если 0 H принята, она ещѐ не доказана. Говорят, что данные согласуются с 0 H Если гипотеза отвергается, то этот вывод более категоричен. Распределение 𝝌𝟐 Критерий Пирсона Определение Критерий согласия -критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Статистические критерии подразделяются на следующие категории: Критерии значимости. Критерии согласия. Критерии на однородность. Используются в факторном (дисперсионном) анализе для определения наличия зависимостей. Критерий Пирсона, или критерий χ2наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая требует статистической проверки. Схема применения критерия Пирсона Схема применения критерия𝝌𝟐 для непрерывныхслучайных величин cтатистическая проверка гипотез основывается на предположении о существовании нормального распределения соответствующих переменных. На практике же мы в лучшем случае сталкиваемся с асимптотически нормальными распределениями (т.е. с распределениями, стремящимися к нормальным с ростом объема выборки). Вместе с тем проверка гипотез и в этих обстоятельствах дает практически приемлемые результаты, исключая разве такие ситуации, когда значения, скажем, t-статистики Стьюдента близки к критическому (ta). В последнем случае вывод, естественно, нельзя признать надежным. Весьма перспективными для прогнозирования представляются регрессионный анализ на основе интервальных данных, включающий, в частности, определение и расчет рационального объема выборки, а также регрессионный анализ нечетких данных. Данный курс является вводным курсом эконометрики, поэтому с точки зрения его теоретического содержания он достаточно стандартен и близок, например, к курсу Кр.Доугерти в ЛШЭ. В то же время, особенностью курса является его интенсивность: в других российских и зарубежных университетах изучение подобного курса эконометрики занимает как минимум год. Этому способствует тот факт, что студенты МИЭФ до курса эконометрики в течение двух лет изучают математичекскую и прикладную статистику. В результате их статистическая подготовка, а также высокий уровень знаний экономической теории, позволяют в рамках данного курса рассматривать прежде всего эконометрические вопросы, опираясь на глубокое понимание студентами концептуального аппарата статистики и экономики. Кроме того, курс ориентирован на содержательные вопросы, а не на формальные выводы и доказательства, что экономит массу времени по сравнению с курсами эконометрики в ряде российских вузов. При этом даются доказательства и выводы лишь для важнейших и типовых формул и утверждений, так что самим аппаратом выводов и доказательств в эконометрике студенты в итоге также овладевают. Наконец, освоение курса требует большого объема самостоятельной работы студентов,превосходящей по объему как минимум вдвое их аудиторную работу. Очень важно то, что студенты овладевают на практике применением всех методов, подходов и моделей, изучаемых в курсе, выполняя практические задания в классе и дома. Наряду с базовыми, стандартными темами вводного курса эконометрики в курсе изучаются и такие более продвинутые вопросы, как оценивание по методу максимума правдоподобия, логит- и пробит-модели и т.д. В то же время, в курсе не затрагиваются некоторые разделы моделирования нестационарных временных рядов, широко используемые в современном эконометрическом анализе, поскольку они изучаются в следующем за данным курсом курсе "Анализ временных рядов". Экзаменационные задания включают вопросы двух типов: это тесты множественного выбора и открытые вопросы. Задания первого типа позволяют проверить знание студентом широкого круга вопросов в рамках курса, задания второго типа проверить умение проводить эконометрический анализ и строить логику исследования. Главный акцент делается на экономической интерпретации и приложениях рассматриваемых эконометрических моделей. Рассматриваемые методы и модели должны быть освоены на практике с использованием реальных массивов экономических данных и современного эконометрического программного обеспечения. Интернет-ресурсы: 1. http://econ.lse.ac.uk/ie/ (И-1) 2. http://www.oup.com/uk/best.textbooks/economics/dougherty2e (И-2). 3. http://www.worthpublishers.com/mankiw (И-3). 4. http://www.recep.ru (И-4). Компьютерные программы и массивы данных: Основной компьютерной программой, используемой в курсе, является программа Econometric Views (версии 3.1 и последующие). Используются также электронные таблицы Excel. Для выполнения заданий в классе и домашних заданий используются массивы данных: данные курса Кр.Доугерти в ЛШЭ (данные для оценивания функций заработка по опросу NSLY в США, данные о спросе, располагаемом доходе и относительных ценах по товарным группам в США за 1959-1994гг - данные имеются на сайте И-1); Данные о погодовой динамике основных макроэкономических показателей в США за 1931-1998гг., данные имеются на сайте И-3; Данные о помесячной динамике основных макроэкономических показателей России за 1992-2002гг., данные имеются на сайте И-4; Данные об оценках ВНП, затрат труда и капитала в экономике СССР за 19281987гг. Данные о динамике инвестиций и вводе основных производственных фондов в Российской Федерации в 1956-1991гг. Приложение 1. t – распределение Стьюдента. Приложение 2. 𝝌𝟐 − распределение