Глоссарий Вариационный ряд – статистический или группированный статистический ряд Вариация - колеблемость, многообразие, изменчивость значения признака у единиц совокупности. Вероятность – численная мера объективной возможности наступления случайного события при тех или иных условиях. Выборка (выборочная совокупность) - часть элементов генеральной совокупности, отобранных для изучения, с целью получения информации о всей генеральной совокупности. Число объектов n, составляющих выборочную совокупность, называется объемом выборки, при этом n << N, где N – объем генеральной совокупности Генеральная совокупность – все возможные значения случайной величины, полный мыслимый набор данных. N – объем генеральной совокупности (общее число всех возможных значений) очень велик и часто равен бесконечности Гистогра́мма – эмпирическая функция плотности вероятности случайной величины. Строится по данным группированного статистического ряда: на каждом интервале, как на основании возводится прямоугольник площадью либо ni , либо Pi ni ( i 1, 2, ..., K ) , где K – число интервалов. В первом n случае площадь всей гистограммы равна объему выборки n, а во втором – единице. Группированный статистический ряд – ряд распределения, полученный на основе статистического ряда (выборки объема n) путем деления размаха выборки на K интервалов (групп). Содержит в качестве значений случайной величины середины интервалов i , которым поставлены в соответствие эмпирические абсолютные частоты ni ( i 1, 2, ..., K ) , либо эмпирические относительные частоты (эмпирические вероятности) Pi K ni . При этом ni n , а n i 1 K Ð 1. i 1 i Дискретная случайная величина – такая, возможные значения которой принимают отдельные изолированные значения, и их все можно указать заранее численно, если их число конечно Дисперсия D X , X2 – числовая характеристика степени рассеяния всевозможных значений случайной величины около ее математического ожидания, определяемая как центральный момент второго порядка, т. е. D X M X M X . Дисперсия измеряется в квадратных единицах измерения случайной величины 2 Доверительная вероятность – некоторая достаточно большая вероятность, которая задается исследователем или нормативными документами и характеризует степень надежности статистических выводов, например, надежность оценки параметра или надежность проверки статистической гипотезы. Обычно принимают 0.95;0.90 и др. Доверительный интервал l ( a ;a ) - интервал, в который с заданной вероятностью попадает неизвестное значение параметра а (неслучайная величина); a - несмещенная оценка параметра (случайная величина). Длина доверительного интервала характеризует точность оценки параметра Достоверное событие ( U ) – такое, которое обязательно наступит в результате опыта Единственно возможные события – такие, когда в результате испытания может наступить одно и только одно из этих событий Зависимые события - такие, у которых вероятность появления зависит от того, наступило или нет другое событие. Закон распределения случайной величины - любое соотношение, устанавливающее связь между возможными значениями этой величины и соответствующими им вероятностями Испытание - осуществление каждого отдельного наблюдения, опыта или измерения Испытания Бернулли – повторные многократные, независимые испытания с двумя возможными исходами и с вероятностью успеха, не меняющейся от испытания к испытанию Классическое определение вероятности - отношение числа исходов, благоприятствующих наступлению интересующего нас события, к общему числу всех равновозможных исходов Комплекс условий - совокупность условий, при которых выполняется каждое отдельное испытание Конкурирующая гипотеза – альтернативная статистическая гипотеза, противоречащая нулевой гипотезе Корреляционная (ковариационная) матрица K X случайного вектора X X n 1 X1 X2 ... X n – матрица парных корреляционных моментов связи (ковариаций) элементов данного 12 K 12 ... K 1n 2 K 21 2 ... K 2 n вектора: K X ........................... 2 K K ... 2n n n1 , где K ij M[( X i M X i )( X j M X j )] . На ее главной диагонали находятся дисперсии элементов этого вектора Корреляционный момент связи (ковариация) K XY - мера линейной зависимости двух величин - центральный смешанный момент второго порядка 11 системы двух случайных величин X и Y , т.е. K XY 11 M ( X M X )(Y MY )Корреля́ция — статистическая взаимосвязь двух или нескольких случайных величин . При этом изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Коэффицие́нт асимметри́и А— числовая характеристика асимметрии, скошенности кривой распределения. K XY - показатель характера взаимного X Y стохастического влияния изменения двух случайных величин, числовая характеристика силы корреляционной связи между двумя случайными величинами, ее тесноты в чистом виде, независимо от размерности этих случайных величин. Может принимать значения, по абсолютной величине не превышающие единицу, т.е. 1 1 . Коэффициент корреляции XY Коэффицие́нт эксце́сса Е —числовая характеристика положения вершины кривой распределения случайной величины, мера остроты пика этой кривой.. Критерий согласия (критерий проверки статистической гипотезы) - правило, алгоритм, позволяющий отклонять нулевую гипотезу или нет Критерий согласия Пирсона (критерий 2 – «хи-квадрат») – применяется для проверки нулевой гипотезы о распределении случайной величины , позволяет отклонить ее или нет Логическая сумма (объединение) – сложное событие, которое заключается в наступлении хотя бы одного из нескольких событий 63 Логическое произведение (пересечение) - сложное событие, которое заключается в совместном наступлении одновременно или последовательно друг за другом нескольких событий Математическое ожидание – среднее значение случайной величины, центр рассеяния всех ее значений. По сути — это среднее значение функции ее распределения Медиана Me - срединное значение случайной величины, т. е. такое,, при котором вероятность ее попадания в область левее точки x Me равна вероятности попадания в область правее этой точки, т.е. P( x Me ) P( x Me ) 1 2 Метод моментов - способ построения оценок, основанный на уравнивании теоретических и эмпирических (выборочных) моментов случайной величины Метод наименьших квадратов (МНК) - метод оценки параметров на основании экспериментальных данных, содержащих случайные ошибки. Мерой разницы в методе наименьших квадратов служит сумма квадратов отклонений действительных (экспериментальных) значений от теоретических. Выбираются такие значения параметров модели, при которых сумма квадратов разностей будет наименьшей – отсюда название метода: Многоугольник распределения – графическое изображение ряда распределения Мода Mo - значение случайной величины, которому соответствует максимальная плотность вероятности, т. е. f x Mo max . Это значение во множестве наблюдений, которое встречается наиболее часто Начальный момент k k-го порядка случайной величины X - математическое ожидание k-й степени этой случайной величины, т. е. k M X k Начальный момент rs порядка r s системы ( X ,Y ) двух случайных величин математическое ожидание произведения r -й степени случайной величины X и s -й степени случайной величины Y , т. е. rs M( X rY s ). 61 Невозможное событие (V ) – такое, которое в результате опыта произойти не может Независимые события - такие, у которых вероятность появления не зависит от того, наступило или нет другое событие. Непрерывная случайная величина - такая, возможные значения которой нельзя указать заранее численно, а можно указать лишь границы ее изменения, т. е. отрезок, на котором находятся все ее возможные значения Несмещенность оценки - требование к оценочной функции параметра, состоящее в том, чтобы математическое ожидание оценки было равно оцениваемому параметру 26 Несовместные события - такие, которые в одном испытании не могут наступить вместе, одновременно. Несовместные события не имеют общих элементарных исходов Нулевая гипотеза – проверяемая статистическая гипотеза Оценивание параметров - вычислительная операция, целью которой является нахождение приближенных значений для параметров теоретического распределения случайной величины по эмпирическим данным Оценочная функция или статистика - математическая формула, предназначенная для оценивания параметров Ошибка 1-го рода – возникает при проверке нулевой статистической гипотезы, когда гипотеза отклоняется, хотя на самом деле верна Ошибка 2-го рода – возникает при проверке нулевой статистической гипотезы, когда гипотеза не отклоняется, хотя на самом деле не верна Плотность вероятности f ( x ) F x (дифференциальная функция) аналитическая форма задания закона распределения непрерывной случайной величины, определяемая как производная первого порядка от ее непрерывной и дифференцируемой функции распределения F ( x ) Полная группа событий - система единственно возможных несовместных событий (исходов опыта) Простое событие – такое, которое не может быть разложено на составляющие Пространство элементарных событий опыта - всевозможные исходы этого опыта, Противоположные события - два простых или сложных события, образующих полную группу Размах вариации R– разность между наибольшим и наименьшим значениями наблюдаемой случайной величины ; Ранжированный ряд – статистический ряд (выборка), в котором элементы расположены в порядке возрастания или убывания Регрессионный анализ (линейный) - статистический метод исследования зависимости между зависимой переменной Y и независимой переменной X. . Терминология зависимой и независимой переменных отражает лишь математическую зависимость переменных, а не причинно-следственные отношения Репрезентативная (представительная) выборка – такая, элементы которой отобраны из генеральной совокупности случайно, наугад Ряд распределения – способ задания закона распределения вероятностей дискретной случайной величины, содержащий возможные значения этой величины и соответствующие им вероятности Система случайных величин - совместное рассмотрение нескольких случайных величин, как единого целого Сложное (составное) событие – результат испытания, который описывается несколькими простыми событиями Случайная величина - такая, которая в результате опыта может принять одно из множества значений, причем появление того или иного значения этой величины представляет собой случайное событие. Случайное событие - такое, которое при данном комплексе условий может наступить или не наступить. Случайное событие – подмножество на пространстве элементарных событий опыта Событие - любой факт, который может произойти в результате испытания. Совместные события - такие, которые в одном испытании могут наступить вместе. Совместные события имеют общие элементарные исходы Состоятельность оценки - требование к оценочной функции параметра, состоящее в том, чтобы оценка сходилась по вероятности к оцениваемому параметру Среднее квадратическое отклонение (стандартное отклонение, стандарт) ( X ) – положительный квадратный корень из дисперсии: ( X ) D( X ) . Наряду с дисперсией является числовой характеристикой рассеяния, измеряется в тех же единицах, что и сама случайная величина Статистическая гипотеза – всякое высказывание о генеральной совокупности, проверяемое по выборке из нее Статистический ряд x1 , x2 ,..., xn – первичная форма записи результатов эксперимента (измерений) над случайной величиной, сводка данных. Рассматривается как случайная выборка объема n и не является рядом распределения. Статистическое определение вероятности – относительная частота (частость) наступления события в длительной серии независимых повторений случайного эксперимента Схема случаев»- означает, что все возможные исходы опыта, равновозможны, составляют полную группу событий и их число конечно. Уравнение регрессии – оценка функции регрессии по эмпирическим данным Уровень значимости q - вероятность, противоположная доверительной вероятности (q 1 ) Условная вероятность - вероятность события, вычисленная при условии, что одно или несколько уже наступили Функция регрессии – форма связи генеральной совокупности значений переменных величин X и Y . В зависимости от вида функции регрессии связь между X и Y может быть линейной или нелинейной. Определение вида функции регрессии – основная задача регрессионного анализа Функция F ( x ) распределения случайной величины (интегральная функция) – аналитическая форма задания закона распределения дискретной или непрерывной случайной величины, определяемая как вероятность того, что случайная величина X примет значение меньше заданного x Центральный момент k k-го порядка случайной величины X - математическое ожидание k-й степени отклонения этой случайной величины от ее математического ожидания, т. е. математическое ожидание k-й степени соответствующей центрированной случайной величины: M {[ X M ( X )] k } M ( k ), где k X M ( X ) – центрированное значение случайной величины X . Центральный момент rs порядка r s системы ( X ,Y ) двух случайных величин математическое ожидание произведения r -й степени центрированной случайной величины X и s -й степени центрированной случайной величины Y , т. е. rs M ( X M X )r ( Y MY )s . 62 Числовые характеристики - некоторые числовые параметры, которые в сжатой форме выражают наиболее существенные особенности распределения случайной величины Элементарный исход (событие) – каждый из возможных исходов опыта, из которых в опыте происходит ровно один Эмпирическое распределение - распределение случайной величины, полученное на основе выборки Эффективность оценки - требование к оценочной функции, состоящее в том, чтобы вычисляемая по ней оценка параметра имела минимальную дисперсию. Это требование применяется для выбора наилучшей оценочной функции из нескольких возможных