Глоссарий Вариационный ряд – статистический или

advertisement
Глоссарий
Вариационный ряд – статистический или группированный статистический ряд
Вариация - колеблемость, многообразие, изменчивость значения признака у
единиц совокупности.
Вероятность – численная мера объективной возможности наступления случайного
события при тех или иных условиях.
Выборка (выборочная совокупность) - часть элементов генеральной совокупности,
отобранных для изучения, с целью получения информации о всей генеральной
совокупности. Число объектов n, составляющих выборочную совокупность,
называется объемом выборки, при этом n << N, где N – объем генеральной
совокупности
Генеральная совокупность – все возможные значения случайной величины, полный
мыслимый набор данных. N – объем генеральной совокупности (общее число всех
возможных значений) очень велик и часто равен бесконечности
Гистогра́мма – эмпирическая функция плотности вероятности случайной
величины. Строится по данным группированного статистического ряда: на
каждом интервале, как на основании возводится прямоугольник площадью
либо ni , либо Pi 
ni
( i  1, 2, ..., K ) , где K – число интервалов. В первом
n
случае площадь всей гистограммы равна объему выборки n, а во втором –
единице.
Группированный статистический ряд – ряд распределения, полученный на основе
статистического ряда (выборки объема n) путем деления размаха выборки на K
интервалов (групп). Содержит в качестве значений случайной величины середины
интервалов  i , которым поставлены в соответствие эмпирические абсолютные
частоты ni ( i  1, 2, ..., K ) , либо эмпирические относительные частоты
(эмпирические вероятности) Pi 
K
ni
. При этом  ni  n , а
n
i 1
K
 Ð  1.
i 1
i
Дискретная случайная величина – такая, возможные значения которой принимают
отдельные изолированные значения, и их все можно указать заранее численно, если
их число конечно
Дисперсия D  X  , X2 – числовая характеристика степени рассеяния
всевозможных значений случайной величины около ее математического ожидания,
определяемая как центральный момент второго порядка, т. е.


D X   M X  M  X  . Дисперсия измеряется в квадратных единицах
измерения случайной величины
2
Доверительная вероятность  – некоторая достаточно большая вероятность,
которая задается исследователем или нормативными документами и характеризует
степень надежности статистических выводов, например, надежность оценки
параметра или надежность проверки статистической гипотезы. Обычно принимают
  0.95;0.90 и др.
Доверительный интервал l ( a   ;a   ) - интервал, в который с заданной

вероятностью  попадает неизвестное значение параметра а
(неслучайная величина); a - несмещенная оценка параметра (случайная
величина). Длина доверительного интервала характеризует точность оценки
параметра
Достоверное событие ( U ) – такое, которое обязательно наступит в результате
опыта
Единственно возможные события – такие, когда в результате испытания может
наступить одно и только одно из этих событий
Зависимые события - такие, у которых вероятность появления зависит от того,
наступило или нет другое событие.
Закон распределения случайной величины - любое соотношение, устанавливающее
связь между возможными значениями этой величины и соответствующими им
вероятностями
Испытание - осуществление каждого отдельного наблюдения, опыта или измерения
Испытания Бернулли – повторные многократные, независимые испытания с двумя
возможными исходами и с вероятностью успеха, не меняющейся от испытания к
испытанию
Классическое определение вероятности - отношение числа исходов,
благоприятствующих наступлению интересующего нас события, к общему числу всех
равновозможных исходов
Комплекс условий - совокупность условий, при которых выполняется каждое
отдельное испытание
Конкурирующая гипотеза – альтернативная статистическая гипотеза,
противоречащая нулевой гипотезе
Корреляционная (ковариационная) матрица K X случайного вектора X  X n 1
 X1 


 X2 

... 


X 
 n
– матрица парных корреляционных моментов связи (ковариаций) элементов данного
  12 K 12 ... K 1n 


2
 K 21  2 ... K 2 n 
вектора: K X  
........................... 


2 
K
K
...

2n
n 
 n1
, где K ij  M[( X i  M X i )( X j  M X j )] . На ее
главной диагонали находятся дисперсии элементов этого вектора
Корреляционный момент связи (ковариация) K XY - мера линейной зависимости двух
величин - центральный смешанный момент второго порядка 11 системы двух
случайных величин X и Y , т.е. K XY  11  M ( X  M X )(Y  MY )Корреля́ция — статистическая взаимосвязь двух или нескольких случайных величин .
При этом изменения одной или нескольких из этих величин приводят к
систематическому изменению другой или других величин.
Коэффицие́нт асимметри́и А— числовая характеристика асимметрии, скошенности
кривой распределения.
K XY
- показатель характера взаимного
 X Y
стохастического влияния изменения двух случайных величин, числовая
характеристика силы корреляционной связи между двумя случайными величинами,
ее тесноты в чистом виде, независимо от размерности этих случайных величин.
Может принимать значения, по абсолютной величине не превышающие единицу, т.е.
 1    1 .
Коэффициент корреляции  XY 
Коэффицие́нт эксце́сса Е —числовая характеристика положения вершины кривой
распределения случайной величины, мера остроты пика этой кривой..
Критерий согласия (критерий проверки статистической гипотезы) - правило,
алгоритм, позволяющий отклонять нулевую гипотезу или нет
Критерий согласия Пирсона (критерий  2 – «хи-квадрат») – применяется для
проверки нулевой гипотезы о распределении случайной величины , позволяет отклонить
ее или нет
Логическая сумма (объединение) – сложное событие, которое заключается в
наступлении хотя бы одного из нескольких событий
63 
Логическое произведение (пересечение) - сложное событие, которое заключается в
совместном наступлении одновременно или последовательно друг за другом
нескольких событий
Математическое ожидание – среднее значение случайной величины, центр рассеяния
всех ее значений. По сути — это среднее значение функции ее распределения
Медиана Me - срединное значение случайной величины, т. е. такое,, при
котором вероятность ее попадания в область левее точки x  Me равна вероятности
попадания в область правее этой точки, т.е. P( x  Me )  P( x  Me ) 
1
2
Метод моментов - способ построения оценок, основанный на уравнивании
теоретических и эмпирических (выборочных) моментов случайной величины
Метод наименьших квадратов (МНК) - метод оценки параметров на основании
экспериментальных данных, содержащих случайные ошибки. Мерой разницы в
методе наименьших квадратов служит сумма квадратов отклонений действительных
(экспериментальных) значений от теоретических. Выбираются такие значения
параметров модели, при которых сумма квадратов разностей будет наименьшей –
отсюда название метода:
Многоугольник распределения – графическое изображение ряда распределения
Мода Mo - значение случайной величины, которому соответствует
максимальная плотность вероятности, т. е. f  x  Mo   max . Это значение во
множестве наблюдений, которое встречается наиболее часто
Начальный момент  k k-го порядка случайной величины X - математическое
ожидание k-й степени этой случайной величины, т. е.  k  M X k
 
Начальный момент  rs порядка r  s системы ( X ,Y ) двух случайных величин математическое ожидание произведения r -й степени случайной величины X и s -й
степени случайной величины Y , т. е.  rs  M( X rY s ).
61
Невозможное событие (V ) – такое, которое в результате опыта произойти не может
Независимые события - такие, у которых вероятность появления не зависит от того,
наступило или нет другое событие.
Непрерывная случайная величина - такая, возможные значения которой нельзя
указать заранее численно, а можно указать лишь границы ее изменения, т. е. отрезок,
на котором находятся все ее возможные значения
Несмещенность оценки - требование к оценочной функции параметра, состоящее в
том, чтобы математическое ожидание оценки было равно оцениваемому параметру
26
Несовместные события - такие, которые в одном испытании не могут наступить
вместе, одновременно. Несовместные события не имеют общих элементарных
исходов
Нулевая гипотеза – проверяемая статистическая гипотеза
Оценивание параметров - вычислительная операция, целью которой
является нахождение приближенных значений для параметров
теоретического распределения случайной величины по эмпирическим
данным
Оценочная функция или статистика - математическая формула,
предназначенная для оценивания параметров
Ошибка 1-го рода – возникает при проверке нулевой статистической гипотезы,
когда гипотеза отклоняется, хотя на самом деле верна
Ошибка 2-го рода – возникает при проверке нулевой статистической гипотезы,
когда гипотеза не отклоняется, хотя на самом деле не верна
Плотность вероятности f ( x )  F   x  (дифференциальная функция) аналитическая форма задания закона распределения непрерывной случайной
величины, определяемая как производная первого порядка от ее непрерывной и
дифференцируемой функции распределения F ( x )
Полная группа событий - система единственно возможных несовместных событий
(исходов опыта)
Простое событие – такое, которое не может быть разложено на составляющие
Пространство  элементарных событий опыта - всевозможные исходы этого
опыта,
Противоположные события - два простых или сложных события, образующих
полную группу
Размах вариации R– разность между наибольшим и наименьшим значениями
наблюдаемой случайной величины
;
Ранжированный ряд – статистический ряд (выборка), в котором элементы
расположены в порядке возрастания или убывания
Регрессионный анализ (линейный) - статистический метод исследования
зависимости между зависимой переменной Y и независимой переменной X. .
Терминология зависимой и независимой переменных отражает лишь математическую
зависимость переменных, а не причинно-следственные отношения
Репрезентативная (представительная) выборка – такая, элементы которой отобраны
из генеральной совокупности случайно, наугад
Ряд распределения – способ задания закона распределения вероятностей дискретной
случайной величины, содержащий возможные значения этой величины и
соответствующие им вероятности
Система случайных величин - совместное рассмотрение нескольких случайных
величин, как единого целого
Сложное (составное) событие – результат испытания, который описывается
несколькими простыми событиями
Случайная величина - такая, которая в результате опыта может принять одно из
множества значений, причем появление того или иного значения этой величины
представляет собой случайное событие.
Случайное событие - такое, которое при данном комплексе условий может наступить
или не наступить. Случайное событие – подмножество на пространстве 
элементарных событий опыта
Событие - любой факт, который может произойти в результате испытания.
Совместные события - такие, которые в одном испытании могут наступить вместе.
Совместные события имеют общие элементарные исходы
Состоятельность оценки - требование к оценочной функции параметра, состоящее
в том, чтобы оценка сходилась по вероятности к оцениваемому параметру
Среднее квадратическое отклонение (стандартное отклонение, стандарт)  ( X ) –
положительный квадратный корень из дисперсии:  ( X )   D( X ) . Наряду с
дисперсией является числовой характеристикой рассеяния, измеряется в тех же
единицах, что и сама случайная величина
Статистическая гипотеза – всякое высказывание о генеральной совокупности,
проверяемое по выборке из нее
Статистический ряд x1 , x2 ,..., xn – первичная форма записи результатов
эксперимента (измерений) над случайной величиной, сводка данных. Рассматривается
как случайная выборка объема n и не является рядом распределения.
Статистическое определение вероятности – относительная частота (частость)
наступления события в длительной серии независимых повторений случайного
эксперимента
Схема случаев»- означает, что все возможные исходы опыта, равновозможны,
составляют полную группу событий и их число конечно.
Уравнение регрессии – оценка функции регрессии по эмпирическим данным
Уровень значимости q - вероятность, противоположная доверительной вероятности
 (q  1   )
Условная вероятность - вероятность события, вычисленная при условии, что одно
или несколько уже наступили
Функция регрессии – форма связи генеральной совокупности значений переменных
величин X и Y . В зависимости от вида функции регрессии связь между X и Y может
быть линейной или нелинейной. Определение вида функции регрессии – основная
задача регрессионного анализа
Функция F ( x ) распределения случайной величины (интегральная функция) –
аналитическая форма задания закона распределения дискретной или непрерывной
случайной величины, определяемая как вероятность того, что случайная величина X
примет значение меньше заданного x
Центральный момент  k k-го порядка случайной величины X - математическое
ожидание k-й степени отклонения этой случайной величины от ее математического
ожидания, т. е. математическое ожидание k-й степени соответствующей
центрированной случайной величины:   M {[ X  M ( X )] k }  M (  k ), где
k
  X  M ( X ) – центрированное значение случайной величины X .
Центральный момент rs порядка r  s системы ( X ,Y ) двух случайных величин математическое ожидание произведения r -й степени центрированной случайной
величины X и s -й степени центрированной случайной величины Y , т. е.
 rs  M ( X  M X )r ( Y  MY )s  .
 62 
Числовые характеристики - некоторые числовые параметры, которые в сжатой форме
выражают наиболее существенные особенности распределения случайной величины
Элементарный исход (событие) – каждый из возможных исходов опыта, из которых
в опыте происходит ровно один
Эмпирическое распределение - распределение случайной величины, полученное на
основе выборки
Эффективность оценки - требование к оценочной функции, состоящее в том, чтобы
вычисляемая по ней оценка параметра имела минимальную дисперсию. Это
требование применяется для выбора наилучшей оценочной функции из нескольких
возможных
Download