Лекция 7 Тема Содержание темы

advertisement
Лекция 7
Тема
Свойства выборочных характеристик. Интервальные ряды
Содержание темы
Свойства средней арифметической
Свойства выборочной дисперсии
Интервальный ряд и его характеристики
Основные категории
I
I
I
I
I
I
I
разбиение выборки на группы;
среднегрупповая дисперсия;
межгрупповая дисперсия;
формула Стерджеса;
интервальный ряд;
средняя арифметическая, дисперсия, несмещенная дисперсия
интервального ряда;
гистограмма интервального ряда.
Свойства средней арифметической
1. Средняя арифметическая постоянной равна самой постоянной.
Т.е. если в выборке все числа оказались одинаковы, то и средняя имеет то
же значение.
2. Если все элементы выборки (или, что то же самое, все варианты)
умножить на одно и то же число, то и средняя арифметическая умножится
на то же число.
Пояснение удобно записывать для статистического ряда, т.е. для вариант(ов)
и частот:
k
k
X
X
xi ni
(c xi )ni
i=1
n
=c
i=1
n
=⇒
c x = c x.
3. Если ко всем элементам выборки (к вариантам) прибавить одно и то же
число, то и к средней арифметической прибавится это же число:
x + c = x + c.
Примечание. Число c может быть и отрицательным, поэтому можно
прибавить или отнять!
Свойства средней арифметической - II
4. Средняя арифметическая отклонения выборочных значений (вариант) от
средней равна нулю.
Пояснение:
x − x = x − x = x − x = 0.
5. Средняя арифметическая алгебраической
алгебраической сумме средних арифметических:
суммы
выборок
равна
x ± y = x ± y.
6. Групповое свойство: если вся выборка {xi } разбита на A групп gα (α =
1, . . . , A) с количествами элементов mα и средние по группам равны g α , то
x=
A
1X
g mα .
n α=1 α
Внимание! Средняя в целом НЕ РАВНА среднему от средних по группам! То
A
X
1
gα .
есть x 6= A
α=1
Свойства выборочной дисперсии
1. Дисперсия постоянной равна нулю.
2. Если все элементы выборки (или, что то же самое, все варианты)
умножить на одно и то же число, то дисперсия умножится на квадрат этого
числа:
s2 (c x) = c2 s2 (x).
3. Если ко всем элементам выборки (к вариантам) прибавить одно и то же
число (если оно отрицательное, значит, отнять), то дисперсия не изменится.
s2 (x + c) = s2 (x).
4. Выборочная дисперсия равна разности между средней арифметической
от квадрата значений выборки и квадратом средней арифметической:
s2 (x) = x2 − x2 .
Групповое свойство выборочной дисперсии
Пусть вся выборка x = {xi } разбита на A групп gα = {xαj }
(α = 1, . . . , A) с количествами элементов mα . Найдем средние
арифметические по группам g α и выборочные дисперсии в группах
gα =
mα
1 X
xαj ,
mα j=1
s2 (gα ) =
mα
1 X
(xαj − g α )2 .
mα j=1
Рассмотрим статистический ряд
xi
ni
s2 (g1 )
m1
...
...
s2 (gA )
mk
Определение. Среднегрупповой дисперсией называется средняя
арифметическая этого ряда
s2 (gα ) =
A
1X 2
s (gα )mα .
n α=1
Групповое свойство выборочной дисперсии - II
Рассмотрим статистический ряд
xi
ni
g1
m1
...
...
gA
mk
Определение. Межгрупповой дисперсией называется дисперсия
этого ряда
A
1X
δ2 =
(g − x)2 mα .
n α=1 α
5. Теорема. Если выборка разбита на группы, то выборочная
дисперсия равна сумме среднегрупповой дисперсии и межгрупповой
дисперсии:
s2 (x) = s2 (gα ) + δ 2 .
Можно упрощенно сказать, что общая выборочная дисперсия – это
среднее дисперсий по группам плюс дисперсия средних по группам.
Задача
Использовать MS EXCEL и встроенные функции.
1. Сгенерировать выборку объемом 100 из равномерно
распределенной случайной величины на отрезке [0,20], состоящую
из целых чисел (допустим, что только такая точность измерения нам
доступна). Присвоить выборке имя (например, myrow).
2. Вычислить среднюю арифметическую и выборочную дисперсию
выборки myrow.
3. Разбить выборку на четыре группы из 10, 30, 40 и 20 элементов
соответственно. Присвоить имена этим группам (например, myrow1 –
myrow4).
4. Вычислить средние арифметические и выборочные дисперсии
групп myrow1 – myrow4.
5. Вычислить межгрупповую дисперсию и среднегрупповую
дисперсию. Проверить выполнение группового свойства выборочной
дисперсии.
Интервалы. Формула Стерджеса
Если выборка сделана для изучения признака, который может принимать
любые значения в некотором промежутке (то есть исследуемая случайная
величина непрерывна), или выборка содержит очень много различных
значений, то имеет смысл эти значения некоторым образом сгруппировать и
изучать законы распределения относительно полученных групп.
Для этого, весь промежуток значений от xmin до xmax разбивают на
интервалы и подсчитывают количество значений выборки, попавшей в
каждый интервал. В программе MS EXCEL эти интервалы называются
«карманами».
Как выбрать количество и величину интервалов? Из соображений удобства
величину интервалов, как правило, выбирают одинаковой, а их количество
k не должно быть очень большим (иначе не получится выигрыша в
простоте вычислений), но и не должно быть малым (иначе могут потеряться
особенности изменений признака).
Формула Стерджеса. Пусть n объем выборки. Рекомендуемое число k
интервалов группировки определяется формулой
k ≈ 1 + log2 n ≈ 1 + 3, 322 lg n.
На практике поступаем так:
1) Вычисляем число Стерджеса 1 + 3, 322 lg n и берем в качестве
длины интервала число, с разумной степенью точности ближайшее к
величине
xmax − xmin
R
=
1 + 3, 322 lg n
1 + 3, 322 lg n
(например, ближайшее целое для простоты расчетов). Выбранное
число (длина интервала) называется шагом интервального ряда и
обозначается h.
2) В качестве начала первого интервала берем точку xmin − h/2 (то
есть наименьшее значение выборки приходится на середину первого
интервала). Находим все интервалы и подсчитываем количество точек
ni , в них попадающих.
3) Нумеруем полученные концы интервалов x0 < x1 < . . . < xk и
рассматриваем «статистический» ряд
xi
ni
[x0 , x1 ]
n1
...
...
[xk−1 , xk ]
nk
Интервальный ряд
4) Поскольку с интервалами арифметические действия невозможны,
то заменяем интервалы на их середины x∗i = (xi−1 + xi )/2, получаем
статистический ряд
xi
ni
x∗1
n1
Построенный таким образом
интервальным рядом.
...
...
x∗k
nk
статистический
ряд
называется
Для него определяются характеристики по обычным правилам для
статистических рядов.
Характеристики интервального ряда
Определение. Средняя арифметическая интервального ряда
k
1X ∗
x=
xi ni .
n
i=1
Определение. Выборочная дисперсия s2 и выборочное
среднеквадратическое отклонение s интервального ряда
k
1X ∗
s =
(xi − x)2 ni ,
n
2
√
s=
s2 .
i=1
Определение.
Несмещенная
оценка
интервального ряда
n 2
s2H =
s .
n−1
дисперсии
s2H
Гистограмма интервального ряда
Для интервальных рядов применяют графическое изображение в
виде гистограммы.
Правило построения. Для построения гистограммы интервального
ряда по оси Ox откладывают интервалы
[x0 , x1 ], . . . [xk−1 , xk ],
а по оси Oy откладывают высоты прямоугольников таким образом,
чтобы их площади равнялись частотам ni для гистограммы частот
или частостям ni /n для гистограммы частостей.
Если шаг интервального ряда постоянный и равен h, то высота
прямоугольников вычисляется как nhi для частот и nnhi для частостей.
Если шаги разные и равны h1 = x1 − x0 , . . . , hk = xk − xk−1 , то
высоты прямоугольников вычисляются как nhii для частот и nnhi i для
частостей.
Контрольные вопросы
1. Шесть свойств средней арифметической
2. Четыре свойства выборочной дисперсии
3. Определение среднегрупповой дисперсии
4. Определение межгрупповой дисперсии
5. Групповое свойство выборочной дисперсии (теорема)
6. Формула Стерджеса
7. Четыре шага построения интервального ряда
8. Средняя арифметическая, дисперсия,
дисперсия интервального ряда
несмещенная
9. Гистограмма интервального ряда – правило построения
Download