Построение гистограмм

advertisement
Построение гистограмм
Пусть
полученный статистический материал, который
представлен в виде простого статистического ряда:
где n - номер опыта;
х - значение случайной величины, полученное в этом
опыте.
Предположим, что в нашем распоряжении результаты
наблюдений над непрерывной случайной величиной
,
оформленные в виде простой статистической совокупности.
Разделим весь диапазон наблюденных значений
интервалы
значений
или
«разряды»
и
подсчитаем
на
количество
, приходящееся на каждый -й разряд. Это число
разделим на общее число наблюдений
и найдем частоту,
соответствующую данному разряду:
.
Сумма частот всех разрядов, очевидно, должна быть
равна единице.
Построим таблицу, в которой приведены разряды в
порядке
их
расположения
соответствующие
частоты.
вдоль
Эта
оси
таблица
абсцисс
и
называется
статистическим (вариационным) рядом:
Здесь
границы;
—обозначение
-го разряда
- соответствующая частота;
- его
- число разрядов.
Число
разрядов
(интервалов)
для
построения
гистограммы определяется по формуле Старужеса:
Практика показала, что в большинстве случаев
рационально выбирать число разрядов порядка 8 - 15.
Чем богаче и однороднее статистический материал,
тем
большее
число
разрядов
можно
выбирать
при
составлении статистического ряда. Длины разрядов могут
быть
как
одинаковыми,
так
и
разумеется, брать их одинаковыми.
различными.
Проще,
Однако
при
оформлении
данных
о
случайных
величинах, распределенных крайне неравномерно, иногда
бывает удобно выбирать в области наибольшей плотности
распределения разряды более узкие, чем в области малой
плотности.
Пример: Произведено 500 измерений боковой ошибки
наводки при стрельбе с самолета по наземной цели.
Результаты измерений (в тысячных долях радиана) сведены
в статистический ряд:
-4; -3 -3; -2 -2; -1 -1; 0
0; 1
1; 2
2; 3
3; 4
6
120
88
46
10
25
72
133
0,012 0,050 0,144 0,266 0,240 0,176 0,092 0,020
Здесь
наводки;
обозначены интервалы значений ошибки
- число наблюдений в данном интервале,
- соответствующие частоты.
В вариационном ряде разряды приводятся в порядке их
расположения вдоль оси абсцисс, а ниже - число попаданий
возможных
значений
случайной
величины
в
них
и
соответствующие им частоты.
Если
при
группировке
наблюденных
значений
случайной величины имеется число, находящееся в точности
на границе раздела двух разрядов, то его нужно считать
принадлежащим в равной мере обоим разрядам и прибавить
к числам mi того и другого разряда по 0,5.
Таким
образом,
мы
уже
имеем
распределение
относительных частот (или статистической вероятности) по
диапазону изменения случайной величины. Несомненно, по
вариационному ряду можно сделать следующие выводы:
а) в каких границах изменяется случайная величина;
б) какие значения появляются чаще.
Но, вся информация пока еще скрыта и требуется ее
извлечь. Для этого вариационный ряд представляется
графически. В качестве оси абсцисс принимают границы
разрядов вариационного ряда случайной величины.
Вариационный ряд часто оформляется графически в
виде так называемой гистограммы. Гистограмма строится
следующим образом. По оси абсцисс откладываются
разряды, и на каждом из разрядов как их основании строится
прямоугольник, площадь которого равна частоте данного
разряда. Для построения гистограммы нужно частоту
каждого разряда разделить на его длину и полученное число
взять в качестве высоты прямоугольника
В случае равных по длине
прямоугольников
пропорциональны
частотам.
разрядов высоты
соответствующим
Из способа построения гистограммы следует, что
полная площадь ее равна единице.
В качестве примера можно привести гистограмму для
ошибки наводки, построенную по данным статистического
ряда, рассмотренного в примере
Очевидно, при увеличении числа опытов можно
выбирать все более и более мелкие разряды; при этом
гистограмма будет все более приближаться к некоторой
кривой, ограничивающей площадь, равную единице.
Построив
изображение
гистограмму,
статистического
получают
распределения
вероятности случайной величины.
графическое
плотности
Зависимость плотности относительной частоты
попадания случайной величины в разряд от возможных
значений случайной величины - разрядов, называется
гистограммой.
Пользуясь данными вариационного ряда, можно
построить
и
статистическую
функцию
распределения
случайной величины Х.
Построение точной статистической функции распределения
с несколькими сотнями скачков во всех наблюденных
значениях
слишком трудоемко и себя не оправдывает.
Для практики обычно достаточно построить
статистическую
функцию
распределения
по
нескольким точкам. В качестве этих точек удобно взять
границы
разрядов, которые фигурируют в
статистическом ряде. Тогда, очевидно,
Соединяя полученные точки ломанной линией или плавной
кривой, получим приближенный график статистической
функции распределения.
Пример: Построить приближенно
статистическую функцию распределения
ошибки наводки по данным
статистического ряда примера 1.
Имея набор графических изображений теоретических
законов
распределения
вероятностей,
можно
выдвинуть гипотезу о том, что вероятность случайной
величины распределена по тому или иному закону.
Для аналитической записи принятого закона
распределения необходимо рассчитать числовые
характеристики случайной величины. Не следует
забывать, что числовые характеристики сами по себе
несут определенную информацию о случайной
величине, а в сочетании с законом распределения
вероятностей получаем полное описание случайной
величины с вероятностных позиций.
Так, по гистограмме выдвинута гипотеза, что
вероятность случайной величины распределена по
нормальному закону. В этом случае, чтобы записать
выражение для плотности распределения
вероятностей нужно знать математическое
ожидание, дисперсию. Следовательно, нужно уметь
определять их по выборке, а не по всей генеральной
совокупности.
Практическое применение: для решения
теоретических и практических задач надёжности
производственных ЭС и их элементов надо знать
законы распределения их отказов. Они получаются
посредством обобщения статического материала об
отказах.
Определение оценок числовых
характеристик случайной
величины
По имеющемуся статистическому ряду наблюдений
случайной величины можно определить ее статистическое
математическое ожидание или оценку математического
ожидания:
Статистическое
математическое
ожидание - это среднее арифметическое.
Согласно
теореме
Чебышева,
при
достаточно
большом
п
среднее
арифметическое
случайной
величины
сходится
к
ее
математическому
ожиданию.
Таким образом, им мы без особой
погрешности
можем
заменить
математическое ожидание.
Аналогично статистическая дисперсия определяется по соотношению:
СКО:
Рассмотрим физический смысл полученных статистических
числовых характеристик. Поскольку имеем выборку, а не
генеральную совокупность, то
статистические числовые
характеристики не истинные значения, а их оценки.
Графически величина надежности показана заштрихованной площадью под кривой
нормального распределения
Понятиями доверительный интервал и доверительная
вероятность
широко
пользуются
в
электроэнергетике.
Например, при определении расчетной (максимальной)
нагрузки статистическим методом, исследовании состояния
изоляции, качества электроэнергии.
Так,
расчетную
следующим образом:
нагрузку
можно
представить
Данный
коэффициент
носит
название
Стьюдента и является справочной величиной.
коэффициент
В электроэнергетике приемлемой надежностью считают
надежность или доверительную вероятность 0,95. Исключение
составляет расчет электрических нагрузок, расчет зон
молниезащиты,
где
0,997
и
анализ
надежности
с
помощью
экспоненциального
закона
распределения вероятностей, где доверительная вероятность
0,9. Величина доверительной вероятности зависит от
погрешности, с которой получена исходная информация.
Аппроксимация статистического
распределения вероятностей
теоретическим
Предположим гипотезу Н0 о теоретическом законе
распределения вероятностей случайной величины и
определили числовые характеристики, которые
используются в аналитических выражениях
теоретического закона распределения.
Например, выдвинули гипотезу, что вероятность
случайной величины распределена по нормальному
закону.
Плотность распределения вероятности по этому
закону записывается следующим аналитическим
выражением:
А действительно ли именно эта кривая наиболее точно
описывает статистическое распределение? Для решения
вопроса о применимости выдвинутой гипотезы Н0 были
разработаны критерии согласия?
Download