Законы распределения случайных величин в геодезии

реклама
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ГОУ ВПО «СИБИРСКАЯ ГОСУДАРСТВЕННАЯ ГЕОДЕЗИЧЕСКАЯ АКАДЕМИЯ»
Н.Б. Лесных
ЗАКОНЫ РАСПРЕДЕЛЕНИЯ
СЛУЧАЙНЫХ ВЕЛИЧИН В ГЕОДЕЗИИ
Монография
Новосибирск
2005
УДК 519.2:528.1
Л-11
Рецензент:
Доктор технических наук,
профессор Новосибирского государственного
архитектурно-строительного университета
Г.Г. Асташенков
Лесных Н.Б.
Л 11 Законы распределения случайных величин в геодезии: Монография. –
Новосибирск: СГГА, 2005. – 129 с.
ISBN 5-87693-160-8
В монографии представлены результаты статистического анализа законов
распределения случайных величин в геодезии: невязок, ошибок, поправок,
разностей превышений высокоточного нивелирования, разностей отметок
повторных наблюдений за осадками стеновых панелей АЭС. Исследования
выполнялись с использованием программной системы, созданной в НГТУ.
Монография содержит также разработки и предложения автора в области
теории ошибок измерений: методику проверки свойств случайных ошибок
измерений для различных законов распределения, отбраковки грубых ошибок
критерием равенства вероятностей; исследование влияния различных факторов
на закон распределения результатов уравнивания и роли нормального закона в
оценке качества измерений.
Ответственный редактор:
Доктор технических наук, профессор
Новосибирского государственного технического университета
Б.Ю. Лемешко
ISBN 5-87693-160-8
УДК 519.2:528.1
© ГОУ ВПО «Сибирская государственная
геодезическая академия» (СГГА), 2005
© Лесных Н.Б., 2005
СОДЕРЖАНИЕ
Введение ............................................................................................................... 4
1. Ошибки и поправки геодезических измерений ........................................ 7
1.1. Ошибки результатов измерений........................................................... 7
1.2. Сущность задачи уравнивания ............................................................. 9
1.3. Статистические свойства поправок ................................................... 12
1.4. Параметрический способ уравнивания............................................. 13
2. Статистический анализ геодезических данных ...................................... 17
2.1. Оценки параметров ............................................................................. 17
2.2. Методика статистического анализа ................................................... 18
2.3. Статистический анализ невязок треугольников триангуляции 1-го
класса .................................................................................................... 22
2.4. Статистический анализ поправок ...................................................... 26
2.4.1. Критерии согласия ........................................................................ 26
2.4.2. Законы распределения поправок ................................................. 28
2.5. Влияние зависимости поправок на закон их распределения .......... 34
2.6. Статистический анализ разностей двойных измерений.................. 38
2.7. Статистический анализ разностей отметок ...................................... 44
3. Законы распределения геодезических данных ....................................... 48
3.1. Общая характеристика ........................................................................ 48
3.1.1. Нормальный закон распределения .............................................. 48
3.1.2. Закон распределения Лапласа ...................................................... 50
3.1.3. Логистический закон распределения .......................................... 51
3.1.4. Закон распределения Коши .......................................................... 53
3.1.5. Закон распределения максимальных значений .......................... 54
3.1.6. Закон распределения минимальных значений ........................... 56
3.1.7. Другие законы распределения ..................................................... 57
3.2. Доверительные границы и вероятности некоторых законов
распределения...................................................................................... 58
3.3. Нормальный закон распределения в оценке качества геодезических
измерений............................................................................................. 64
4. Исследование свойств случайных ошибок измерений .......................... 67
4.1. Свойства случайных ошибок измерений для двухпараметрических
законов распределения ....................................................................... 67
4.2. Проверка свойств случайных ошибок измерений с использованием
критериев согласия ............................................................................. 69
4.3. Проверка свойств случайных ошибок на примере ряда невязок
триангуляции 1-го класса ................................................................... 70
4.4. Отбраковка грубых ошибок критерием равенства вероятностей ... 73
Заключение......................................................................................................... 77
Приложение........................................................................................................ 79
Список литературы............................................................................................ 81
ВВЕДЕНИЕ
Анализ
качества
геодезических измерений, изучение
законов
возникновения и действия неизбежных ошибок измерений являются задачами
математической обработки геодезических измерений.
Производственные
и
экспериментальные
исследования
закона
распределения геодезических данных (невязок, ошибок) имеют место в работах
А.С. Чеботарева (1953 г.), В.Д. Большакова (1955 г., 1957 г.), К.Л. Проворова
(1956 г.), Ю.В. Кемница (1957 г.), А.Ш. Татевяна (1967 г.) и других авторов.
Методика подобных исследований включает, как правило, проверку свойств
случайных ошибок измерений, вычисление асимметрии и эксцесса и оценку их
значимости. Эмпирическое распределение сравнивается с нормальным законом.
Полученные результаты многочисленных исследований позволили считать,
что случайные величины в геодезии подчиняются закону нормального
распределения. «Почти все случайные величины, с которыми приходится иметь
дело в геодезии, подчиняются нормальному закону распределения» [1].
Нормальному закону «подчиняются ошибки измерений. Кроме того, очень
многие случайные величины, связанные с геодезической информацией, имеют
либо нормальное, либо приближенное к нему распределение» [23].
Каким же именно законам, помимо нормального, подчиняются результаты
геодезических измерений и их линейные функции? Каковы характеристики и
свойства этих законов и как данные сведения могут повлиять на теорию и
практику математической обработки геодезических измерений?
Статистический анализ обширного геодезического материала: невязок,
поправок, разностей двойных измерений и разностей функций двойных
измерений с использованием современной программной системы позволил
расширить представление о законах распределения геодезических данных.
Было также установлено, что случайная величина может подчиняться
нормальному закону, но по совокупности ряда критериев некоторый другой
закон в большей степени соответствует опытным данным. Это не умаляет роль
нормального закона, как удобной математической модели распределения
ошибок измерений, позволяющей выполнять проверку различных
статистических гипотез, строить доверительные интервалы.
Статистический анализ геодезических данных выполнялся в 1994 – 1997 гг.
на основании общего Гранта Новосибирского государственного технического
университета (НГТУ) и Сибирской государственной геодезической академии
(СГГА) по темам «Теория, методы и программное обеспечение задач
статистического анализа независимых и зависимых случайных величин в
геодезии» и «Статистический анализ независимых и зависимых случайных
величин в геодезии» [28] – [31] с постоянным участием и представительством
от СГГА автора настоящей работы.
Исследования были выполнены с использованием программной системы
Б.Ю. Лемешко «Статистический анализ одномерных наблюдений случайных
величин»[11].
Программная система [11] предназначена для решения совокупности задач
статистического анализа, и по ряду заложенных возможностей не имеет
аналогов среди подобного программного обеспечения. Оценки параметров
находятся методом максимального правдоподобия для следующих
распределений.
1. Экспоненциальное (показательное) распределение.
2. Полунормальное – распределение модуля нормальной величины.
3. Распределение Рэлея.
4. Распределение Максвелла.
5. Распределение модуля многомерной нормальной величины.
6. Распределение Парето.
7. Распределение Эрланга – частный случай гамма-распреде-ления.
8. Распределение Лапласа или двустороннее экспоненциальное.
9. Нормальное распределение.
10. Логарифмически (ln) нормальное распределение.
11. Логарифмически (lg) нормальное распределение.
12. Распределение Коши.
13. Логистическое распределение.
14. Распределение Вейбулла.
15. Распределение минимального значения.
16. Распределение максимального значения.
17. Двойное показательное распределение.
18. Распределение Накагами.
19. Гамма-распределение.
20. Бета-распределение I рода.
21. Стандартное бета-распределение II рода.
22. Бета-распределение II рода.
23. Распределение Sb-Джонсона.
24. Распределение Sl-Джонсона.
25. Распределение Su-Джонсона.
26. Класс экспоненциальных распределений. Частным случаем являются
распределения Лапласа и нормальное.
При решении задач статистического анализа часто пользуются одним из
критериев согласия, опираясь на заданный уровень значимости (обычно 0,01;
0,05; 0,10). Гипотеза о согласии принимается, если величина соответствующей
статистики не превышает критического значения. Однако, как отмечено в
работе [11], принятие гипотезы согласия по одному критерию совсем не
означает, что распределения окажутся близкими в соответствии с другими
критериями, так как различные критерии используют различные меры близости
распределений. Так, критерии Колмогорова и Смирнова измеряют расстояние
между теоретическими и эмпирическим интегральными законами
распределения в линейной мере, в критериях Ω2 и ω2 Мизеса это расстояние
измеряется в квадратичной мере. В критерии χ2 Пирсона в квадратичной мере
измеряется
расстояние
между
теоретическим
и
эмпирическим
дифференциальными законами распределения. Близкая мера используется в
критерии отношения правдоподобия. Использование нескольких критериев
позволяет принимать решение по их совокупности.
При проверке гипотезы о согласии в программной системе используется
шесть критериев: Пирсона χ2, отношения правдоподобия, критерий
Колмогорова, критерий Смирнова и два критерия омега квадрат Мизеса.
Для j-го закона распределения и i-го критерия вычисляется значение S0ij
статистики Si и вероятности P{Si > S0ij} = αij. Если αij > α, где α – заданный
уровень значимости, гипотеза о согласии не отвергается. Предпочтение
отдается тому распределению, согласие с которым является наилучшим.
В сомнительных случаях используется компромиссный критерий вида
m
max ∑ ωi α ij
i =1
,
где ωi – вес i-го критерия, [ω] = 1. Больший вес имеют параметрические
критерии Пирсона и отношения правдоподобия.
Исходная выборка для программного обеспечения системы может быть
группированной, негруппированной или частично группированной. При
проверке гипотез по критериям, предусматривающим группировку данных,
используется
оптимальное
группирование
данных,
обеспечивающее
максимальную мощность критериев при близких альтернативных гипотезах.
Информация о ряде законов распределения случайных величин,
характеристиках и свойствах двухпараметрических законов распределения,
которым подчиняются геодезические данные, ранее в геодезической литературе
не имела места.
При этом задача связать результаты анализа с конкретными
обстоятельствами и условиями измерений автором не ставилась.
Математическая обработка геодезических данных (уравнивание,
преобразования) выполнена по программам автора.
Статистические исследования законов распределения дополняют
некоторые вопросы теории ошибок измерений. В частности, предложения
автора относительно методики проверки свойств случайных ошибок и
отбраковки грубых ошибок, иллюстрированные на примере ряда невязок
триангуляции 1-го класса.
1. ОШИБКИ И ПОПРАВКИ ГЕОДЕЗИЧЕСКИХ ИЗМЕРЕНИЙ
1.1. Ошибки результатов измерений
Каждое измерение содержит ошибку. Пусть Yи – истинное значение
измеренной величины, а уi есть результат i-го измерения этой величины. Тогда
разность
θi = yi – Yи = ∆i + δ
(1)
– истинная ошибка результата измерения.
∆i = yi – My
(2)
– случайная ошибка (случайная составляющая общей ошибки θi).
Му – математическое ожидание измеренной величины.
«К случайным ошибкам относят ошибки, математическое ожидание
которых равно нулю» [23]
М(∆) = 0.
Закономерности случайных ошибок проявляются только в массе.
Подобные закономерности называют статистическими.
К систематическим ошибкам относят такие ошибки, математическое
ожидание которых существенно отличается от нуля.
δ = My – Yи
(3)
– систематическая ошибка.
Систематические ошибки подчиняются так называемым динамическим
закономерностям, которые могут быть выражены некоторым уравнением.
Общих правил для определения систематических ошибок не существует.
Однако методы математической обработки геодезических измерений позволяют
установить сам факт наличия подобных ошибок в результатах измерений.
Систематические ошибки стремятся исключить из результатов измерений.
С этой целью для конкретных условий измерений устанавливают закон
действия систематических ошибок и в результат измерения вводят поправку
или применяют методику измерений, рассчитанную на уменьшение влияния
систематических ошибок; используют специальные методы математической
обработки.
Если систематическая ошибка устранена, то при δ = 0 получим
yi = Yи + ∆i.
Так как Yи есть постоянная, а ∆i – непрерывная случайная величина, то
результат уi будет представлять собой i-ю реализацию некоторой непрерывной
случайной величины Y.
Истинные и случайные ошибки используют для оценки точности
результатов измерений по формулам Гаусса. Для случая равноточных
измерений эти формулы имеют вид:
[θ 2 ]
m=
,
n
где [θ2] = θ12 + θ22 + … + θn2,
или
(4)
[∆2 ]
m=
n
(5)
- средняя квадратическая ошибка результата измерения.
Считают, что случайные ошибки измерений подчиняются нормальному
закону распределения с плотностью вероятности
f (∆) =
1
e
σ 2π
−
∆2
2σ 2 ,
(6)
где σ – среднее квадратическое отклонение.
График данной функции носит название кривой Гаусса. Это кривая
нормального распределения при математическом ожидании М∆ = 0.
Статистический анализ случайных ошибок измерений позволяет
установить их действительный закон распределения.
Статистические методы используют и для выявления грубых ошибок
измерений, источником которых могут быть просчеты наблюдателя,
неисправности инструмента, резкое изменение внешних условий, сбои в
передаче информации по каналам связи и др. Грубые ошибки должны быть
исключены из результатов измерений.
Истинные значения измеренных величин и, следовательно, истинные,
случайные ошибки измерений известны далеко не всегда. На практике чаще
используют истинные значения некоторых функций результатов измерений
Ф(Y1, Y2, …,Yn). Разность между функцией измеренных и функцией истинных
значений является истинной ошибкой функции θФ или невязкой w.
Ф ( y1, y 2 , ..., y n ) − Ф (Y1, Y2 , ..., Yn ) = θФ = w
(7)
w
0
– истинная ошибка функции, невязка.
Информацию для оценки точности и анализа результатов измерений могут
давать разности двойных измерений однородных величин и разности функций
двойных измерений.
di = yi – y Ei (i = 1, 2, …, n)
– разности двойных измерений.
θd = d – 0 = d
(8)
– истинная ошибка разности двойного измерения, равная самой разности.
Например, разность измеренных превышений прямого и обратного ходов
геометрического нивелирования:
d = hпр – hобр.
Систематические ошибки измерений в разностях двойных измерений в
значительной степени погашаются. При наличии остаточной систематической
ошибки (в разностях равноточных измерений) среднее арифметическое из этих
разностей
δ=
[d]
n
будет существенно отличаться от нуля. Остаточную систематическую
ошибку δ исключают из разности.
Разность функций двойных измерений является истинной ошибкой этой
разности:
θD = D = ϕ ( y1, y 2 , ..., y n ) − ϕ ( y1′ `, y′2 , ..., y′n ) .
(9)
Например, разность отметок, полученных по результатам повторных
наблюдений за осадками промышленного сооружения:
∆H = H – H ,E
где отметки H являются функциями результатов измерений:
H = Ф(h1, h2, …, hn).
Специальные методики математической обработки повторных наблюдений
позволяют выявить наличие и вычислить значения осадок сооружения [24].
1.2. Сущность задачи уравнивания
Объектом анализа геодезических данных могут служить поправки,
получаемые при математической обработке геодезических измерений.
Поправки вводят в результаты измерений с целью ослабления влияния ошибок,
присутствующих в измерениях.
Обозначим:
у1, у2, …, уn – результаты измерений;
р1, р2 , …, рn – веса измерений;
Y1,Y2, …,Yn– истинные значения измеренных величин;
n – число всех измерений;
t – число необходимых измерений;
r=n–t
(10)
– число избыточных измерений.
Каждая избыточно измеренная величина приводит к появлению
математического соотношения, связывающего ее с другими измеренными
величинами. Например, измерение третьего угла плоского треугольника
позволяет составить следующее уравнение относительно истинных значений
углов:
Y1 + Y2 + Y3 – 180˚ = 0.
В общем случае
Φj(Y1, Y2, …, Yn) = 0 (j = 1, 2, …, r) .
(11)
Система (11) включает только независимые уравнения, число которых
равно r.
С измеренными величинами, вследствие неизбежных ошибок измерений,
математические соотношения (11) строго удовлетворяться не будут:
Фj( y1, y2, …, yn) = wj.
(12)
Величины wj называют невязками.
В процессе математической обработки необходимо исправить результаты
измерений так, чтобы удовлетворить всем математическим связям, т. е.
устранить невязки. Процесс математической обработки, направленный на
устранение невязок, называется уравниванием.
Необходимо найти такие поправки vi к результатам измерений, чтобы
Фj( y1 + v1, y2 + v2, …, yn + vn ) = 0 (j = 1, 2, …, r ).
(13)
Так как неизвестных поправок n, а уравнений (13) r < n, задача оказывается
неопределенной, имеет множество решений. Для получения единственного
решения вводят дополнительное условие.
Таким образом, причиной возникновения задачи уравнивания является
присутствие ошибок в результатах измерений. Условием, позволяющим
поставить задачу уравнивания, является наличие избыточных измерений.
Целью уравнивания является устранение невязок и повышение в среднем
точности всех измеренных величин. Кроме того, избыточные измерения
позволяют выявлять наличие грубых ошибок и выполнять оценку точности
измеренных и уравненных величин.
Уравнивание под условием
[pv2] = min
(14)
называют уравниванием по методу наименьших квадратов (МНК). Это
задача на условный экстремум имеет два основных способа решения –
коррелатный и параметрический. Первый – способ Лагранжа с
неопределенными множителями для нахождения условного экстремума. Второй
– способ абсолютного минимума, когда все измеренные величины представляют
в виде функций некоторых параметров.
Уравнения (11), выражающие математическую связь между истинными
значениями измеренных величин, называются условными уравнениями связи.
Способ уравнивания по МНК, при котором используют условные уравнения
связи, называется коррелатным.
Условные уравнения (13) могут иметь нелинейный вид. Общего способа
решения систем нелинейных уравнений произвольного вида не существует.
Чтобы решить задачу, функции (13) приводят к линейному виду разложением в
ряд Тейлора. Полагая, что vi << yi, рассматривают поправки vi, как приращения
аргументов yi. Функции Фj должны быть дифференцируемы
Фj(y1 + v1, y2 + v2, …, yn + vn) =
 ∂Ф j 
 ∂Ф j 
 ∂Ф j 
 v1 + 
 v2 + ... + 
 v n + R.
 ∂у1 0
 ∂у 2 0
 ∂y n 0
= Фj(y1, y2, …, yn) + 
Нелинейными членами разложения (остатком R) пренебрегают.
Обозначают:
Фj(y1, y2, …, yn) = wj
– невязки – свободные члены условных уравнений поправок;
 ∂Ф1 
 ∂Ф2 
 ∂Фr 

 = ai ;

 = bi ;

 = ri
...;
∂
y
∂
у
∂
y
 i 0
 i 0
 i 0
– коэффициенты условных уравнений поправок – частные производные от
функций Фj, вычисляемые по результатам измерений.
Система условных уравнений поправок имеет вид:
а 1v1 + a 2 v 2 + ... + a n v n + w 1 = 0 
b1v1 + b 2 v 2 + ... + b n v n + w 2 = 0

.........................................

r1 v1 + r2 v 2 + ... + rn v n + w r = 0 
(15)
или
Аr×nVn×1 + Wr×1 = 0.
(16)
Систему (16) условных уравнений поправок решают под условием (14)
МНК
Т
[pv2] = V PV = min,
 p1 0

 0 p2
где P = 
... ...

0 0
0

... 0 
– матрица весов результатов измерений.
... ... 

... p n 
...
Используют метод Лагранжа с
называемыми в геодезии коррелатами.
неопределенными
множителями,
К T = (к1, к 2 , ..., к r ) – вектор коррелат.
Составляют функцию Лагранжа:
Т
Т
Ф = V P V − 2К ( АV + W ) .
∂Ф
= 2V T P − 2K T A = 0;
PV = A T K;
ПР V = ПА Т K ,
∂v
 π1 0 ... 0 


0
π
...
0


2
– матрица обратных весов измерений;
где П = 
... ... ... ... 


0
0
...
π

n
πi =1 / p i – обратный вес результата измерения.
V = П AT K
(17)
– коррелатное уравнение поправок, выражающее поправки в виде функций
коррелат.
Подставив (17) в (16), получают систему нормальных уравнений коррелат
A П AT K + W = 0
или
N r × r K r ×1 + Wr ×1 = 0.
K = − N −1W
(18)
(19)
– решение нормальных уравнений коррелат способом обращения.
Найдя коррелаты к1, к2, …, кr, определяют поправки к результатам
измерений из выражения (17).
После этого вычисляют уравненные значения результатов измерений
y i = y i + v i (i = 1, 2, ..., n )
(20)
и делают контроль уравнивания подстановкой уравненных измерений в
условные уравнения связи:
Ф j ( y1 , y 2 , ..., y n ) = 0 ( j = 1, 2, ..., r ).
(21)
Второй задачей математической обработки является оценка точности
измеренных и уравненных величин [23], [12].
1.3. Статистические свойства поправок
Информацию о точности выполненных измерений и их статистических
свойствах содержат поправки, получаемые из уравнивания результатов
измерений по МНК. Рассмотрим некоторые статистические свойства поправок в
предположении, что результаты измерений не смещены (систематические
ошибки δ = 0) и распределены нормально.
С учетом формул (17) и (19) вектор поправок имеет вид:
V = ПA T K = − ПA T N −1W .
(22)
Вектор невязок W выразим через вектор истинных поправок U:
W = – AU = – A(Yист – Y)
и подставим в (22)
V = ПAT N −1A(Yист − Y) = ПAT N −1AYист − ПAT N −1AY .
−1
Обозначим C = ПA N A , тогда
(23)
V = CYист – CY.
Формула (23) устанавливает непосредственную связь поправок и
результатов измерений. Так как первое слагаемое в этом выражении есть
величина постоянная, вектор поправок V представляет собой линейную
функцию нормального случайного вектора результатов измерений Y. Известно,
что «линейная функция от аргумента, подчиненного нормальному закону, также
подчинена нормальному закону» [5]. Следовательно, случайный вектор V
является нормальным вектором.
Найдем математическое ожидание вектора V
M(V) = M(CYист – CY) = CYист – CM(Y).
Если результаты измерений не содержат систематических ошибок, то
M(Y) = Yист; M(V) = CYист – CYист = 0; M(V) = 0.
Нормальный вектор поправок V имеет математическое ожидание, равное
нулю. Элементы вектора V зависимы. Корреляционную матрицу вектора V
можно получить на основании следующей теоремы: если вектор Х есть
линейная функция вектора Y, Х = АY + А0, где А и А0 – матрицы с постоянными
элементами, то
(24)
КХ = АКYАТ,
где КХ и КY – корреляционные матрицы векторов Х и Y.
T
Y – вектор независимых результатов измерений. Поэтому корреляционные
моменты kij = 0 (i ≠ j) и корреляционная матрица имеет диагональный вид
 m12 0 ... 0 


2
 0 m 2 ... 0 
КY =
,
... ... ... 
 ...
 0
0 ... m 2n 

2
2
2
где m i = µ ⋅ 1 / p i = µ π i – квадрат средней квадратической ошибки
результата измерения; µ – средняя квадратическая ошибка единицы веса,
отсюда
КY = µ 2 П
(25)
– корреляционная матрица результатов измерений.
K V = CK Y CT = µ 2 ПA T N −1A ПA T N −1AП = µ 2 ПA T N −1NN −1A П;
−1
K V = µ ПA N A П
2
T
(26)
– корреляционная матрица поправок.
Диагональные элементы матрицы KV являются квадратами средних
квадратических ошибок поправок – mV2. Эти данные можно использовать для
вычисления допустимого значения поправки
vдоп = ± t·mV,
(27)
где t – аргумент интеграла вероятностей Ф(t), в предположении о нормальном
распределении результатов измерений и надежного определения µ.
Коэффициент t выбирается равным 2; 2,5 или 3, что соответствует вероятности
0,954; 0,988; 0,997 [2].
Используя теорему (24), можно получить корреляционную матрицу
невязок
Kw = AKYAТ = µ2АПАТ = µ2N.
Допустимое значение невязки вычисляют по формуле
(wj)доп = ± t · µ N jj ,
(28)
где Njj – диагональный элемент матрицы коэффициентов нормальных
уравнений коррелат.
1.4. Параметрический способ уравнивания
Поправки, используемые нами для статистического анализа, были
получены в результате уравнивания геодезических сетей параметрическим
способом. Кратко изложим суть этого способа.
Пусть выполнено n измерений у1, у2, …, уn с весами p1, p2, …, pn; t – число
необходимых измерений. Выбирают t независимых неизвестных – параметров –
х1, х2, …, хt. Y1, Y2, …,Yn – истинные значения измеренных величин; Х1, Х2,
…,Хt – истинные значения параметров. Между этими значениями может быть
установлена исходная система параметрических уравнений связи, в которой
измеренные величины представлены в виде функций выбранных параметров
(29)
Fi(X1, X2, …, Xt) = Yi (i = 1, 2, …, n).
С уравненными значениями измеренных величин и параметров система
(29) принимает вид:
Fi(x1, x2, …, xt) = yi + vi (i = 1, 2, …, n) .
(30)
Функции Fi приводят к линейному виду разложением в ряд Тейлора. С этой
целью вводят приближенные значения параметров х01, x02, …, x0t, которые
вычисляют по результатам измерений. Тогда
xj = x0j + δxj (j = 1, 2, …, t),
(31)
где δхj – поправки к приближенным значениям параметров.
На основании (30) с учетом (31) имеют:
Fi (x10 + δ x1 , x 02 + δ x 2 ,..., x 0t + δ x t ) − yi =
 ∂F 
 ∂F 
 ∂F 
= Fi (x10 , x 02 ,..., x 0t ) +  i  δ x1 +  i  δ x 2 + ... +  i  δ x t − yi = vi .
 ∂x1 0
 ∂x 2  0
 ∂x t 0
Fi ( x1 , x 2 ,..., x t ) − y i = l i
Обозначают
параметрических уравнений поправок;
0
 ∂Fi 

 = a i ,
∂
x
 1 0
0
 ∂Fi 

 = b i ,...,
∂
x
 2 0
0
–
свободные
члены
 ∂Fi 

 = t i
∂
x
 t 0
– коэффициенты параметрических уравнений поправок;
а i δ x1 + bi δ x 2 + ... + t i δ x t + li = vi
(i = 1, 2, ..., n )
(32)
– параметрические уравнения поправок.
Система (32) в матричном виде:
Аn×tXt×1 + Ln×1 = Vn×1.
(33)
Параметрические уравнения поправок (33) решают по МНК, т. е. под
условием [pv2] = min. Функцию
F = VTPV = min
дифференцируют по вектору Х, результат приравнивают нулю.
∂F ∂F ∂V
=
⋅
= 2V T P A = 0;
∂X ∂V ∂X
(A X + L )T ⋅ P A = 0; X T A T P A + LT P A = 0.
Транспонируют левую и правую часть полученного выражения
ATP A X + ATP L = 0 .
Nt×tXt×1 + Bt×1 = 0
(34)
– система нормальных уравнений.
X = – N-1B
(35)
– решение нормальных уравнений способом обращения.
В результате решения системы (34) находят поправки к приближенным
значениям параметров δхj, затем по формуле (32) – поправки к результатам
измерений vi, уравненные результаты измерений у i = y i + v i и параметров (31);
выполняют контроль уравнивания по формуле (30).
По результатам уравнивания делают оценку точности измеренных и
уравненных величин. Для оценки точности уравненных величин составляют
весовую функцию, которую приводят к линейному виду разложением в ряд
Тейлора. Это функция параметров:
F(x1, x2, …, xt) =
 ∂F 
 ∂F 
 ∂F 
 δ x t =
 δ x1 + 
 δ x 2 + ... + 
∂
∂
∂
x
x
x
 1 0
 2 0
 t 0
= F(x01, x02, …, x0t) + 
= f0 + f1δx1 + f2δx2 + … + ftδxt = f0 + FTX.
Среднюю квадратическую ошибку весовой функции определяют по
формуле
mF = µ
1
,
PF
(36)
где
[pv 2 ]
µ=
n−t
(37)
– средняя квадратическая ошибка единицы веса, характеризующая точность
результатов измерений по материалам уравнивания;
1/PF – обратный вес функции.
На основании (35) и (33)
Х = – N-1B = – N-1ATPL.
Матрицы N-1, A, P имеют постоянные элементы. Вектор свободных членов
параметрических уравнений поправок L = F(X0) – Y имеет корреляционную
матрицу КL = KY = µ2П. По теореме (24)
КХ = (– N-1ATP) KL (– N-1ATP)T = µ2(N-1ATPПPAN-1) = µ2(N-1NN-1);
KX = µ2N-1
(38)
– корреляционная матрица параметров.
 m 2x
1

k
K x =  x 2 x1
 ...
k
 x t x1
k x1x 2
m 2x 2
...
k xtx2
... k x1x t 
 Q11 Q12


... k x 2 x t
2  Q 21 Q 22
=
µ
⋅

...
...
...
... 

... m 2x t 
 Q t1 Q t 2
... Q1t 

... Q 2 t 
.
... ... 

... Q tt 
Отсюда имеем
m 2x j = µ 2 Q jj = µ 2 (1 / Px j );
1
= Q jj
Px j
(39)
– обратный вес параметра равен соответствующему диагональному
элементу обратной матрицы;
k x i x j = µ 2 Q ij
(i ≠ j)
(40)
– корреляционный момент пары хi и xj.
F = f 0 + FT X
– весовая функция.
На основании теоремы (24)
KF = m2F = FTKX(FT)T = µ2FTN-1F
(41)
– корреляционная матрица одной функции.
1/PF = FTN-1F
(42)
– вычисление обратного веса функции через элементы обратной матрицы.
Вектор уравненных результатов измерений можно представить в виде:
Y = Y + V = Y + AX + L = Y + AX + F( X 0 ) − Y = AX + F( X 0 ) .
На основании теоремы (24)
K Y = AK X A T = µ 2 AN −1A T
(43)
– корреляционная матрица уравненных результатов измерений.
Вектор поправок к результатам измерений:
V = AX + L = A( − N −1A T PL) + L = − AN −1A T PL + L =
= (E − AN−1A T P)L .
На основании теоремы (24)
K V = (E − AN−1A T P)K L (E − AN −1A T P)T =
= µ 2 (E − AN −1A T P) ⋅ П ⋅ (E − PAN −1A T ) =
T
−1 T
= µ 2 (П − AN−1A T − AN −1A T + AN −1 A
PA
N A )=
N
= µ 2 (П − AN −1A T );
K V = µ 2 П − µ 2 AN −1A T = K Y − K Y
(44)
– корреляционная матрица поправок.
m 2v − диагональные элементы матрицы KV – позволяют установить
допустимое значение поправки v доп = ± t · mv. Для нормального закона
распределения t – аргумент интеграла вероятностей Ф(t) (табл. 1 приложения).
2. СТАТИСТИЧЕСКИЙ АНАЛИЗ ГЕОДЕЗИЧЕСКИХ ДАННЫХ
2.1. Оценки параметров
Производство измерений является частным случаем выборочного метода,
когда в качестве генеральной совокупности рассматриваются все возможные
значения измеренного объекта, а в качестве выборки – n выполненных
измерений этого объекта. По данным выборки решается задача оценивания
параметров. Обозначим а – некоторый параметр распределения, например,
математическое ожидание или дисперсия. Значение данного параметра,
найденное по результатам наблюдений, называется статистикой или оценкой
параметра – а . Оценка параметра является функцией результатов измерений
a = f ( y1, y 2 , ..., y n ).
Эта случайная величина должна отвечать следующим требованиям.
С увеличением числа наблюдений оценка а должна сходиться по вероятности
к параметру а. В этом случае она называется состоятельной
(45)
lim P{a − a < ε} = 1.
n →∞
Оценка параметра должна быть несмещенной, то есть не содержать
систематической ошибки; математическое ожидание оценки должно быть равно
параметру
М ( а ) = а.
(46)
Оценка должна быть эффективной, значит, обладать по сравнению с
другими наименьшей дисперсией
D(a ) → min .
(47)
Рассмотрим два основных метода нахождения
оценок параметров.
255
Первый – метод моментов К. Пирсона. За оценку математического
ожидания берут среднее арифметическое
Му = у =
[у].
(48)
n
Смещенной оценкой дисперсии является
n
{
}
Dу = M Y − M y =
∑ (y i − y )
2
i =1
n
.
Несмещенная оценка дисперсии вычисляется по формуле:
n
Dy =
∑ ( yi − y )
i =1
2
(49)
n −1
или
n
Dy =
∑ ( yi − M y )
i =1
n
2
,
(50)
если математическое ожидание Му известно.
Второй метод нахождения оценок параметров – это метод максимального
правдоподобия Р. Фишера. Требуется знать вид плотности распределения
случайной величины f ( yi , a1, a 2 , ..., a k ) . Неизвестными являются параметры aj
(j = 1, 2, …, k), а величина yi есть i-е значение в выборке.
Функция правдоподобия имеет вид
n
L ( y1 , ..., y n ; a1 ,..., a k ) = γ Π f ( y i ; a1 , a 2 ,..., a k ) ,
i =1
где γ – некоторая константа.
Оценки параметров находят в результате максимизации функции
правдоподобия max L ( y1 ,..., y n ; a 1 ,..., a k ) или ее логарифма. Для этого
a1 ,...,a k
решают k уравнений вида
∂L
∂ ln L
= 0 или
=0,
∂a j
∂a j
так как L достигает максимума в той же точке, что и lnL.
Для нормального закона распределения оценки математического ожидания
и дисперсии, полученные методом максимального правдоподобия, совпадают с
формулами (48) – (50) метода моментов.
2.2. Методика статистического анализа
Одной из важных задач математической статистики является определение
закона распределения случайной величины, наилучшим образом описывающего
выборочные данные, а также определение оценок неизвестных параметров
закона и числовых характеристик, математического ожидания Мх, дисперсии Dx
и др.
Рассмотрим методику статистического анализа результатов наблюдений,
выполняемого без использования программных средств [13].
По виду эмпирической кривой распределения, а также из соображений,
связанных с существом задачи, делают предположение о виде теоретического
распределения. Для ряда случайных ошибок измерений в качестве
теоретического берут нормальный закон распределения.
Если объем выборки, то есть количество наблюдений случайной величины,
подлежащее исследованию, достаточно велик, выполняют группирование
данных. При этом весь диапазон значений х1, х2, …, хn делят на интервалы и
подсчитывают, сколько хi попадает в каждый интервал. Способы задания
интервалов различны. Возможен подход, при котором устанавливают интервалы
равной длины в количестве от 8 до 20 в зависимости от объема выборки.
Для определения величины интервала нужно путем непосредственного
просмотра данных найти хmax и хmin – наибольшее и наименьшее значение
случайной величины (СВ), затем вычислить длину интервала по формуле
с=
x max − x min
,
к
(51)
где к – число интервалов.
Результаты группирования и вычисления, связанные с определением
оценок параметров распределения, помещают в рабочей таблице (см. табл. 3).
Границы интервалов хi определяют по формулам
x1 = xmin, xi+1 = xi + c (i = 1, 2, …, к).
xк+1 = хmax – контроль вычислений (c учетом ошибки округления).
Далее подсчитывают, сколько значений хi попадает в каждый интервал.
Малочисленные интервалы ( n i < 5) объединяют.
Эмпирические частоты n i показывают, как часто при наблюдении
встречались значения, сведенные в данные интервалы.
к
∑ n i = n – контроль определения эмпирических частот.
i =1
По эмпирическим частотам n i вычисляют эмпирические накопленные
j
частоты N j = ∑ n i .
i =1
Затем определяют середины интервалов хiср по формулам
x1ср = хmin + с/2, xi+1ср = xiср + c (i = 1, 2, …, (к-1)).
xкср + с/2 = xmax – контроль вычислений.
По группированным данным вычисляют оценки параметров.
к
ср
∑ ni xi
М х = х = i =1
(52)
n
− оценка математического ожидания (среднее арифметическое).
к
∑ niδ xi
2
i =1
σх =
(53)
n −1
− оценка среднего квадратического отклонения,
ср
где δ х i = x i − x.
к
µk =
∑ niδ x i
k
i =1
(54)
n
− оценка центрального момента k-го порядка (k = 2, 3, 4).
S =
µ3
σ x3
(55)
− оценка асимметрии кривой распределения,
σS =
6(n − 1)
(n + 1)(n + 3)
− оценка среднего квадратического отклонения асимметрии.
При n > 50
6
.
(56)
n
Если S ≤ t ⋅ σ s , асимметрия несущественна, t – аргумент интеграла
σS =
вероятностей Ф(t).
Е=
µ4
σ х4
−3
(57)
− оценка эксцесса кривой распределения. Эксцесс является мерой
островершинности кривой распределения. Эксцесс нормального закона равен
нулю.
24 n (n − 2 )(n − 3)
σE =
(n − 1)2 (n + 3)(n + 5)
− оценка среднего квадратического отклонения эксцесса.
При n > 50
24
.
(58)
n
Если E ≤ t ⋅ σE , эксцесс несущественный.
σЕ =
Вычисление теоретических (нормальных) частот (табл. 4) выполняют по
следующим формулам:
Р(хi < Χ < xi+1) = F(ti+1) – F(ti)
(59)
− вероятность попадания случайной величины (СВ) Х в заданный
интервал.
ti =
xi − х
σx
− центрированное и нормированное значение границы интервала.
F(t) – функция нормального распределения.
ni = nP(xi < Χ < xi+1)
(60)
теоретические частоты.
к
∑ ni ≤ n
i =1
– контроль ni.
j
N j = ∑ ni
i =1
– теоретические накопленные частоты.
По данным рабочей таблицы строят графики, позволяющие сделать
предварительное заключение о законе распределения случайной величины.
График, построенный по средним значениям СВ в интервале хiср. и
эмпирическим частотам n i , называется многоугольником распределения. Для
наглядности на тех же осях строят теоретическую (нормальную) кривую по
теоретическим частотам ni.
Статистическая проверка гипотез. Чтобы сделать надежный вывод о том,
существенно или случайно отклонение эмпирической кривой от нормальной,
используют метод исследования, называемый статистической проверкой
гипотез.
Для проверки выдвинутой гипотезы вычисляют числовую характеристику,
называемую критерием проверки. Если вычисленному значению критерия
соответствует достаточно высокая вероятность, гипотеза принимается.
Вероятность, которой решено пренебрегать в данной области исследования,
называется уровнем значимости α. В технических исследованиях принимают α
= 0,10; 0,05; 0,01.
Соответствие эмпирического и теоретического распределений можно
проверить критерием Пирсона χ2. Вычисляют статистику:
(n i − n i ) 2
=∑
ni
i =1
.
к
χ э2
(61)
По таблице (табл. XVI, [25]) находят значение χα2 . Аргументами являются
заданный уровень значимости α (например, α = 0,05) и число степеней свободы
r = к – s – 1, где s – число параметров теоретического распределения,
полученных по опытным данным. Для нормального закона распределения r = к
– 3.
Если χα2 > χэ2, результаты наблюдений не противоречат выдвинутой
гипотезе, то есть можно считать, что эмпирическое распределение
несущественно отклоняется от нормального.
Если χα2 < χэ2, эмпирическое распределение существенно отличается от
нормального.
Степень
F( x ) =
расхождения
эмпирической
F( x ) =
Nj
n
и
теоретической
Nj
n
функций
А.Н. Колмогорова:
D = max F( x ) − F( x )
распределения
можно
оценить
критерием
(62)
или
d = max N j − N j
.
При неограниченном возрастании числа наблюдений – n вероятность
неравенства d / n ≥ λ стремится к пределу Р(λ). Значения этих вероятностей
приведены в таблицах (табл. 7.6.1, [5]).
Вычисляют λ = d / n или λ = D n и по таблице находят Р(λ). Если Р(λ)
< α, гипотезу о случайном характере расхождения функций распределения
отвергают.
В отличие от критерия Пирсона χ2, критерий А.Н. Колмогорова не
учитывает числа степеней свободы. Как правило, параметры теоретического
распределения определяются по статистическим данным, и в этом случае
критерий А.Н. Колмогорова дает завышенные значения вероятности Р(λ).
Окончательный вывод о законе распределения исследуемой случайной
величины следует сделать с учетом полученных значений асимметрии и
эксцесса.
Очевидно, что применение более совершенных оценок (оценок
максимального правдоподобия, МD-оценок, получаемых минимизацией
статистик, измеряющих расстояния между эмпирическим и теоретическим
законом и др.) и современных методов анализа требует уже использования
соответствующего программного обеспечения.
2.3. Статистический анализ невязок треугольников триангуляции 1-го
класса
В качестве примера и в соответствии с изложенной методикой выполнен
статистический анализ невязок треугольников триангуляции 1-го класса.
Исходные данные – невязки в рядах триангуляции Новосибирск – УстьКаменогорск и Омск – Семиярское, представленные в табл. 1 и 2
соответственно [4].
Таблица 1. Невязки ряда триангуляции 1-го класса Новосибирск – УстьКаменогорск
№
1
2
3
4
5
6
7
8
9
10
11
12
13
14
f
+0,76˝
-1,48
-1,21
+0,52
-0,57
-0,55
+2,54
-0,99
-0,24
+0,25
+0,50
+1,08
+1,45
-2,42
№
15
16
17
18
19
20
21
22
23
24
25
26
27
28
[f 2] = 65,283
f
+0,73˝
+1,28
+2,03
+0,51
-0,10
-0,78
-0,76
-0,12
+0,51
+0,33
-1,03
+1,16
-1,32
-0,04
№
29
30
31
32
33
34
35
36
37
38
39
40
41
42
f
+0,59˝
+0,77
-1,53
-1,06
-0,84
+1,05
-0,61
-0,96
-0,16
+0,26
+0,46
-0,47
+1,95
+0,71
№
43
44
45
46
47
48
49
50
51
52
53
54
55
56
f
+0,77˝
+0,46
+0,92
-0,75
+0,03
-0,21
-0,57
-0,50
-0,82
+0,31
-0,90
-0,44
+1,09
-0,72
№
57
58
59
60
61
62
63
64
65
66
67
68
f
+0,90˝
+0,45
+0,27
+0,96
+0,53
-0,21
-0,35
-1,80
+1,39
-0,57
+2,08
+0,12
Таблица 2. Невязки ряда триангуляции 1-го класса Омск – Семиярское
№
№
f
№
f
№
f
№
f
f
1
-1,38˝
14
+2,03˝
27
-0,33˝
40
-0,41˝
53
+2,99˝
2
+0,82
15
+0,56
28
-0,26
41
-0,41
54
+1,36
3
-1,00
16
-1,57
29
+0,97
42
+0,98
55
-0,97
4
+0,45
17
+1,31
30
+0,25
43
-0,54
56
+0,88
5
-1,95
18
+0,09
31
-0,72
44
+0,55
57
+1,13
6
-0,79
19
-0,73
32
-0,21
45
-0,34
58
+0,74
7
-0,28
20
+0,76
33
-0,51
46
-0,05
59
+0,26
8
+0,51
21
+0,38
34
+0,46
47
-0,48
60
+0,61
9
-0,22
22
+0,87
35
+0,35
48
-0,14
61
+0,75
10
+1,04
23
+1,20
36
-0,45
49
-1,06
11
-0,41
24
+0,76
37
+0,14
50
-1,04
12
-0,73
25
+0,73
38
+0,03
51
-0,63
+1,55
26
-0,79
39
+0,08
52
+0,75
13
2
[f ] = 49,909
В целях увеличения объема выборки рассмотрим вопрос о
принадлежности данных рядов невязок к одной генеральной совокупности.
Проверим данную гипотезу двумя критериями согласия [25]. Для этого
вычислим основные числовые характеристики случайных величин первого и
второго рядов.
По ряду Новосибирск – Усть-Каменогорск:
n1 = 68 – объем совокупности;
х1 =
[х ] = 0,068 –
n1
n1
среднее значение выборки;
∑ (x i − x1 )
σ12 = i =1
2
= 0,97 – оценка дисперсии.
n 1 −1
По ряду Омск – Семиярское:
n2 = 61 – объем совокупности;
x2 =
[x ′]
n2
∑ (x − x )
n2
σ22 =
= 0,130 – среднее значение выборки;
i =1
'
i
n 2 −1
2 2
2
= 0,82 – оценка дисперсии.
Критерием Фишера F проверяем первую гипотезу о равенстве дисперсий:
Fэ =
σ12
σ22
= 1,18 .
(63)
На уровне значимости α = 0,05 и при числе степеней свободы
r1 = 60 и r2 = 67 в табл. XVIII [25] находим Fα = 1,39.
Так как Fэ < Fα, нулевая гипотеза о равенстве дисперсий принимается.
Согласно критерию Фишера, результаты наблюдений не противоречат гипотезе
о принадлежности двух рядов невязок к общей нормальной совокупности.
Гипотезу о равенстве средних проверяем критерием t [25]:
tэ =
x1 − x 2
σ
2
⋅
n 1n 2
,
n1 + n 2
где
n1
(64)
(
i =1
n2
'
∑ (x i − x 1 ) + ∑ x i − x 2
σ 2 = i =1
2
)2
(65)
n1 + n 2 − 2
– дисперсия общей совокупности.
По данным наблюдений получено σ = 0,90; t э = 0,39.
Для заданного уровня значимости α = 0,05 и числе степеней свободы r = n1
+ n2 – 2 = 127 в табл. XVII [25] находим tα = 1,98. Так как
tэ < tα, нулевая гипотеза о равенстве центров распределения принимается.
Итак, статистический анализ может быть выполнен для общей
совокупности невязок двух рядов наблюдений объемом n = 129;
xmax = + 2,99; xmin = - 2,42.
Число первоначально установленных интервалов к = 10. По результатам
группирования данных крайние интервалы: первый и второй, а также с
восьмого по десятый – были объединены ввиду малочисленности значений,
попадающих в эти интервалы (табл. 3).
2
Таблица 3. Рабочая таблица
№ ин- Границы Эмпирич. N
j
тервал
хi
частоты
ов
ni
-2,42
1
7
7
-1,34
2
13
20
-0,80
3
30
50
-0,26
4
22
72
+0,28
хiср
n i ⋅ x iср
δхi
n i δ x i2 n i δ x 3i n i δ x i4
-1,88
-13,16
-1,98
27,44
-54,34
107,59
-1,07
-13,91
-1,17
17,80
-20,82
24,36
-0,53
-15,19
-0,63
11,91
-7,50
4,73
+0,01
+ 0,22
-0,09
0,18
-0,02
0,00
5
31
103
+0,55
+17,05
+0,45
6,28
+2,82
1,27
17
120
+1,09
+18,53
+0,99
16,66
+16,50
16,33
9
129
+2,17
+19,53
+2,07
38,56
+79,83
165,24
+0,82
6
+1,36
7
+2,99
∑
129
12,36
= + 0,10;
129
16,47
µ3 =
= 0,128;
129
S = 0,145;
х=
S < 3σs
12,36
118,83 16,47 319,52
118,83
= 0,96 ;
128
319,52
µ4 =
= 2,48;
129
σS = 0,22.
σх =
– несущественна.
E = − 0,082;
σE = 0,43.
E < 3σ E
– несущественный.
Вычисление теоретических (нормальных) частот выполнено в табл. 4.
Таблица 4. Вычисление теоретических частот
№
Границы хi
интервалов
- 2,42
x −х
ti = i
σx
F(t)
-2,62
0,004
1
P(xi<Χ<xi+1)
0,063
-1,34
-1,50
-0,94
-0,38
0,19
0,75
1,31
3,03
0,178
23,0
44,9
0,223
28,8
73,7
0,198
25,5
99,2
0,132
17,0
116,2
0,094
12,1
128,3
0,905
7
2,99
21,9
0,773
6
1,36
13,8
0,575
5
0,82
0,107
0,352
4
0,28
8,1
0,174
3
-0,26
8,1
0,067
2
-0,80
Nj
ni
0,999
∑ = 128,3
График эмпирических и теоретических частот представлен на рис. 1.
Критерий Пирсона χ2:
35
к
30
∑
(n i − n i )2
ni
= 5,89.
χэ2 = i =1
20
Для α = 0,05 и r = к – 3 = 7; χα2 = 9,49
15
(табл. 2 приложения).
10
Так как χα2 > χэ2, можно считать, что
расхождение
эмпирических
и
5
теоретических
частот
несущественно.
0
Выдвинутая гипотеза не противоречит
-3
-2
-1
0
1
2
3
результатам наблюдений. Вычисленное
значение статистики χэ2 соответствует
Рис. 1. График эмпирических и
уровню значимости α = Р(χα2 > χэ2) = 0,55.
теоретических
Эмпирическое
распределение
несущественно отличается от нормального.
Критерий А.Н. Колмогорова:
25
λ=
d max
= 0,45
n
.
Вероятность Р(λ) = 0,987 (табл. 3 приложения) близка к единице, что
подтверждает гипотезу о нормальном распределении невязок.
Таким образом, допустимые значения асимметрии и эксцесса
эмпирической кривой распределения, критерии Пирсона и А.Н. Колмогорова
позволяют сделать вывод о том, что закон распределения невязок треугольников
триангуляции 1-го класса несущественно отличается от нормального.
Изложенную методику анализа дополняет проверка свойств случайных
ошибок измерений, рассматриваемая в разделе 4.
2.4. Статистический анализ поправок
2.4.1. Критерии согласия
Статистический
анализ
геодезических
данных,
выполненный
с
использованием программной системы [11], позволил установить, каким
законам распределения эти данные могут подчиняться. Насколько хорошо
наблюдаемая выборка описывается теоретическим законом, проверялось
шестью критериями согласия.
Критерий χ2 Пирсона: вычисляется значение статистики
(n i / n − Pi (θ)) 2
,
χ = n∑
Pi (θ)
i =1
2
k
k
где n = ∑ n i – объем выборки,
i =1
xi
Pi (θ) = ∫ f ( x , θ)dx (i = 1, 2, …, k) – вероятность попадания наблюдения в
x i −1
i-й интервал.
Статистика χ2 при истинной проверяемой гипотезе Н0 в пределе
подчиняется χ2 – распределению с числом степеней свободы (k – 1), если по
выборке не оценивались параметры, и с (k – s – 1), если по ней оценивалось s
параметров закона распределения.
Критерий отношения правдоподобия имеет вид
ni
 P (θ) 
l = ∏ i  .
i =1  n i / n 
k
При верной нулевой гипотезе эта статистика асимптотически распределена
как χ2 с (k – 1) или с (k – s – 1) числом степеней свободы, если по выборке
оценивалось s параметров.
Критерии χ2 и отношения правдоподобия вычисляются по группированным
данным.
Статистики непараметрических критериев Колмогорова, Смирнова, ω2 и Ω2
Мизеса вычисляются по негруппированной выборке. Результаты наблюдений
располагают в порядке их возрастания (вариационный ряд) х1 ≤ х 2 ≤ ... ≤ х n .
Статистика Колмогорова имеет вид
Sk =
(6nD n +1) 2
18n
,
статистика Смирнова
(6nDn+ + 1) 2
Sm =
,
9n
где Dn = max(Dn+, Dn–);
Dn+ = max{i/n – F(xi)}, Dn– = max{F(xi) – (i – 1)/n};
F(x) – функция распределения, согласие с которой проверяется.
Распределение статистики Колмогорова Sk определяется законом
Колмогорова. Статистика Смирнова подчиняется в пределе распределению χ2 с
числом степеней свободы, равным двум.
Статистики Мизеса имеют вид
n 
1
2i − 1
Sω =
+ ∑ F( x i ) −

12n i =1
2n 
2
и
n  2i − 1

 2i − 1 
SΩ = − n − 2 ∑ 
ln F( x i ) + 1 −
 ln(1 − F( x i )) .
2n 

i =1 2n

Для этих статистик
вероятностей [11].
также
известны
предельные
распределения
2.4.2. Законы распределения поправок
Первым объектом статистического анализа явились поправки, полученные
из уравнивания результатов трех циклов наблюдений нивелирной сети на
Чернобыльской АЭС (рис. 2) [30]. Наблюдения выполнял А.Л. Малиновский
(СГГА) в 1994 г.
Число измеренных превышений в этой сети n = 45; число необходимых
измерений (определяемых пунктов) t = 40. Математическая обработка
измерений была выполнена по программе, созданной на основе алгоритма
рекуррентного определения взаимных высотных деформаций [24].
Кроме этого, анализировались ошибки и поправки моделей нивелирных
сетей, схемы которых были разработаны по тому же принципу, в виде
замкнутых полигонов с наличием промежуточных точек в отдельных ходах [14].
Рис. 2. Нивелирная сеть АЭС
Характеристики нивелирных сетей приведены в табл. 5.
Таблица 5. Характеристики нивелирных сетей
№
п/п
1
2
3
4
5
6
Объект
исследования
Модель № 1
Модель № 2
Модель № 3
Модель № 4
Модель № 5
Модель № 6
n
45
45
45
31
31
23
№
п/п
t
40
40
40
26
26
19
7
8
9
10
11
12
Объект
исследования
Модель № 7
Модель № 8
Модель № 9
Сеть АЭС 1
Сеть АЭС 2
Сеть АЭС 3
n
29
34
28
45
45
45
t
21
26
20
40
40
40
Ошибки измерений для моделей нивелирных сетей взяты из таблиц
нормально распределенных случайных чисел.
Анализу подвергались:
1. Ошибки измерений.
2. Поправки к результатам измерений (превышениям), полученным из
уравнивания сетей параметрическим способом.
3. Независимые невязки геометрических условий.
Результаты анализа представлены в табл. 6. Знак «+» в соответствующей
строке таблицы означает, что по результатам анализа нет оснований отвергать
гипотезу о нормальном распределении исследуемой выборки, знак «–» означает,
что выборка не согласуется с нормальным законом распределения. В соседнем
столбце указан закон, который наиболее хорошо подходит для описания
конкретной выборки.
Поправки vi были приведены к равноточному ряду преобразованием
v′i = v i p v i
,
где
1 / p vi = Q Vii
− диагональный элемент матрицы весовых коэффициентов поправок.
Таблица 6. Законы распределения ошибок и поправок
№
п.п.
1
2
3
4
5
6
7
8
9
10
11
12
Объект
исследования
Сеть АЭС 1
Сеть АЭС 2
Сеть АЭС 3
Модель 1
Модель 2
Модель 3
Модель 4
Модель 5
Модель 6
Модель 7
Модель 8
Модель 9
Ошибки ∆
Нормальный
Наиболее
закон
подходящий
+
+
+
+
+
+
+
+
+
Мин. знач.
Нормальное
Нормальное
Коши
Коши
Мин. знач.
Мин. знач.
Мин. знач.
Экспон. типа
Поправки v΄
НормальНаиболее
ный закон
подходящий
+ (-)
Коши
Экспон. типа
Коши
+
Нормальное
+
Макс. знач.
+
Макс. знач.
+
Мин. знач.
+
Коши
+
Нормальное
+
Логистическое
+
Нормальное
+
Коши
Рис. 3. Выравнивание по нормальному закону (цикл 1)
На рис. 3 представлены результаты выравнивания по нормальному закону
поправок нивелирной сети АЭС первого цикла наблюдений.
На рис. 3 обозначено: t[0] – математическое ожидание, t[1] – среднее
квадратическое отклонение. Далее приводятся значения статистик и их
вероятности для критериев согласия: отношения правдоподобия, χ2 Пирсона,
Колмогорова, Смирнова, ω2 и Ω2 Мизеса. Величины вида Р{X > значения
статистики} показывают, при каких максимальных значениях уровня
значимости α гипотеза о согласии с рассматриваемым распределением не будет
отвергаться, т. е. позволяют судить о степени согласия. Для параметрических
критериев χ2 и отношения правдоподобия такая вероятность вычисляется при
двух значениях числа степеней свободы (к – s – 1) и (к – 1). В первом случае по
выборке оцениваются все параметры распределения. Второй случай, когда ни
один параметр не оценивается, в рассматриваемых задачах не имеет место.
Гипотеза о нормальном распределении поправок для сети первого цикла
наблюдений принимается для уровня значимости α = 0,017 по критериям
отношения правдоподобия и Смирнова. Для остальных критериев согласия
уровень значимости принял более высокое значение – в пределах от 0,044 до
0,332.
Эмпирическое распределение поправок первого цикла наблюдений
наилучшим образом соответствует закону Коши (рис. 4).
На рис. 4 обозначено: t[0] – масштабный параметр, t[1] – параметр сдвига.
В случае выравнивания по закону Коши наименьшее значение уровня
значимости (для критерия Смирнова) составило α = 0,196. Наибольшее
значение уровня значимости α = 0,393 имело место для критерия отношения
правдоподобия.
Рис. 4. Выравнивание по закону Коши (цикл 1)
На рис. 5 – 8 приводятся пары результатов выравнивания по нормальному
закону и по наилучшему в данном случае распределению для второго и третьего
циклов наблюдений.
Рис. 5. Выравнивание по нормальному закону (цикл 2)
На рис. 5 обозначено: t[0] – математическое ожидание, t[1] – среднее
квадратическое отклонение.
Сходимость закона распределения к нормальному для поправок второго
цикла
наблюдений
по
критерию
отношения
правдоподобия
с α = 0,0026 плохая. Остальные критерии не противоречат гипотезе
о нормальном распределении поправок с наименьшим значением уровня
значимости α = 0,0163 по критерию χ2 и наибольшим значением уровня
значимости α = 0,075 по критерию ω2.
Рис. 6. Выравнивание по распределению Su-Джонсона (цикл 2)
На рис. 6 t[0], t[1], t[2], t[3] обозначают четыре параметра распределения
Su-Джонсона.
В случае выравнивания по закону Su-Джонсона наименьшее значение
уровня значимости получили критерии отношения правдоподобия α = 0,00056 и
χ2 с α = 0,00116; для критерия Колмогорова α = 0,26; для критериев Смирнова и
ω2 α = 0,34; для Ω2 α = 0,20, что позволяет считать распределение Su-Джонсона
предпочтительнее нормального для поправок к результатам измерений второго
цикла наблюдений.
Рис. 7. Выравнивание по нормальному закону (цикл 3)
На рис. 7 обозначено: t[0] – математическое ожидание, t[1] – среднее
квадратическое отклонение.
При выравнивании по нормальному закону поправок третьего цикла
наблюдений значения уровней значимости составили от α = 0,00113 (для
критерия Смирнова) до α = 0,048 (для критерия ω2).
Рис. 8. Выравнивание по распределению Коши (цикл 3)
На рис. 8 обозначено: t[0] – масштабный параметр, t[1] – параметр сдвига.
При выравнивании по распределению Коши наименьшее значение уровня
значимости α = 0,0085 имело место для критериев χ2 и отношения
правдоподобия, наибольшее α = 0,600 – для критерия Смирнова. Можно
считать, что в данном случае закон Коши предпочтительнее нормального закона
распределения.
Таким образом, для второго и третьего циклов наблюдений распределение
поправок vi по ряду критериев согласия не может считаться нормальным.
Законы распределения поправок vi, полученных из уравнивания моделей
нивелирных сетей, представлены в табл. 6. Независимые случайные ошибки
измерений ∆i распределены нормально. Поправки vi, как линейные функции
ошибок измерений, также подчиняются закону нормального распределения.
Однако, наиболее подходящее распределение и для ошибок, и для поправок в
ряде случаев не соответствует нормальному. Наилучшие распределения для
ошибок и поправок, как правило, не совпадают.
При анализе поправок имели место следующие распределения:
нормальное, минимальных и максимальных значений, логистическое, Коши,
экспоненциального типа. (Последнее охватывает целый класс распределений,
частным случаем которых является нормальное и Лапласа.)
Хорошее соответствие эмпирического распределения одновременно и
нормальному, и одному из перечисленных законов говорит о близости данных
распределений.
Результаты выравнивания невязок w замкнутых полигонов нивелирных
сетей на принадлежность нормальному закону распределения приведены на
рис. 9.
Рис. 9. Результаты выравнивания невязок w по нормальному закону
Выборки невязок очень малы. Результаты статистического анализа не дают
основание отклонить гипотезу об их нормальности, если уровень значимости α
не превышает 0,09 (по критерию отношения правдоподобия).
Наилучшие результаты по совокупности критериев согласия получены для
распределения минимального значения. Они отражены на рис. 10.
Рис. 10. Результаты выравнивания невязок w по распределению минимального
значения
2.5. Влияние зависимости поправок на закон их распределения
Линейные функции нормально распределенных аргументов также
подчиняются закону нормального распределения. Эти функции могут быть
независимы. Поправки, получаемые из совместного уравнивания геодезических
измерений – зависимые линейные функции ошибок измерений. Рассмотрим,
как влияет зависимость поправок на закон их распределения.
Поправки – величины зависимые и неравноточные. Вектор Х с
зависимыми неравноточными элементами может быть преобразован в вектор с
равноточными независимыми элементами линейным преобразованием [10],
[15]:
1
Х′ = (Ω T ) −1 p 2 Х
.
связи
Точность и
коэффициентов
 Q11 Q12

Q 22
Q
Q Х =  21
...
...

 Q n1 Q n 2
вектора
Х
(66)
характеризует
матрица
весовых
... Q1n 

... Q 2 n 
... ... 

... Q nn  .
Элементы матрицы коэффициентов корреляции RХ вычисляют по формуле
rij =
Q ij
Q ii Q jj
.
(67)
Если матрица RХ положительно определена, ее можно разложить на две
взаимно транспонированные треугольные матрицы Ω [8]
R Х = ΩTΩ .
Рис. 11. Модель нивелирной сети
(68)
Вектор Х΄ имеет в качестве
матрицы коэффициентов корреляции
единичную матрицу, т. е. его элементы
являются
равноточными
и
независимыми.
Продемонстрируем
подобное
преобразование на примере нивелирной
сети, состоящей из одного полигона
(рис. 11), с равноточно измеренными
превышениями.
Для данной сети
0
0
1

0
−1 1
А=
0 −1 1

 0 0 −1






− матрица коэффициентов параметрических уравнений поправок;
 2 −1 0 


N =  − 1 2 − 1
 0 −1 2 


− матрица коэффициентов нормальных уравнений;
 0,750 0,500 0,250 


N −1 =  0,500 1,000 0,500 
 0,250 0,500 0,750 


− обратная матрица, диагональные элементы которой равны обратным
весам параметров;
0,577 0,333 
 1


R x =  0,577
1
0,577 
 0,333 0,577
1 

− матрица коэффициентов корреляции параметров.
Матрица Rx положительно определена. При разложении этой матрицы на
произведение двух треугольных получено:
 1 0,577 0,333 


Ω =  0,816 0,471 ;

0,816 

(Ω )
Т −1
0
0 
 1


=  − 0,707 1,255
0 .
 0
− 0,707 1,255 

По формуле
δ х j равн = δ x j p x j
(69)
выполняем преобразование вектора поправок к приближенным значениям
параметров
XT = (δ x1, δ x 2 , ..., δ x t ) = (−1,125; − 2,250; − 3,375)
в вектор с равноточными элементами:
ХТравн = (–1,299; –2,250; –3,897 ).
По формуле
(ΩТ )−1 ⋅ Х равн = Х равн,нез
(70)
получаем вектор с равноточными, независимыми элементами:
ХТравн, нез, = (–1,299; –1,838; –3,182).
Подобные преобразования вектора поправок Х выполнены для двенадцати
моделей свободных нивелирных сетей с числом избыточных измерений от r =
22 – 20 = 2 до r = 28 – 20 = 8. Статистическому анализу подвергались зависимые
неравноточные поправки δхj, полученные из уравнивания нивелирных сетей
параметрическим способом, и преобразованные по формулам (66) – (68)
равноточные независимые поправки. Результаты анализа приведены в табл. 7.
Таблица 7. Закон распределения δх
№ п/п
1
2
3
4
5
6
7
8
9
10
11
12
+
±
+
+
+
+
±
+
+
+
δх неравноточные зависимые
Нормальное
Наиболее
распределение
подходящее
Sb-Джонсона
Sb-Джонсона
Дв. показат.
Sb-Джонсона
Коши
Мин. знач.
Логистическое
Коши
Su-Джонсона
Su-Джонсона
Бета I рода
Бета I рода
+
+
+
+
+
±
+
+
δх равноточные независимые
Нормальное
Наиболее подходящее
распределение
Дв. показат.
Коши
Коши
Коши
Коши
Коши
Коши
Su-Джонсона
Коши
Бета I рода
Логистическое
Таким образом, если вектор Х с зависимыми неравноточными элементами
распределен нормально, соответствующий вектор независимых равноточных
величин в 80% случаев тоже нормален. Наиболее подходящим законом
распределения независимого равноточного вектора Х в большинстве случаев
оказался закон распределения Коши.
Рассмотрим влияние степени зависимости поправок к результатам
измерений vi на закон их распределения.
Элементы матрицы коэффициентов корреляции поправок к результатам
измерений Rv вычислим по формулам параметрического способа уравнивания:
rVij =
Q Vij
Q Vii Q Vjj
,
(71)
где
QV = Qh – Qh+v
(72)
– матрица весовых коэффициентов вектора поправок V;
Qh = П – диагональная матрица обратных весов результатов измерений πi=
1/pi;
Qh+v = AN-1AT– матрица весовых коэффициентов уравненных результатов
измерений,
A – матрица коэффициентов параметрических уравнений поправок
AX + L = V;
N-1 – обратная матрица системы нормальных уравнений
NX + B = 0.
Соответствующие вычисления выполнены для свободной сети, состоящей
из одного полигона (см. рис. 11), с числом избыточных измерений r = 1.
Получена матрица весовых коэффициентов уравненных превышений с
элементами Qjj = 0,75; Qij = –0,25.
Для равноточных измерений матрица Qh = E – единичная. Элементы
матрицы Qv, вычисленной по формуле (72), все равны 0,25. Коэффициенты
корреляции поправок этой сети равны единице (rij = 1), а поправки vi = - w/n.
Таким образом, между поправками превышений сети, состоящей из одного
полигона, с числом избыточных измерений r = 1, имеет место функциональная
связь. При этом закон распределения ошибок превышений, измеренных между
промежуточными точками в этом полигоне, может быть нормальным (данная
выборка ошибок может принадлежать нормальной общей совокупности).
Рассмотрим корреляцию поправок vi в сети, состоящей из двух полигонов
(рис. 12). Число избыточных измерений r = 2.
Рис. 12. Схема нивелирной сети
Матрица коэффициентов корреляции поправок:
1 0,61 0,96 0,99 0,22 0,26 0,26



0,61 0,61 − 0,61 − 0,61 − 0,61 
 1

1
0,74 0,29 0,22 0,22 

.
Rv = 
1
0,22 0,26 0,26 

1
0,96 0,96 



1
0,99 


1 

Наиболее тесная корреляционная связь, близкая к функциональной, имеет
место для поправок в превышения одного и того же полигона; связь с поправкой
в превышение смежного для двух полигонов менее тесная. Теснота
корреляционной связи поправок в превышения соседних полигонов не велика
(|rij| < 0,5). Количество подобных коэффициентов корреляции в этой сети
составило 43% от их общего числа.
Приведем также распределение значений коэффициентов корреляции
поправок в сети из трех полигонов с числом избыточных измерений, равным
трем. Количество |rij| > 0,5 составило 38%. Количество коэффициентов
корреляции в интервале 0,2 < |rij| < 0,5 – 24%. Количество |rij| < 0,2 – 38%. То
есть достаточно малых коэффициентов корреляции |rij| < 0,5 составило уже 62%
от общего их числа.
С увеличением числа избыточных измерений (числа полигонов в сетях
заданной конструкции) процент слабо коррелированных поправок растет.
Большая часть элементов вектора поправок V становятся практически
независимыми. Если число полигонов больше среднего числа измерений в
полигоне, закон распределения поправок приближается к нормальному.
Таким образом, степень зависимости поправок, обусловленная спецификой
схемы построения геодезической сети, определяет соответствие закона
распределения поправок нормальному закону распределения ошибок
измерений.
2.6. Статистический анализ разностей двойных измерений
Статистический анализ разностей средних превышений выполнен по
результатам высокоточного нивелирования на линиях Алтайская – Кош-Агач –
Ташанта и Советское – Минусинск – Кызыл [28], [16].
Исходные данные: производственные материалы, результаты средних
превышений – были взяты из дипломной работы Н.С. Першиной «Анализ
высокоточного нивелирования», выполненной под руководством В.В.
Дорофеевой на кафедре геодезии Новосибирского института инженеров
геодезии, аэрофотосъемки и картографии в 1978 г.
Статистическому анализу подлежали:
1. Разности средних превышений по всей совокупности измерений
объемом в 800 элементов.
2. Разности средних превышений, сгруппированные по длинам визирного
луча 10, 15, 20, 25, 30, 35, 40, 45, 50 м, которые рассматривались в каждом
случае как случайные, равноточные выборки, объемом от 60 до 120 элементов.
Установлено, что реальный закон распределения разностей средних
превышений ∆h для двойных ходов существенно отличается от нормального. В
данном случае наблюдаемое отличие связано с более «тяжелыми хвостами»
реального закона распределения по сравнению с нормальным.
На рис. 13 приведены результаты статистического анализа при попытке
выравнивания разностей средних превышений по всей выборке по
нормальному закону.
Рис. 13. Выравнивание ∆h по нормальному закону
Результаты анализа показывают, что использование нормального закона
для описания разностей средних превышений по всей выборке неправомерно.
Реальный закон распределения имеет более «тяжелые хвосты».
Идентификация закона распределения, под которой понимается выбор из
некоторого множества закона, наиболее хорошо согласующегося с
наблюденными значениями случайной величины, приводит к распределению
Лапласа. Вид соответствующего распределения и результаты анализа приведены
на рис. 14, где t[0] – масштабный параметр, t[1] – параметр сдвига
(математическое ожидание).
Рис. 14. Выравнивание ∆h по закону Лапласа
Однако полученные результаты не означают, что наблюдаемая случайная
величина подчиняется закону Лапласа. Они говорят лишь о том, что
использование этого закона в качестве модели приводит к меньшей ошибке.
Разности средних превышений при определенных длинах визирного луча
рассматривались как равноточные измерения. Установлены законы
распределения разностей средних превышений при длинах визирного луча 10,
15, 20, 30, 35, 40, 45, 50 м. В табл. 8 приведены некоторые статистические
характеристики указанных выборочных результатов наблюдений.
Таблица 8. Выборочные характеристики
Объем
62
68
98
88
100
80
104
79
127
Длина
визирного
луча
10
15
20
25
30
35
40
45
50
Минимальное
наблюдение
-3,3
-2,1
-10,8
-7,6
-2,4
-7,8
-8,6
-10,5
-9,0
Максимальное
наблюдение
3,4
8,7
6,3
7,4
8,7
7,5
9,1
7,4
6,5
Выборочное
среднее
-0,103
0,031
-0,171
-0,378
-0,385
-0,354
-0,778
-0,784
-0,506
Выборочная
дисперсия
2,48
2,65
5,65
5,62
13,42
6,06
10,44
9,18
6,69
При анализе равноточных выборок отличие от нормального закона более
значительно. И это отличие связано с более «тяжелыми хвостами» реального
закона распределения по сравнению с нормальным (табл. 9 – 17).
Решения задачи выбора распределения по различным критериям могут не
совпадать. Для выбора модели закона, наиболее подходящего для описания
данных, в программной системе использовался компромиссный критерий,
позволяющий выбрать некоторую (j-ю) модель из множества моделей R1:
m
max
∑ ωi α i ,
j∈R 1 i =1
m
где ωi – весовой коэффициент i–го критерия, ∑ ωi = 1.
i =1
Таблица 9. Распределение ∆h при длине визирного луча 10 м
Критерий согласия
Отношение
правдоподобия
χ2
Колмогорова
Смирнова
ώ2
Ω2
Компромиссный
Распределение
Коши
Вероятность
0,096
Коши
Двойное экспоненциальное
Накагами
Нормальное
Двойное экспоненциальное
Нормальное
0,095
0,808
0,736
0,895
0,927
0,308
Таблица 10. Распределение ∆h при длине визирного луча 15 м
Критерий согласия
Отношение
правдоподобия
χ2
Колмогорова
Смирнова
ώ2
Ω2
Компромиссный
Распределение
Коши
Вероятность
0,021
Двойное экспоненциальное
Коши
Su-Джонсона
Двойное экспоненциальное
Двойное экспоненциальное
Коши
0,021
0,804
0,467
0,806
0,778
0,281
Таблица 11. Распределение ∆h при длине визирного луча 20 м
Критерий согласия
Отношение
правдоподобия
χ2
Колмогорова
Смирнова
ώ2
Ω2
Компромиссный
Распределение
Логистическое
0,201
Вероятность
Логистическое
Su-Джонсона
Su-Джонсона
Su-Джонсона
Su-Джонсона
Логистическое
0,178
0,970
0,620
0,979
0,990
0,400
Таблица 12. Распределение ∆h при длине визирного луча 25 м
Критерий согласия
Отношения
правдоподобия
χ2
Колмогорова
Смирнова
ώ2
Ω2
Компромиссный
Распределение
Вероятность
Лапласа
0,785
Лапласа
Su-Джонсона
Лапласа
Su-Джонсона
Su-Джонсона
Лапласа
0,789
0,954
0,633
0,963
0,986
0,798
Таблица 13. Распределение ∆h при длине визирного луча 30 м
Критерий согласия
Отношения
правдоподобия
χ2
Колмогорова
Смирнова
ώ2
Ω2
Компромиссный
Распределение
Вероятность
Коши
0,968
Коши
Su-Джонсона
Лапласа
Su-Джонсона
Su-Джонсона
Лапласа
0,968
0,997
0,779
0,988
0,975
0,804
Таблица 14. Распределение ∆h при длине визирного луча 35 м
Критерий согласия
Отношение
правдоподобия
χ2
Колмогорова
Смирнова
ώ2
Ω2
Компромиссный
Распределение
Вероятность
Коши
0,587
Коши
Su-Джонсона
Su-Джонсона
Su-Джонсона
Su-Джонсона
Коши
0,594
0,968
0,615
0,969
0,968
0,538
Таблица 15. Распределение ∆h при длине визирного луча 40 м
Критерий согласия
Отношение
правдоподобия
χ2
Колмогорова
Смирнова
ώ2
Ω2
Компромиссный
Распределение
Вероятность
Коши
0,852
Коши
Двойное
экспоненциальное
Двойное
экспоненциальное
Двойное
экспоненциальное
Двойное
экспоненциальное
Логистическое
0,851
0,923
0,769
0,992
0,993
0,798
Таблица 16. Распределение ∆h при длине визирного луча 45 м
Критерий согласия
Отношение
правдоподобия
χ2
Колмогорова
Смирнова
ώ2
Ω2
Компромиссный
Распределение
Вероятность
Коши
0,937
Коши
Su-Джонсона
Su-Джонсона
Su-Джонсона
Su-Джонсона
Коши
0,937
0,982
0,698
0,989
0,995
0,767
Таблица 17. Распределение ∆h при длине визирного луча 50 м
Критерий согласия
Распределение
Вероятность
Отношение правдоподобия
Логистическое
0,910
χ2
Колмогорова
Смирнова
ώ2
Ω2
Компромиссный
Логистическое
Нормальное
Su-Джонсона
Su-Джонсона
Su-Джонсона
Логистическое
0,910
0,980
0,781
0,996
0,996
0,906
Компромиссный критерий формируется по совокупности критериев
отношения правдоподобия, χ2 Пирсона, Колмогорова, Смирнова, ω2 и Ω2
Мизеса, при этом первые два критерия имеют вес 0,3, а остальные – по 0,1. Это
связано с тем, что параметрические критерии учитывают количество
оцениваемых параметров распределений и поэтому дают более достоверные
результаты.
Таким образом, следующие законы распределения по ряду критериев с
высокой вероятностью (с высоким достигаемым уровнем значимости)
соответствуют данным наблюдениям: нормальный, двойной экспоненциальный,
Накагами, Коши, Su-Джонсона, логистический, Лапласа. Наиболее подходящими
моделями для описания закона распределения разностей средних превышений в
случае
равноточных
измерений
оказались
распределения
Лапласа,
логистическое, Коши.
Для
описания
наблюденных
разностей
средних
превышений
использовались также усеченные законы распределения. В этих случаях еще в
большей степени прослеживается отличие реального закона от нормального.
Реальному закону распределения разностей средних превышений при
длине визирного луча 15 м плохо соответствует даже усеченное распределение
Коши, которое оказалось наилучшим из множества 26 типов непрерывных
законов распределения (усеченных и неусеченных). Оказалось, что этот закон
хорошо моделируется смесью распределений Коши и Лапласа.
В целом по результатам исследования можно сделать следующие выводы.
1. Реальный закон распределения разностей средних превышений
существенно отличается от нормального и обладает более «тяжелыми хвостами».
Наилучшей моделью оказалось распределение Лапласа.
2. В случае равноточных измерений, сгруппированных по длине визирного
луча, реальные законы распределения еще в большей степени отличаются от
нормального. Отличие также определяется более «тяжелыми хвостами».
Вследствие этого, более предпочтительными распределениями оказались
распределения Лапласа, логистическое, Коши.
3. С учетом того, что область определения таких случайных величин, как
разности средних превышений двойных ходов, ограничены по допускам, более
подходящими моделями становятся усеченные законы распределения
непрерывных случайных величин. В этой ситуации в подавляющем
большинстве случаев для равноточных наблюдений наиболее предпочтительной
моделью оказалось усеченное распределение Коши.
4. Для описания реальных наблюдений достаточно часто наилучшей
моделью оказывается смесь распределений.
2.7. Статистический анализ разностей отметок
Контроль многих эксплуатационных отклонений геометрических
параметров оборудования современных предприятий атомной энергетики
осуществляется геодезическими методами и средствами измерений. Разности
осадок, прогибов конструкции, отклонений по вертикали и т. п. позволяют дать
оценку технического состояния объекта.
Измерения по определению деформации стеновых панелей зданий
турбинных цехов на Ленинградской АЭС выполнялись научными сотрудниками
СГГА [9]. По результатам геодезических наблюдений сделан следующий вывод:
«Положение стеновых панелей на здании 410 в течение пяти циклов
наблюдений остается относительно стабильным и критическим деформациям
не подвергается».
Статистическому анализу были подвергнуты разности отметок 1 и 2-го
циклов наблюдений на панели корпуса 410 по выборке из 1580 разностей ∆Н =
Н2 – Н1 [29]. Количество точечных наблюдений, попавших в соответствующие
интервалы группирования, приведено в табл. 18.
Таблица 18. Группирование данных
№
п/п
1
2
3
4
5
6
7
8
9
10
11
12
13
Левая
граница
–8,5
–7,5
–6,5
–5,5
–4,5
–3,5
–2,5
–1,5
–0,5
0,5
1,5
2,5
3,5
Правая
граница
–7,5
–6,5
–5,5
–4,5
–3,5
–2,5
–1,5
–0,5
0,5
1,5
2,5
3,5
4,5
Количество
0
3
10
42
143
165
205
198
252
222
184
81
49
Частота, %
0,00
0,19
0,63
2,66
9,05
10,44
12,97
12,53
15,95
14,05
11,65
5,13
3,10
14
15
16
17
4,5
5,5
6,5
7,5
5,5
6,5
7,5
8,5
19
4
3
0
1,20
0,25
0,19
0,00
Попытки описания наблюдаемой выборки с использованием одного из
распределений, включенных в программную систему, не дали положительного
эффекта. Существенно увеличивает множество параметрических моделей,
используемых для описания реальных случайных величин, применение
операций над распределениями, в частности, формирование смеси
распределений. Смеси распределений естественно применять в качестве
моделей для описания двухмодальных и многомодальных эмпирических
распределений.
В табл. 19 приведен перечень смесей распределений (с различными
параметрами), с помощью которых достаточно удовлетворительно с точки
зрения компромиссного критерия согласия описываются наблюденные разности
отметок.
Таблица 19. Идентификация распределения ∆Н смесью двух распределений
Смесь распределений
Коши и Коши
Коши и минимального значения
Лапласа и Коши
Коши и максимального значения
Коши и логистическое
Лапласа и Лапласа
Лапласа и минимального значения
Нормальное и минимального значения
Нормальное и Коши
Логистическое и минимального значения
Лапласа и логистическое
Лапласа и нормальное
Лапласа и максимального значения
Логистическое и логистическое
Логистическое и максимального значения
Нормальное и логистическое
Нормальное и максимального значения
Нормальное и нормальное
Вероятность согласия
0,091
0,117
0,140
0,164
0,183
0,193
0,193
0,203
0,207
0,216
0,229
0,261
0,263
0,344
0,366
0,391
0,399
0,438
Последние пять смесей оказались наиболее предпочтительными, их
параметры приведены в табл. 20.
Таблица 20. Параметры пяти наилучших смесей из двух распределений
№
п/п
1
2
3
4
5
1-е
распределение
Логистическое
Логистическое
Логистическое
Нормальное
Нормальное
Масштаб
1,089
1,103
1,026
2,231
2,166
Сдвиг
0,534
0,610
0,778
0,012
0,034
2-е
распределение
Логистическое
Макс. знач.
Нормальное
Макс. знач.
Нормальное
Масштаб
0,709
1,472
1,378
0,974
0,923
Сдвиг
–3,020
–3,150
–2,744
–3,715
–3,514
Три последних варианта распределений из табл. 20 представлены на рис.
15 – 17. Наилучшей оказалась смесь двух нормальных распределений (рис. 17),
которая наиболее хорошо согласуется с наблюдаемой выборкой по всем
критериям согласия.
Рис. 15. Выравнивание наблюдений смесью нормального и логистического
распределений
Рис. 16. Выравнивание наблюдений смесью распределений нормального и
максимальных значений
Рис. 17. Выравнивание наблюдений смесью двух нормальных распределений
Таким образом, данное исследование приводит к выводу о том, что для
описания распределения некоторых случайных величин в геодезии
целесообразно использовать смеси законов.
Выравнивание наблюдений разности отметок смесью двух нормальных
распределений оказалось наилучшим вариантом выбора теоретической кривой.
3. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ ГЕОДЕЗИЧЕСКИХ ДАННЫХ
3.1. Общая характеристика
3.1.1. Нормальный закон распределения
Многие теоретические выводы и практическая обработка геодезической
информации выполняются с учетом предположения о нормальном
распределении результатов геодезических измерений. Нормальный закон, в
частности, используется при установлении допусков на значения ошибок
измерений, невязок геометрических условий, поправок, получаемых в
результате математической обработки, и т. п. В основе этих расчетов лежит
правило «три сигма» (3σ): если случайная величина распределена нормально, то
абсолютная величина ее отклонения от математического ожидания не
превосходит утроенного среднего квадратического отклонения,
Р{|Х - Мх| < 3σх} = 0,997,
поэтому ошибки, превышающие по абсолютной величине значение 3σх,
считаются грубыми.
Нормальный закон представлен в результатах статистического анализа всех
групп геодезических данных: поправок, невязок, разностей средних
превышений высокоточного нивелирования, разностей отметок повторных
наблюдений на АЭС.
Нормальный закон характеризует плотность вероятности
f (x) =
−
1
σ x 2π
(x − M x ) 2
2 σ 2x
⋅e
,
(73)
где Мх и σх – параметры нормального распределения, математическое
ожидание и среднее квадратическое отклонение соответственно.
Некоторые значения плотности вероятности для σх = 1 и Мх = 0 даны в
табл. 21.
Таблица 21. Значения плотности нормального распределения
x
f(x)
x
f(x)
0
0,3989
1,75
0,0863
0,25
0,3867
2,00
0,0540
0,50
0,3521
2,25
0,0317
0,5
0,4
0,3
0,2
0,1
0
-4
-2
0
2
Рис. 18. График плотности
нормального распределения
4
0,75
0,3011
2,50
0,0175
1,00
0,2420
2,75
0,0091
1,25
0,1826
3,00
0,0044
1,50
0,1295
По данным табл. 21 построен график
плотности нормального распределения –
нормальная кривая (рис. 18).
Функция плотности нормального
распределения имеет следующие свойства
[6].
1. Функция плотности определена
на всей оси абсцисс.
х
2. При неограниченном возрастании
(по абсолютной величине) предел
функции равен нулю, ветви нормальной кривой асимптотически приближаются
к оси абсцисс, т. е. ось абсцисс является горизонтальной асимптотой графика.
3. Экстремум функции можно определить с помощью первой
производной
x − M x − ( x − M x ) 2 /( 2σ 2x )
,
e
σ 3x 2π
f ′( x ) = 0 при х = Мх, f ′( x ) > 0 при х < Мх, f ′( x ) < 0 при х > Мх.
f ′( x ) = −
Следовательно, при х = Мх нормальная кривая имеет максимум, равный
1 / (σ х 2 π ) .
4. Нормальная кривая симметрична относительно прямой х = Мх.
5. Точки перегиба определяют с помощью второй производной:
f ′′( x ) = −
1
σх
3
2π
e
−( x − M x )2 /( 2σ х 2 ) 
(x − M x ) 2 
1 −
.
2
σ


х
При х = Мх + σх и х = Мх – σх вторая производная равна нулю, а при
переходе через эти точки она меняет знак. В каждой из этих точек значение
плотности вероятности равно 1 /(σ х 2π e) . Таким образом, точки графика
(M x − σ х , 1/(σ х 2π e))
и
(M x + σ х , 1 /(σ х 2π e))
являются
точками перегиба.
6. Изменение математического ожидания при σх = const не влияет на
форму кривой, а приводит лишь к ее сдвигу вдоль оси абсцисс: вправо, если Мх
возрастает, и влево, если Мх убывает.
7. Так как максимальная ордината кривой нормального распределения
равна 1 /(σ х 2π ) , параметр σх влияет на форму кривой. С увеличением σх
максимальная ордината уменьшается, кривая становится более пологой. При
уменьшении σх максимальная ордината увеличивается, кривая становится
более островершинной и растягивается в положительном направлении оси
ординат.
8. При любых значениях параметров Мх и σх площадь, ограниченная
кривой и осью х, остается равной единице.
Все нечетные центральные моменты нормального распределения равны
нулю
µ2k+1 = 0 (k = 0, 1, 2, 3, …).
Общая формула для момента k-го порядка при любом четном k имеет вид:
µk = σхk(k – 1)!!,
где под символом (k – 1)!! понимается произведение всех нечетных чисел
от 1 до (k – 1).
Асимметрия нормального закона равна нулю:
Sk = µ3/σ3 = 0.
Эксцесс нормального распределения равен нулю:
Е = µ4/σ4 – 3 = 0.
Функция нормального распределения:
F( x ) =
х −
1
( x −M x )2
∫e
σ x 2 π −∞
2σ2x
dx
(74)
или
t −
1
∫e
2π − ∞
F( t ) =
Функцию
t2
2 dt
.
можно
используя
программное
обеспечение, или в таблице по аргументу
Закон нормального распределения может быть задан
вероятностей (табл. 1 приложения):
интегралом
F(t)
найти
(75)
численно,
t=
t −
1
∫e
2π − t
Ф( t ) =
x − Mx
σ x (табл. IX, [25]).
t2
2 dt.
(76)
3.1.2. Закон распределения Лапласа
По результатам исследования геодезических данных, наряду с
нормальным распределением, закон Лапласа встречается достаточно часто. Ему
подчиняются, в частности, разности средних превышений при некоторых
длинах визирного луча; закон Лапласа – составляющий смеси распределений
разностей отметок повторных наблюдений за осадками [28], [29], [18].
Это двухпараметрический закон L(a, λ), x∈(-∞,∞) [7].
а – параметр сдвига, |а| < ∞.
λ – масштабный параметр, λ > 0.
а = Мх – математическое ожидание.
λ = σх / 2 ; σх – среднее квадратическое отклонение.
Асимметрия Sk = 0, эксцесс Е = 3.
Плотность распределения Лапласа имеет вид:
f (x) =
 x−a 
1
exp−
.
2λ
λ


(77)
Приведем значения плотностей распределения Лапласа при а = 0 и λ = 1
(табл. 22).
Таблица 22. Плотность распределения Лапласа (а = 0, λ = 1)
х
f(x)
x
f(x)
0
0,500
2,25
0,053
0,25
0,389
2,50
0,041
0,50
0,303
2,75
0,032
0,75
0,236
3,00
0,025
1,00
0,184
3,25
0,019
1,25
0,143
3,50
0,015
1,50
0,112
3,75
0,012
1,75
0,087
4,00
0,009
По этим данным строим кривую распределения Лапласа (рис. 19).
2,00
0,068
Функция плотности закона распределения Лапласа обладает следующими
свойствами.
0,6
Плотность вероятности f(x) определена
0,5
на
всей
оси
х.
Аргумент
0,4
х∈(-∞, ∞); параметр сдвига |а| < ∞;
0,3
0,2
масштабный параметр λ > 0.
0,1
Предел функции при неограниченном
0
возрастании х по абсолютной величине
-4
-2
0
2
4
равен нулю, т.е. ось Ох служит
горизонтальной асимптотой графика.
Рис. 19. График плотности закона
Кривая симметрична относительно
Лапласа
ординаты, проходящей через точку х = а =
Мх.
При х > а и х < а f(x) < f(a). В точке а непрерывная функция (77) имеет
максимум f(a) = 1/(2λ).
Изменение математического ожидания не влияет на форму кривой, которая
зависит только от параметра λ = σх/ 2 .
Функция распределения Лапласа имеет вид:
1 − а − х
 е λ
при − ∞ < х < а
2

х −а
 1 −
1− е λ при а < х < ∞
F(x) =  2
.
(78)
Некоторые значения функции F(x) помещены в табл. 23.
Таблица 23. Функция распределения Лапласа
х
F(x)
х
F(x)
0
0,5
1
0,816
-1
0,184
а = 0, λ = 1
2
0,932
-2
0,068
2,5
0,959
-2,5
0,041
3
0,975
-3
0,025
4
0,991
-4
0,009
3.1.3. Логистический закон распределения
Логистическое распределение имело место при анализе поправок v и δх,
разностей средних превышений и разностей повторных наблюдений за
деформациями.
Закон двухпараметрический Λ(а, λ).
а – параметр сдвига, а∈(-∞, ∞); λ – масштабный параметр, λ∈(0, ∞).
а = Мх – математическое ожидание;
λ = σ х 3 /π ≈ 0,551σх.
Асимметрия Sk = 0, эксцесс Е ≈ 1,2.
Плотность логистического распределения имеет вид:
ez
f (x) =
λ(1 + e z ) 2
x −a
где z =
.
λ
=
e −z
λ (1 + e −z ) 2
,
(79)
Значения плотности логистического распределения для а = 0, λ = 1
представлены в табл. 24.
Таблица 24. Плотность логистического распределения
x
f(x)
x
f(x)
0
0,250
2,00
0,105
0,25
0,246
2,25
0,086
0,50
0,235
2,50
0,070
0,75
0,218
2,75
0,056
1,00
0,197
3,00
0,045
1,25
0,173
3,25
0,036
1,50
0,149
3,50
0,028
1,75
0,126
Кривая логистического распределения изображена на рис. 20.
Отметим свойства плотности логистического распределения, общие с
нормальным законом.
Плотность вероятности f(x) определена на всей оси х. Аргумент х∈(-∞, ∞);
параметр сдвига |а| < ∞; масштабный
0,3
параметр λ > 0.
0,25
Предел функции при неограниченном
0,2
возрастании х по абсолютной величине
0,15
равен нулю, т. е. ось Ох служит
0,1
0,05
горизонтальной асимптотой графика.
0
Кривая
симметрична относительно
-4
-2
0
2
4
ординаты, проходящей через точку х = Мх
= а.
Рис. 20. График плотности
логистического распределения
f (x) =
ez
λ (1 + e z )
;
2
Логистический закон распределения с
плотностью вероятности
z=
x−a
λ
имеет следующие свойства, отличные от свойств функции плотности
нормального закона распределения.
f ′( x ) =
ez
(1 − e z )
⋅
λ 2 (1 + e z ) 3
(80)
– первая производная плотности вероятности.
При х = а f′(x) = 0; при х < а f′(x) > 0; при х > а f′(x) < 0. При х = а функция
(79) имеет максимум f(a) = 1/(4λ).
e Z (1 − 4e z + e 2 z )
f ′′( x ) = 3 ⋅
λ
(1 + e z ) 4
– вторая производная плотности вероятности.
(81)
В точках х1 = а – 1,317λ и х2 = а + 1,317λ вторая производная равна нулю, а
при переходе через эти точки она меняет знак. В обеих точках значение
функции равно 0,167/λ.
Таким образом, точки графика (а – 1,317λ; 0,167/λ) и (а + 1,317λ; 0,167/λ)
являются точками перегиба.
Форма кривой зависит от параметра λ = σ х 3 / π . Математическое
ожидание Мх = а определяет положение кривой на оси абсцисс.
Функция логистического распределения имеет вид:
F( x ) =
1
1 + e −z .
(82)
Некоторые значения функции логистического распределения приведены в
табл. 25.
Таблица 25. Значения функции логистического распределения
а = 0; λ = 1
х
F(x)
F(- x)
0
0,5
1
0,731
0,269
2
0,881
0,119
2,5
0,924
0,076
3
0,953
0,047
3,5
0,971
0,029
3.1.4. Закон распределения Коши
Закон Коши представлен почти во всех вариантах исследования
геодезических данных: поправок, разностей превышений и отметок.
Закон двухпараметрический К(а, λ); а – параметр сдвига; а∈(-∞, ∞).
λ – параметр масштаба; λ∈(0, ∞); х∈(-∞, ∞).
Математическое ожидание Мх не существует, а – медиана, мода.
Дисперсии σ2х не существует, расходится.
Асимметрии не существует, эксцесса не существует.
Моменты порядка k ≥1 не существуют.
Плотность распределения Коши имеет вид:
[
1
λ
⋅ 2
= π λ (1+ z 2 )
2
π λ + (x − a)
x −a
где z =
.
λ
f (x) =
]
−1
,
(83)
Ряд значений плотности f(x) при а = 0 и λ = 1 представлен в табл. 26,
кривая распределения Коши изображена на рис. 21.
Таблица 26. Плотность распределения Коши
x
f(x)
x
f(x)
0
0,3183
1,75
0,0784
0,25
0,2996
2,00
0,0637
0,50
0,2546
2,25
0,0525
0,75
0,2037
2,50
0,0439
1,00
0,1592
2,75
0,0372
1,25
0,1242
3,00
0,0318
1,50
0,0979
3,50
0,0240
Первые два свойства функции
плотности нормального закона и закона
Коши совпадают.
Функция плотности распределения
Коши симметрична относительно прямой х
= а.
Максимум функции f(x) определим с
помощью первой производной:
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
-4
-2
0
2
4
f ′( x ) =
Рис. 21. График плотности
распределения Коши

λ 
2( x − a )
⋅ − 2

π  (λ + ( x − a ) 2 ) 2 
.
(84)
При х = а f′(x) = 0; при х < а f′(x) > 0;
при х > а f′(x) < 0. В точке а функция (83)
имеет максимум f(a) = 1/(πλ).
2λ  λ2 − 3( x − a ) 2

f ′′( x ) =  −  ⋅ 2
 π  (λ + ( x − a ) 2 ) 3
(85)
− вторая производная функции (83).
В точках х1 = а – λ/ 3 и х2 = а + λ / 3 вторая производная равна нулю.
3 1
⋅
4
πλ . При переходе через эти
Значение функции (83) в этих точках f(x) =
точки
производная
меняет
знак.
Следовательно,
точки
графика

λ 3 1  
λ 3 1 
; ⋅   а +
; ⋅
 а −

4
π
λ
4
π
λ
3
3

и
 являются точками перегиба.
Форма кривой зависит от параметра λ.
Изменение параметра а при λ = const приводит к сдвигу кривой вдоль оси
абсцисс.
Функция распределения закона Коши имеет вид:
F( x ) =
1 1
x −a
+ ⋅ arctg

2 π
 λ .
(86)
Значения функции распределения представлены в табл. 27.
Таблица 27. Функция распределения Коши
x
F(x)
F(-x)
0
0,5
1
0,750
0,250
2
0,852
0,148
а = 0; λ = 1
3
4
0,898
0,922
0,102
0,078
10
0,968
0,032
20
0,984
0,016
70
0,995
0,005
100
0,997
0,003
3.1.5. Закон распределения максимальных значений
Закон максимальных значений оказался наиболее подходящим для
поправок v моделей № 2 и 3 нивелирных сетей (см. табл. 6).
Закон распределения экстремальных значений I типа – максимальных
значений, двухпараметрический ДРI(а, λ).
|а| < ∞; λ > 0; х∈(-∞, ∞).
а – параметр сдвига, λ – масштабный параметр.
а = Мх – λс, с = 0,5772 – постоянная Эйлера.
λ = σ х 6 / π ≈ 0,780 σ x .
Асимметрия Sk ≈ 1,14; эксцесс Е ≈ 2,4.
Плотность распределения максимальных значений имеет вид:
f (x ) =
1
exp{− z − exp( − z)};
λ
z=
x−a
.
λ
(87)
Вычислим значения f(x) при а = 0 и λ = 1 (табл. 28) и построим график
плотности распределения (рис. 22).
Таблица 28. Плотность закона максимальных значений
х
f(x)
x
f(x)
x
f(x)
x
f(x)
0
0,3679
-1,75
0,0182
0
0,3679
1,75
0,1461
-0,25
0,3556
-2,00
0,0046
0,25
0,3574
2,00
0,1182
-0,50
0,3171
-2,25
0,0007
0,50
0,3307
2,25
0,0949
-2
-1,00
0,1794
-1,25
0,1064
-1,50
0,0507
1,00
0,2546
2,75
0,0600
1,25
0,2151
3,00
0,0474
1,50
0,1785
Первое, второе и восьмое свойства
функции плотности нормального закона и
закона
максимальных
значений
совпадают.
Определим максимум функции (87) с
помощью первой производной:
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
-4
-0,75
0,2549
-2,50
0,0000
0,75
0,2945
2,50
0,0756
f ′( x ) = −
0
2
4
1
λ2
⋅ e {−z −e
−z
}+
1
λ2
⋅ e {−2 z −e
−z
(88)
При х = а f′(x) = 0; при х < а f′(x) > 0;
Рис. 22. График плотности закона
при х > а f′(x) < 0. В точке
максимальных значений
х = а функция (87) имеет максимум f(a) =
1/(λe).
Найдем точки перегиба функции (87) с помощью второй производной:
f ′′( x ) =
1
λ3
⋅ e {−z −e
−z
.
} ⋅ {1 − 3e −z + e −2z }
.
(89)
В точках х1 = а – 0,962λ и х2 = а + 0,962λ вторая производная равна нулю, а
при переходе через эти точки она меняет знак. В точке х1 значение функции
равно 0,191/λ, в точке х2 значение функции равно 0,261/λ.
Точки графика
}
0,191 
0,261 


 a − 0,962λ ;

 a + 0,962λ ;

λ  и 
λ 

являются точками перегиба.
Кривая несимметрична.
Форма кривой зависит только от параметра λ. Изменение параметра а при λ
= const приводит к сдвигу кривой вдоль оси абсцисс.
Функция закона распределения максимальных значений
F(x) = exp(–e-z); z = (x – a)/λ.
(90)
Для а = 0; λ = 1; хi = 0; 1; 2; 3; -1; -2; -3 F(x) принимает значения 0,3679;
0,6922; 0,8734; 0,9514; 0,0660; 0,0006; 0,0000 соответственно.
3.1.6. Закон распределения минимальных значений
Закону распределения минимальных значений подчинялись поправки δх и
v (см. табл. 6 и 7). Этот закон имел место также в смесях распределений
разностей повторных наблюдений за осадками.
Это двухпараметрический закон распределения ДРII(а, λ).
х∈(-∞, ∞).
Параметр сдвига а = Мх + 0,5772λ; |а| < ∞.
Параметр масштаба λ∈(0, ∞).
λ = σ х 6 / π ≈ 0,780 σ x .
Асимметрия Sk ≈ –1,14; эксцесс Е ≈ 2,4.
Плотность распределения закона минимальных значений:
f(x) = (1/λ) exp(z – ez); z = (x – a)/λ.
(91)
Значения f(x) для а = 0 и λ = 1 представлены в табл. 29, график плотности –
на рис. 23.
Таблица 29. Плотность распределения минимальных значений
x
f(x)
x
f(x)
x
f(x)
x
f(x)
-3,00
0,0474
-1,50
0,1785
0,00
0,3679
1,50
0,0507
-2,75
0,0600
-1,25
0,2151
0,25
0,3556
1,75
0,0182
-2,50
0,0756
-1,00
0,2546
0,50
0,3170
2,00
0,0046
-2,25
0,0949
-0,75
0,2945
0,75
0,2549
3,00
0,0000
-2,00
0,1182
-0,50
0,3307
1,00
0,1794
-1,75
0,1461
-0,25
0,3574
1,25
0,1064
Первое, второе и восьмое свойства функции плотности нормального закона
и
закона минимальных значений
0,4
совпадают.
0,35
Определим максимум функции (91).
0,3
0,25
0,2
0,15
0,1
0,05
0
-4
-2
f ′( x ) =
0
2
4
Рис. 23. График плотности закона
минимальных значений
1
λ2
⋅ e {z −e } −
z
1
λ2
⋅ e {2 z −e }(92)
z
− первая производная.
При х = а f′(x) = 0; при x < a f′(x) > 0;
при x > a f′(x) < 0. В точке х = а функция (91) имеет максимум, f(a) = 1/(λe).
Найдем точки перегиба функции (91) с помощью второй производной:
f ′′( x ) =
1
λ
3
⋅ e {z −e } ⋅ 1 − 3e z + e 2 z
{
z
}
.
(93)
В точках х1 = а – 0,962λ и х2 = а + 0,962λ вторая производная равна нулю, а
при переходе через эти точки она меняет знак. В точке х1 значение функции
равно 0,261/λ, а в точке х2 значение функции равно 0,191/λ.
0,261 

 а − 0,962λ ;

λ

 и
Точки графика
0,191 

 а + 0,962λ ;

λ  являются

точками перегиба.
Кривая несимметрична.
Форма кривой зависит только от параметра λ. Изменение параметра а при λ
= const приводит к сдвигу кривой вдоль оси абсцисс.
Функция распределения:
F(x) = 1 – exp(-ez).
(94)
Для а = 0; λ = 1 и х = -4,00; -3,00; -2,00; -1,00; 0; 1,00; 2,00 функция
распределения F(x) принимает значения 0,0181; 0,0486; 0,1266; 0,3078; 0,6321;
0,9340; 0,9994 соответственно.
3.1.7. Другие законы распределения
В распределениях разностей средних превышений встречаются законы, не
получившие приоритета согласно компромиссному критерию. К ним относятся
двусторонний экспоненциальный и Su-Джонсона. Ограничимся их краткой
характеристикой.
Закон двусторонний экспоненциальный трехпараметрический [11].
ДЭ(а, λ, α); |а| < ∞; λ > 0; α > 0; х ∈ (- ∞,∞).
Математическое ожидание Мх = а.
Дисперсия Д х = λ ⋅
2
Г(3 / α)
.
Г(1/ α)
Асимметрия Sk = 0.
Эксцесс Е =
Г(1 / α) ⋅ Г(5 / α)
[Г(3 / α)]
Плотность распределения
2
− 3.
α
 х −а 
α
f (x) =
⋅ ехр−
 .
2λ Г(1/ α)
 λ 
(95)
Для а = 0; λ = 1; α = 1; и х = 0; 1; 2; 3,
f(x) = 0,5; 0,184; 0,068; 0,025 соответственно.
Закон распределения Su-Джонсона четырехпараметрический [7].
Su(a, λ; α, β); x∈(-∞, ∞); |a| < ∞; λ > 0; |α| < ∞; β > 0.
Математическое ожидание Мх = а – λωsh(ν);
ω = exp(1/2β2); ν = α/β.
Дисперсия Дх = λ2(ω2 – 1) [ω2ch(2ν) + 1].
Плотность распределения закона Su-Джонсона:
f(x) =
 
1 2  


 
 x − a   x − a  2  2  
β
1
 1
=
exp − α + β ln 
 + 1  .
 + 

2π ( x − a ) 2 + λ2
2
λ



λ


  
 


 
 
(96)
Значения плотности вероятности приведены в табл. 30.
Таблица 30. Плотность распределения Su-Джонсона
а = 0; λ = 1; α = 0; β = 0,5
x
0
1
f(x)
0,199
0,091
2
0,043
3
0,025
-1
0,219
-2
0,128
-3
0,099
-4
0,081
Различное сочетание значений параметров создает семейство кривых
распределения Su-Джонсона.
Таким образом, утверждение о том, что «почти все случайные величины, с
которыми приходится иметь дело в геодезии, подчиняются нормальному закону
распределения вероятностей», не подтверждается на практике. Геодезические
данные подчиняются не только нормальному закону, но и другим, близким к
нормальному, законам распределения. Предпочтение, отдаваемое нормальному
закону, определяется тем обстоятельством, что нормальный закон
распределения является очень удобной математической моделью.
3.2. Доверительные границы и вероятности некоторых законов
распределения
Сравним вероятности попадания в интервалы допустимых значений
случайной величины Х (СВ Х) ряда законов распределения геодезических
данных с соответствующими значениями вероятностей нормального
распределения [17].
Вероятность попадания случайной величины в заданный интервал
определяем по формуле
P(α < Χ < β) = F(β) – F(α).
(97)
Вычислим эти вероятности для закона распределения Лапласа. Числовые
характеристики закона Лапласа – математическое ожидание Мх = а; среднее
квадратическое отклонение σ = 1,414λ.
Принимая а = 0, для заданных границ интервалов ±σ ; ±2σ; ±2,5σ; ±3σ,
вычисляем значения функции распределения (78) и вероятностей (97) (табл. 31).
Таблица 31. Вероятности закона распределения Лапласа
х
z = |x|/λ
F(x)
F(-x)
P(α < Χ < β)
±σ
±2σ
1,414
0,8784
0,1216
0,7568
2,828
0,9704
0,0296
0,9408
±2,5σ
3,535
0,9854
0,0146
0,9708
±3σ
4,243
0,9928
0,0072
0,9856
Соответствующие вероятности для нормального закона распределения
вычислены по формулам:
Р(α < Х < β) = F(tβ) – F(tα);
tβ = (β – Mx)/σ; tα = (α – Mx)/σ; F(-t) = 1 – F(t)
− и помещены в табл. 32.
Таблица 32. Вероятности нормального распределения
x
z
F(x)
F(-x)
P(α < Χ < β)
±σ
±1
0,8413
0,1587
0,6826
±2σ
±2
0,9772
0,0228
0,9544
±2,5σ
±2,5
0,9938
0,0062
0,9876
±3σ
±3
0,9986
0,0014
0,9972
Дополним данные табл. 31 и 32 значениями вероятностей попадания СВ Х
в интервалы (0, σ), (σ, 2σ), (2σ, 2,5σ), (2,5σ, 3σ). Для закона распределения
Лапласа:
Р(0 < Χ < σ) = 0,878 – 0,500 = 0,378;
Р(σ < Х < 2σ) = 0,092;
Р(2σ < Х < 2,5σ) = 0,015; Р(2,5σ < Х < 3σ) = 0,008.
Для нормального закона распределения:
Р(0 < Х < σ) = 0,341;
Р(σ < Х < 2σ) = 0,136;
Р(2σ < Х < 2,5σ) = 0,017; Р(2,5σ < Х < 3σ) = 0,005.
Наибольшее расхождение функций распределения законов нормального и
Лапласа имеет место на границах ±σ: F(x)нормальное – F(x)Лапласа= –0,037.
Наибольшее расхождение вероятностей попадания в интервал СВ Х – для
границ ±σ (-0,073) и (σ, 2σ), равное 0,044.
Рассмотрим обратную задачу. Какому симметричному доверительному
интервалу для закона распределения Лапласа принадлежат вероятности 0,954,
0,998, 0,997 ? Именно этим вероятностям соответствуют аргументы t = 2,0; t =
2,5 и t = 3,0 в формулах допустимых значений поправок (27), невязок (28) и др.
в предположении о нормальном распределении ошибок геодезических
измерений.
Для закона Лапласа
0,955 = Р(-2,2σ < Х < 2,2σ); 0,988 = Р(-3,1σ < Х < 3,1σ);
0,997 = Р(-4,1σ < Х < 4,1σ).
То есть, если для нормального закона СВ Х попадает в интервал ± 3σ с
вероятностью 0,997, то для закона Лапласа СВ Х с той же вероятностью
попадет в интервал ± 4,1σ .
Математическое ожидание случайной ошибки измерения равно нулю, Мх =
а = 0. Вычислим вероятность попадания случайной ошибки измерения в
симметричный интервал ±4σ через функцию распределения Лапласа (78):
Р(- 4σ < X < 4σ) = F(4σ) – F(- 4σ) = 0,9983 – 0,0017 = 0,9966.
Таким образом, для закона Лапласа случайная ошибка измерения с
вероятностью 0,997 попадет в интервал ±4σ.
Р{|X| < 4σ} = 0,997. Значит, для распределения Лапласа возможен допуск
±4σ.
Если
случайная
величина
подчинена
логистическому
закону
распределения, математическое ожидание Мх = а. Примем а = 0. Среднее
квадратическое отклонение σ = 1,8138λ. По формулам (82) и (97) вычислим
вероятности попадания СВ Х в доверительные интервалы допусков (табл. 33).
Как и в случае распределения Лапласа, значения вероятностей
логистического закона превосходят нормальные на интервале ±σ, а на
остальных интервалах меньше соответствующих значений нормального закона
распределения. По своей величине вероятности попадания СВ Х в любой из
интервалов для логистического закона распределения равны средним
соответствующих значений вероятностей законов Лапласа и нормального.
Таблица 33. Вероятности логистического распределения
X
z = x/λ
F(x)
F(-x)
P(α < Χ < β)
±σ
±1,8138
0,8598
0,1402
0,7196
±2σ
±3,628
0,9741
0,0259
0,9482
±2,5σ
±4,534
0,9894
0,0106
0,9788
±3σ
±5,441
0,9957
0,0043
0,9914
Обратная задача дает следующие результаты решения:
0,954 = Р(-2,07σ < Х < 2,07σ);
0,988 = Р(-2,8 σ < Х < 2,8 σ);
0,977 = Р(-3,6 σ < Χ < 3,6 σ).
Максимально возможный допуск для логистического распределения ±3,6σ.
Сделаем аналогичные расчеты для закона распределения максимальных
значений с математическим ожиданием Мх = а + λс и средним квадратическим
отклонением σ = 1,2825λ.
Примем Мх = 0, тогда а = –λс = –0,5772λ; σ = 1,2825λ; λ = 0,7797σ; а = –
0,4500σ.
F(x) = exp(-e-z); z = (x – a)/λ
− функция распределения закона максимальных значений.
Вероятности попадания СВ Х в заданные интервалы вычислены по
формуле (97) в табл. 34.
Таблица 34. Вероятности закона максимальных значений
х
z
±2σ
±σ
1,860
-0,705
0,856
0,132
0,724
F(x)
F(-x)
P(α < Χ < β)
3,141
-1,990
0,958
0,001
0,957
±2,5σ
3,782
-2,629
0,978
0
0,978
±3σ
4,423
-3,270
0,988
0
0,988
На интервале ±σ вероятность попадания близка закону логистического
распределения (0,724 и 0,720 соответственно). Вероятность попадания в
интервал ±2σ близка нормальному закону (0,957 и 0,954). В границах ±2,5σ и ±3σ
законы Лапласа и логистический по вероятности попадания в интервал близки
закону максимальных значений.
Р(0 < Х < σ) = 0,286; Р(σ < Х < 2σ) = 0,102;
Р(2σ < Х < 3σ) = 0,030;
Р(-σ < Х < 0) = 0,438; Р(-2σ < Х < -σ) = 0,131;
Р(-3σ < Х < -2σ) = 0,001.
Для заданных доверительных вероятностей получены следующие границы,
симметричные относительно а:
0,954 = Р(-1,95σ < Х < 1,95σ);
0,988 = Р(-3,0 σ < Х < 3,0 σ);
0,997 = Р(-4,0 σ < Х < 4,0 σ).
Таким образом, возможный допуск для закона максимальных значений
±4σ.
Для закона распределения экстремальных значений II типа (минимальных
значений) параметры связаны следующими закономерностями.
Математическое ожидание Мх = а – 0,5772λ. При Мх = 0;
а = 0,5772λ. Среднее квадратическое отклонение σ = 1,2825λ;
λ = 0,7797σ; а = 0,4500σ.
Вычислим вероятности попадания СВ Х в заданные интервалы (97) (табл.
35).
Таблица 35. Вероятности закона минимальных значений
х
z
F(x)
F(-x)
P(α < Χ < β)
±σ
0,705
-1,859
0,868
0,144
0,724
±2σ
1,987
-3,142
0,999
0,042
0,957
±2,5σ
2,628
-3,782
1,000
0,022
0,978
±3σ
3,269
-4,420
1,000
0,012
0,988
Значения вероятностей совпадают с соответствующими величинами закона
максимальных значений. На интервале ±σ близки значениям логистического
распределения. На интервале ±2σ близки значениям нормального
распределения. На интервале ±3σ близки закону распределения Лапласа.
Р(0 < Х < σ) = 0,298; Р(σ < Х < 2σ) = 0,131;
Р(2σ < Х < 3σ) = 0,001.
Р(-σ < Х < 0) = 0,426; Р(-2σ < Х < - σ) = 0,102;
Р(-3σ < Х < -2σ) = 0,030.
Принятым доверительным вероятностям соответствуют следующие
границы интервалов, симметричные относительно а:
0,954 = Р(-1,95σ < Х < 1,95σ); 0,988 = Р(-3,0σ < Х < 3,0σ);
0,997 = Р(-4,0σ < Х < 4,0σ).
Таким образом, возможный допуск для закона минимальных значений ±4σ.
Установим степень близости распределений Лапласа, логистического,
максимальных, минимальных значений и нормального, используя меру
близости Колмогорова – Смирнова для непрерывных распределений:
ρ(F1,F2) = max|F1(x) – F2(x)|.
(98)
Абсолютные значения разностей функций распределения приводятся в
табл. 36.
Таблица 36. Разности функций распределения
σ
2σ
3σ
Нормальный Лапласа
Логистический
Макс. значение
Мин. значение
Лапласа
Логистический
Макс. значение
Мин. значение
Логистически Макс. значение
йМин. значение
0,037
0,019
0,015
0,027
0,018
0,022
0,010
0,004
0,008
0,007
0,003
0,019
0,022
0,004
0,012
0,029
0,016
0,025
0,006
0,003
0,011
0,001
0,003
0,005
0,007
0,008
0,004
Макс.
значение
0,012
0,041
0,012
Границы
Законы
Мин. значение
Максимальные значения разностей функций распределения приведены в
табл. 37.
Таблица 37. max |F1(x) – F2(x)|
Распределение
Нормальное
Лапласа
Логистическое
Макс. значение
Лапласа
0,037
Логистическое
0,019
0,019
Макс. знач.
0,027
0,029
0,025
Мин. знач.
0,027
0,029
0,025
0,041
Максимально уклоняется от нормального закона распределение Лапласа
|∆F| мах = 0,037. Наибольшее расхождение в других парах распределений дала
разность функций максимального и минимального значений (0,041).
Логистическое распределение занимает среднее положение между
распределениями нормальным и Лапласа. Для функций распределений
максимального и минимального значений уклонения |∆F| от остальных законов
одинаковы.
Сводка вероятностей попадания СВ Х в заданные интервалы представлена
в табл. 38.
Таблица 38. Вероятности попадания СВ Х в интервалы
Закон
Интервал
±σ
±2σ
±2,5σ
±3σ
Нормальный Лапласа
Логистический Макс.
значение
Мин.
значение
0,683
0,954
0,988
0,997
0,720
0,948
0,979
0,991
0,724
0,957
0,978
0,988
0,757
0,941
0,971
0,986
0,724
0,957
0,978
0,988
По данным табл. 38, наибольшие расхождения составили распределения
нормальное и Лапласа на интервале ±σ (0,074). Вероятность для логистического
распределения равна среднему из вероятностей нормального и Лапласа.
Вероятности максимального и минимального значений совпадают и на
интервале ±σ близки логистическому, ±2σ – нормальному, ±2,5σ и ±3σ –
Лапласа и логистическому.
Асимметрия кривых максимального и минимального распределений
приводит к наиболее значительным уклонениям от вероятностей нормального
закона на интервалах (-σ, 0) и (0, σ); (-σ, -σ), (σ, 2σ).
Результаты вычисления доверительных интервалов для заданных
вероятностей помещены в табл. 39.
Таблица 39. Доверительные интервалы для заданных вероятностей
Вероятность
Закон
Нормальный
Лапласа
Логистический
Мин. и макс. значений
0,954
±2σ
±2,2σ
±2,07σ
±1,95σ
0,988
0,997
±2,5σ
±3,1σ
±2,8σ
±3,0σ
±3,0σ
±4,1σ
±3,6σ
±4,0σ
По данным табл. 39, допуски ±2,5σ и ±3σ, соответствующие
доверительным вероятностям 0,988 и 0,997 в случае нормального
распределения геодезических данных, для распределений Лапласа,
логистического, максимальных и минимальных значений являются
заниженными и вследствие этого могут быть экономически нецелесообразны.
Общие выводы таковы:
1. Нормальный закон распределения не является единственным законом
распределения геодезических данных – ошибок измерений и их линейных
функций. Случайные величины в геодезии подчиняются, наряду с нормальным,
законам распределения Лапласа, логистическому, максимальных значений,
минимальных значений, Коши и некоторым другим.
2. Сравнительный анализ пяти законов показывает, что в большей степени
уклоняется от нормального распределение Лапласа. Максимальное уклонение
функции распределения имеет место для аргументов +σ и -σ. Наибольшее
уклонение вероятностей попадания в интервал ±σ.
3. Асимметрия кривых максимального и минимального значений
объясняет наиболее значительные расхождения с нормальным вероятностей
попадания СВ Х в интервалы (0, σ), (σ, 2σ), (-σ, 0), (-2σ, -σ).
4. Установлено, что границы доверительных интервалов допусков для
распределений Лапласа, логистического, максимальных и минимальных
значений шире, чем при нормальном распределении. Верхняя граница
допустимых значений в этих случаях ±4σ, ±3,6σ, ±4σ, ±4σ соответственно.
5. Доверительным вероятностям 0,988 и 0,997 соответствуют следующие
границы интервалов:
− для нормального распределения: ±2,5σ, ±3σ;
− для распределения Лапласа: ±3,1σ, ±4,1σ;
− для логистического распределения: ±2,8σ, ±3,6σ;
− для законов максимальных и минимальных значений: ±3σ, ±4σ.
Допуски нормального закона в этих случаях занижены и вследствие этого
могут быть экономически нецелесообразны.
3.3. Нормальный закон распределения в оценке качества геодезических
измерений
Изучение законов распределения ошибок геодезических измерений и их
функций связано с оценкой качества измерений, обоснованием оптимальности
применения МНК для их математической обработки.
Считают, что случайные ошибки измерений подчиняются закону
нормального распределения. Будет ли справедливо обратное утверждение: если
ошибки, поправки или другие геодезические данные подчиняются закону
нормального распределения, значит ли это, что они носят случайный характер
(случайная составляющая в них превалирует над другими ошибками)? Для
обоснованного ответа на этот вопрос используем известные положения теории
вероятностей, а также результаты статистического анализа геодезических данных
[19], [31].
Пусть некоторая величина Х включает случайную (нормальную) и
постоянную систематическую составляющие,
хi = ∆i + δ
– i-я реализация этой случайной величины, где
∆i – случайная составляющая,
δ – постоянная систематическая ошибка.
Нормальный закон распределения двухпараметрический. Параметр М(Х) –
математическое ожидание – не влияет на форму кривой. Оценкой
математического ожидания при равноточных измерениях является среднее
арифметическое
М (Х) = х =
[х ] .
(99)
n
Наличие постоянной систематической ошибки приводит к смещению
математического ожидания
М (Х) =
[∆ + δ] = [∆] + nδ = ∆ + δ .
n
n
n
(100)
Форма нормальной кривой зависит от значения другого параметра –
среднего квадратического отклонения σх. На оценку среднего квадратического
отклонения и, следовательно, на форму нормальной кривой систематическая
ошибка постоянного характера не влияет
n
∑ (xi − x)
i =1
σх =
n −1
n
=
∑ (∆ i − ∆ )
i =1
n −1
n
∑ ( ∆ i + δ − ∆ − δ)
2
i =1
=
2
=
n −1
(101)
2
= σ∆ .
Оценка среднего квадратического отклонения при наличии постоянной
ошибки совпадает с оценкой случайного ряда ошибок и соответствующих им
поправок. Статистический анализ не обнаружил влияния постоянной ошибки на
закон распределения поправок МНК.
О наличии в результатах измерений постоянной систематической ошибки
можно судить по смещенной оценке математического ожидания (100).
Оценка точности геодезических измерений по формуле Гаусса также
позволяет установить присутствие систематической ошибки
n
m=
2
[x ]
=
n
2
∑ (∆ i
i =1
+ 2∆ i δ + δ )
n
2
n
=
∑ ∆i
2
i =1
n
+ δ2
(102)
– средняя квадратическая ошибка учитывает влияние и случайной, и
систематической составляющей. (Использование этого результата в
статистическом анализе позволило бы выявить уклонение эмпирического
закона распределения от нормального.)
Постоянная систематическая ошибка влияет и на результаты оценки
точности геодезической сети по материалам уравнивания, ошибка единицы веса
возрастает по сравнению с заданной (для модели) или предполагаемой.
О наличии грубых ошибок измерений или ошибок исходных данных
можно судить по результатам статистического анализа поправок (табл. 40).
Таблица 40. Влияние грубых ошибок в нивелирной сети № 1
Ошибки и поправки
Характеристика
МО
σ
Закон
Случайные,
Ошибка ∆
0,005
σ∆ = 1,0 см
1,0
Нормальный
Поправка v
-0,038
0,79
∆гр = 8, 18, 8 см
∆, ∆гр
0,545
2,2
Не соответствует
нормальному
v
-0,948
2,1
После внесения в результаты измерений нивелирной сети № 1 трех грубых
ошибок, оценки математического ожидания ошибок и поправок сместились,
более чем в два раза увеличились оценки среднего квадратического отклонения.
Изменился закон распределения (результаты проверки гипотезы о согласии
плохие).
В сетях № 2 и 3 внесено только по одной грубой ошибке, равной 10 см.
Имело место резкое изменение оценок параметров. Согласие закона
распределения ошибок с нормальным слабое, Р(χ2 > χэ2) = 0,001. Однако, закон
распределения поправок по совокупности критериев согласия можно считать
нормальным. Достигнутые уровни значимости критериев по сети № 2
составили: 0,03 для критерия отношения правдоподобия; 0,01 – Пирсона χ2;
0,11 – Колмогорова; 0,47 – Смирнова; 0,26 – омега малое квадрат ω2; 0,29 –
омега большое квадрат Ω2.
Действие ошибок исходных данных на невязки геометрических условий
аналогично грубым ошибкам измерений. Искажение отметки одного из
исходных пунктов сети № 1 ошибкой ∆исх = 3 см, (3 m) не изменило
существенно оценок параметров распределения поправок, согласие закона
распределения поправок с нормальным несколько ухудшилось, но осталось в
допуске, Р(χ2 > χэ2) = 0,15.
Группирование данных при их статистическом анализе обеспечивает
получение робастных оценок параметров, устойчивых к наличию и влиянию
единичных грубых ошибок. Это, однако, не означает отсутствие подобного
влияния на результаты уравнивания – близлежащие, коррелированные элементы
сети получат искаженные поправки. Ошибка единицы веса по результатам
уравнивания также будет завышена.
Таким образом, нормальный закон распределения ошибок и поправок
подтверждает высокое качество измерений в геодезической сети, но не
гарантирует полное отсутствие в ней систематических влияний.
О наличии систематических влияний можно дополнительно судить по
смещенным оценкам параметров (или только М ( Х ) ), завышенному значению
средней квадратической ошибки, определенной по формуле Гаусса, или по
материалам уравнивания по сравнению с предполагаемой точностью
измерений.
4. ИССЛЕДОВАНИЕ СВОЙСТВ СЛУЧАЙНЫХ ОШИБОК ИЗМЕРЕНИЙ
4.1. Свойства случайных ошибок измерений для двухпараметрических
законов распределения
Статистический анализ геодезических данных выявил ряд моделей законов
распределения ошибок измерений и их линейных функций, применение
которых ранее не было отмечено в геодезической литературе.
Наряду с нормальным распределением, встречаются и другие
двухпараметрические законы с параметрами: а – сдвига, а ∈ (-∞, ∞) и λ – масштаба,
λ∈ (0, ∞). К ним относятся следующие законы распределения.
Закон Лапласа, для которого математическое ожидание
Мх = а, среднее квадратическое отклонение σх = λ 2 .
Логистический закон с математическим ожиданием Мх = а и средним
квадратическим отклонением σ x = π λ / 3 ≈1,81λ .
Закон распределения Коши, для которого Мх и σх не существуют; а –
медиана, мода.
Закон
максимальных
значений
с
математическим
ожиданием
Мх = а + λс и средним квадратическим отклонением σ х = π λ / 6 ≈1.28 λ .
Закон минимальных значений с математическим ожиданием
Мх = а – λс и средним квадратическим отклонением σ х = π λ / 6 .
Для нормального закона распределения а = Мх, λ = σх.
Известные четыре свойства случайных ошибок измерений определяются
свойствами кривой нормального закона, принятого в геодезии в качестве
модели распределения геодезических случайных величин. Относительно
других законов распределения свойства случайных ошибок могут быть иными
[20].
Точно также само определение случайных ошибок измерений, как ошибок,
«математическое ожидание которых равно нулю», не будет правомерно для всех
101
законов распределения. Для закона максимальных
значений М(∆) = 0 только тогда,
когда параметр сдвига а = –λс:
М(∆) = а + λс = М(Х – Мх) = Мх – Мх = 0;
а = –λс.
Для закона минимальных значений М(∆) = 0, когда а = λс.
Для широко распространенного закона Коши математического ожидания
вообще не существует.
Не следует ли в определение случайных ошибок измерений добавить
четкую ссылку на нормальный закон распределения этих ошибок?
Случайными ошибками измерений, в предположении о нормальном законе
их распределения, называются такие ошибки, математическое ожидание
которых равно нулю.
Рассмотрим свойства случайных ошибок для перечисленных законов
распределения, используя их известные формулировки.
1. Случайные ошибки ∆ по абсолютной величине с
вероятностью Р не превосходят определенного предела (табл. 41).
заданной
Таблица 41. Вероятности заданных пределов
Закон
Нормальный
Лапласа
Логистический
Мин. значений
Макс. значений
Р(|∆|<σ)
0,683
0,757
0,720
0,724
0,724
Р(|∆|<2σ)
0,954
0,941
0,948
0,957
0,957
Р(|∆|<3σ)
0,997
0,986
0,991
0,988
0,988
Для законов, представленных в табл. 41, принято
М(∆) = 0.
Табл. 41 составлена по данным табл. 38.
Для закона распределения Коши:
F(1) = 0,750; F(2) = 0,852; F(3) = 0,898
– функции распределения F(x), вычисленные по аргументу (х – а)/λ при а =
0 и λ = 1.
2. Положительные и отрицательные случайные ошибки, равные по
абсолютной величине, равновозможны.
Р(∆ > 0) = Р(∆ < 0) = 0,5
для законов распределения нормального, Лапласа, логистического, Коши.
Для распределения минимальных значений
F(0) = P(∆ < 0) = 0,430; P(∆ > 0) = 0,570.
Для распределения максимальных значений
F(0) = P(∆ < 0) = 0,570; P(∆ > 0) = 0,430.
Кривые распределений максимальных и минимальных значений
несимметричны.
3. Малые по абсолютной величине случайные ошибки встречаются чаще,
чем большие (табл. 42). Здесь
Р(σ < ∆ ≤ 2σ ) = Ф(2σ ) − Ф(σ ) = Р( ∆ < 2σ) − Р( ∆ < σ);
Р(2σ < ∆ ≤ 3σ ) = Ф (3σ ) − Ф(2σ ) = Р( ∆ < 3σ ) − Р( ∆ < 2σ ).
Для закона Коши:
Р(1 < |∆| ≤ 2) = 0,205; Р(2 < |∆| ≤ 3) = 0,090, если а = 0 и λ = 1.
Таблица 42. Вероятности заданных интервалов
Закон
Нормальный
Лапласа
Логистический
Мин. значений
Макс. значений
Р(|∆| ≤ σ)
0,683
0,757
0,720
0,724
0,724
Р(σ < |∆| ≤ 2σ)
0,271
0,184
0,228
0,233
0,233
Р(2σ < |∆| ≤ 3σ)
0,043
0,045
0,043
0,031
0,031
4. Среднее арифметическое случайных ошибок при возрастании числа
наблюдений по вероятности стремится к нулю, т.е.
вер. lim [∆] / n = 0 .
n →∞
Исключение из этого правила имеет место для законов максимальных и
минимальных значений. В этом случае
М(∆) = а ± λс
соответственно,
вер. lim
n →∞
[∆] = М(∆) = a ± λ c .
n
Для закона максимальных значений
при а = – λс вер. lim [∆ ] / n = 0 ; при а = 0 вер. lim [ ∆] / n = λ c .
n →∞
n →∞
Для закона минимальных значений
при а = λс вер. lim [∆ ] / n = 0; при а = 0 вер. lim [∆ ] / n = − λ c .
n →∞
n →∞
4.2. Проверка свойств случайных ошибок измерений с использованием
критериев согласия
Проверку свойств случайных ошибок измерений на практике выполняют
путем подсчета числа ошибок, попадающего в те или иные интервалы [4] или
вычисления разности относительной частоты и вероятности попадания ошибки
в заданный интервал [3].
Такая методика не дает допусков для оценки расхождений результатов
анализа с теоретическими значениями соответствующих величин, не позволяет
сделать надежный вывод о соответствии опытных и теоретических данных.
Применение критериев математической статистики позволяет устранить
этот недостаток [21]. Для того, чтобы установить наличие первых трех свойств,
изложенных в разделе 4.1, предлагаем выполнить «проверку гипотезы
относительно вероятности» [26]:
Р(| к – np | < tσ) = β,
(103)
где β = Ф(t) – доверительная вероятность;
к – число ошибок в заданном интервале;
n – число всех ошибок, подлежащих исследованию;
р – теоретическая вероятность попадания ошибки в заданный интервал;
σ = npq – среднее квадратическое отклонение.
При проверке первого и третьего свойства значения вероятностей р для
законов распределения: нормального, Лапласа, логистического, максимальных
и минимальных значений – следует взять в табл. 41 и 42.
Для проверки второго свойства вероятность р = 0,5 для законов
нормального, Лапласа, логистического, Коши. Вероятность появления
отрицательных ошибок р = 0,430 для закона минимальных значений.
Вероятность появления отрицательных ошибок р = 0,570 для закона
максимальных значений. Доверительная вероятность β и соответствующий
аргумент t для рассматриваемых законов распределения представлены в
табл. 39.
Если неравенство (103) выполняется, можно считать, что данное свойство
имеет место.
к − np > tσ
Если
, ошибки измерений данным свойством не обладают.
Последнее, четвертое свойство можно проверить критерием равенства
средних [25], который вычисляется по формуле:
∆ − ∆0
m/ n ,
(104)
[∆]
∆=
n – среднее арифметическое из ошибок равноточных измерений;
где
∆ 0 = М ∆ = 0 – теоретическое среднее, равное математическому ожиданию
tэ =
случайной ошибки измерения,
m / n – средняя квадратическая ошибка среднего арифметического.
Величина t подчиняется закону распределения Стьюдента с ν = n – 1
степенями свободы, если результаты измерений распределены нормально.
Законы Лапласа, логистический, Коши, экстремальных значений близки к
нормальному. По оценке максимальных расхождений функции распределения
этих законов с точностью до второй значащей цифры совпадают с функцией
нормального распределения (см. табл. 37).
В табл. 4 приложения помещены значения статистики t, соответствующие
заданному уровню значимости α.
Если значение tэ < tα, отклонение среднего арифметического от нуля
можно считать несущественным.
К.Л. Проворовым была предложена формула для расчета предельного
расхождения числа положительных и отрицательных ошибок при β = 0,95 и в
предположении о нормальном распределении случайных ошибок измерений
[27]:
γ=2 n.
(105)
Допуск по критерию (103) дается для уклонения числа ошибок того или
иного знака от их теоретического количества, равного n/2 для нормального
закона распределения. Поэтому если, например, n = 30, то γ = 11,
tσ = 2 ⋅ npq = 5,5
, т. е. в два раза меньше.
При отсутствии принципиального различия в этих допусках критерий (103)
более универсален. Его можно использовать для проверки не одного, а трех
свойств случайных ошибок измерений, различных законов распределения и при
любых доверительных вероятностях β.
4.3. Проверка свойств случайных ошибок на примере ряда невязок
триангуляции 1-го класса
Для иллюстрации предлагаемой методики проверим выполнение свойств
случайных ошибок в объединенном ряду невязок треугольников триангуляции
1-го класса (см. табл. 1, 2).
По формуле Гаусса вычислим среднюю квадратическую ошибку суммы
углов треугольника
[f 2 ]
mΣ =
= 0,945′′ .
n
По формуле Ферреро определим среднюю квадратическую ошибку угла
[f 2 ] m Σ
mβ =
=
= 0,55′′ .
3n
3
После этого, согласно общепринятой методике, подсчитаем, сколько
невязок попадает в заданные интервалы, количество положительных и
отрицательных невязок, а также их среднее арифметическое значение.
Первое свойство: случайные ошибки по абсолютной величине с заданной
вероятностью не превосходят определенного предела:
а) к (| f | < m) = 90;
б) к (| f | < 2m) = 121;
в) к (| f | < 3m) = 128.
Одна невязка f = 2,99˝ несколько превысила значение 3m = 2,84˝.
Второе свойство: положительные и отрицательные ошибки, равные по
абсолютной величине, равновероятны:
а) к (f > 0) = 68;
б) к (f < 0) = 61.
Третье свойство: малые по абсолютной величине ошибки встречаются
чаще, чем большие:
а) к (| f | < m) = 90;
б) к (m ≤ | f | < 2m) = 31;
в) к (2m ≤ | f | < 3m) = 7.
Четвертое свойство: среднее арифметическое случайных ошибок при
возрастании числа наблюдений по вероятности стремится к нулю.
Среднее арифметическое значение невязок:
f =
[f ] = 0,0975′′ .
n
Для того, чтобы установить допустимость уклонения полученных
результатов от их теоретических значений, воспользуемся статистическими
критериями (103) и (104). Примем доверительную вероятности β = Ф(t) = 0,988,
что для нормального распределения соответствует значению аргумента t = 2,5.
Проверяем свойства случайных ошибок в предположении о нормальном
законе их распределения. Элементы формулы (103) помещены в табл. 43 – 45.
Таблица 43. Первое свойство случайных ошибок
Границы
|f|< m
| f | < 2m
| f | < 3m
p
0,683
0,954
0,997
q
0,317
0,046
0,003
np
88,1
123,1
128,6
σ
5,28
2,38
0,62
tσ
13,2
6,0
1,55
Таким образом, имеют место следующие неравенства:
к – np
90 – 88
121 – 123
128 – 128,6
2 < 13,2 – для интервала (|f| < m);
2 < 6,0 – для интервала (|f| < 2m);
0,6 < 1,55 – для интервала (|f| < 3m).
Первое свойство случайных ошибок в данном ряду невязок выполняется.
Отклонение частоты появления невязок в заданных интервалах от
соответствующих теоретических частот нормального закона распределения
несущественно.
Таблица 44. Второе свойство случайных ошибок
Границы
f>0
f<0
р
0,5
0,5
q
0,5
0,5
np
64,5
64,5
σ
5,68
5,68
Второе
свойство
выполняется,
количество
отрицательных невязок отличается несущественно:
3,5 < 14,2 – для f > 0;
2,5 < 14,2 – для f < 0.
tσ
14,2
14,2
к – np
68 – 64,5
61 – 64,5
положительных
и
Таблица 45. Третье свойство случайных ошибок
Границы
m ≤ |f| < 2m
2m ≤ |f| < 3m
р
0,271
0,043
q
0,729
0,957
np
35,0
5,6
σ
5,05
2,3
tσ
12,6
5,8
к – np
31 – 35
7 – 5,6
Третье свойство случайных ошибок выполняется:
4 < 12,6 – для интервала (m ≤ |f| < 2m) ;
1,4 < 5,8 – для интервала (2m ≤ |f| < 3m).
Отклонение частоты появления невязок в заданных интервалах от
соответствующих теоретических частот нормального закона распределения
несущественно.
Для проверки четвертого свойства вычисляем критерий t по формуле (104)
tэ =
0,098 − 0
= 1,18 .
0,083
Для уровня значимости α = 0,05 и числа степеней свободы ν = 128 по табл. 4
приложения находим tα = 1,98. Так как tэ < tα (1,18 < 1,98), можно считать, что
среднее значение невязки несущественно отличается от нуля.
Таким образом, наше исследование подтвердило выполнение свойств
случайных ошибок в ряду невязок триангуляции 1-го класса. Применение
критериев согласия при проверке свойств случайных ошибок обусловило
надежность и определенность сделанного вывода: все свойства случайных
ошибок измерений в данном ряду невязок выполняются.
Вопрос о допустимости невязки f = 2,99˝ рассмотрен далее в разделе 4.4 с
позиций критерия (103).
Подобным образом исследованы свойства случайных ошибок для
остальных законов распределения, представленных в табл. 41 и 42. И в этих
случаях все свойства выполняются, что говорит о близости данных законов.
Наилучшая сходимость эмпирических и теоретических частот имела место для
логистического закона распределения.
При проверке первого свойства имели место следующие неравенства для β
= 0,988 и t = 2,8
|к – np| < 2,5σ:
2,9 < 14,3 – в интервале (|f| < m);
0,7 < 7,0 – в интервале (|f| < 2m);
0,2 < 3,0 – в интервале (|f| < 3m).
При проверке третьего свойства имеем
1,6 < 13,4 – в интервале (m < |f| < 2m);
1,5 < 6,4 – в интервале (2m < |f| < 3m).
Для логистического закона распределения не возникает вопрос
о недопустимости невязки f = 2,99˝. Вероятности Ф(t) = 0,997 соответствует
аргумент t = 3,6 и ∆пред = 3,6m = 3,40˝, f < ∆пред.
4.4. Отбраковка грубых ошибок критерием равенства вероятностей
Целесообразность применения критерия равенства вероятностей для
отбраковки грубых ошибок измерений определяется возможностью оценивать
степень расхождения теоретических и эмпирических частот в заданном
интервале [26], [22]. «Статистическая проверка гипотезы относительно
вероятности» – так озаглавлен данный критерий в работе [26]. «Критерий
равенства вероятностей» – название, предлагаемое автором.
Пусть случайная ошибка измерения по абсолютной величине превысила
3m, то есть утроенное значение средней квадратической ошибки. Возникает
вопрос, принадлежит ли данная ошибка к общей нормальной совокупности или
результат наблюдений искажен грубой ошибкой.
Вероятность того, что случайная ошибка измерения по абсолютной
величине не превзойдет предела 3m, в предположении о нормальном
распределении ошибок, Р(|∆| < 3m) = 0,99730. С вероятностью р = (1 – Р) =
0,00270 абсолютная величина случайной ошибки превысит значение 3m,
попадет в интервал (3m, ∞). В этом случае за границей 3m может появиться np
ошибок (около трех при числе измерений n = 1 000), которые, в соответствии с
правилом 3σ («три сигма») должны рассматриваться как грубые, независимо от
объема выборки.
Если на практике в некотором интервале, за границей 3m, окажется к
значений случайных ошибок, критерий равенства вероятностей позволяет
установить допустимость расхождения эмпирической – (к) и теоретической –
(np) частоты появления случайной ошибки в этом интервале, отвечающей
гипотезе р = Р(α < |∆| < β) – равенства вероятностей.
Критерий вычисляется по формуле (103):
Р( |к – np| < tσ) = β,
где t – аргумент интеграла вероятностей Ф(t) = β;
к – количество случайных ошибок в заданном интервале;
n – число измерений;
р – вероятность попадания случайной ошибки в заданный интервал;
q = 1 – р – вероятность противоположного события;
np – математическое ожидание числа появления ошибок в заданном
интервале;
σ = n p q – среднее квадратическое отклонение.
Если с вероятностью β, близкой к единице, абсолютная величина разности
эмпирической и теоретической частоты не превысит указанного предела tσ,
можно считать, что резко выделяющаяся ошибка наблюдения принадлежит к
исследуемой нормальной совокупности (нулевая гипотеза не противоречит
результатам наблюдений).
Существуют критерии отбраковки грубых ошибок, в которых также
используется вероятность попадания случайной ошибки в некоторый интервал.
Например, критерий Шовенэ [32]. Этот критерий позволяет получить ошибку,
больше которой не должно быть в данном ряду наблюдений. Произведение
nP(α < |∆| < ∞) ≤ 0,5
выражает число измерений в ряду n, для которых ошибка равна α и выше.
Это означает, что в интервале от α до ∞ не должно быть ни одной (по
округлению) ошибки. Для критерия Шовенэ верхняя граница интервала всегда
равна бесконечности.
В предлагаемом варианте решения верхнюю и нижнюю границу можно
задать в зависимости от величины сомнительной ошибки, например, от 3m до
3,5m; не ограничена величина теоретической частоты появления ошибки в
заданном интервале.
Вероятности попадания абсолютной величины случайной ошибки в
интервалы с нижней границей α ≥ 3m вычислены по формуле
Р(α < |∆| < β) = Ф(tβ) – Ф(tα).
(106)
Р(3,0m < |∆| < 3,2m) = Ф(3,2) – Ф(3,0) = 0,00133;
Р(3,0m < |∆| < 3,4m) = Ф(3,4) – Ф(3,0) = 0,00203;
…………………………………………………….
Р(3,4m < |∆| < 4,0m) = Ф(4,0) – Ф(3,8) = 0,00061.
Полученные значения вероятностей представлены в табл. 46.
Таблица 46. Вероятности Р(α < |∆| < β)
tβ
tα
3,0
3,2
3,4
3,2
3,4
3,6
3,8
4,0
0,00133
0,00203
0,00070
0,00238
0,00105
0,00035
0,00256
0,00123
0,00053
0,00264
0,00131
0,00061
Вероятность р = Р(α < |∆| < β) находим по значению нижней t α =
верхней t β =
α
и
m
β
границе интервала, находящихся соответственно в левом
m
столбце и заголовке таблицы. Вероятность противоположного события q = 1 – p
близка к единице. Вследствие этого, произведение pq = р с точностью до двухтрех значащих цифр. Остается учесть число измерений n.
Рассмотрим применение критерия равенства вероятностей на примере
объединенного ряда невязок треугольников триангуляции 1-го класса, n = 129
(см. табл. 1 и 2). Этот ряд включает невязку f = 2,99˝, превышающую утроенное
значение средней квадратической ошибки суммы углов треугольника, равной
[f 2 ]
mΣ =
n = 0,94˝.
Проверим, является ли это значение следствием грубой ошибки измерения.
В соответствии с правилом 3σ, невязка f = 2,99˝ превышает утроенное
значение средней квадратической ошибки суммы углов треугольника 3m∑ =
2,82˝ и должна быть отбракована.
Критерий Шовенэ в этом случае приводит к такому же выводу, что и
правило 3σ. Для n = 129, t = 2,87 (табл. 115 [32]).
fпред = tm = 2,70˝. Невязка f = 2,99˝ оказывается недопустимой.
Используем критерий равенства вероятностей. Сделаем расчет по формуле
(103).
По своей величине сомнительная невязка f = 2,99˝ попадает в интервал
(3,0m; 3,2m). Вероятность попадания случайной ошибки в заданный интервал
предлагается взять из табл. 46 по аргументам tα = 3,0 и tβ = 3,2.
р = Р(3,0m < |∆| < 3,2m) = 0,00133.
Вероятность противоположного события q = 0,99867. Количество ошибок в
заданном интервале к = 1. Теоретическая частота np = 0,172; npq = 0,171.
Среднее квадратическое отклонение σ = npq = 0,41. Для доверительной
вероятности β = 0,988 аргумент t = 2,5. Таким образом, tσ = 1,025, и неравенство
вида |к – np| < tσ выполняется:
|1 – 0,172| < 1,025 или 0,83 < 1,025.
Следовательно, единственное значение невязки f = 2,99˝ является
возможным в случае нормального закона.
Действительно, средняя квадратическая ошибка угла, вычисленная по
формуле Ферреро с учетом невязки f = 2,99"
[f 2 ]
mβ =
= 0,55′′
3n
,
не превосходит допустимого для 1-го класса триангуляции значения,
равного 0,7˝.
Предположим, что в этом ряду еще одна невязка превышает утроенное
значение средней квадратической ошибки. С этой целью изменим значение
невязки f = 2,03˝ на f = 2,90˝. Средняя квадратическая ошибка суммы углов
будет равна mΣ = 0,96˝ и две невязки f = 2,90˝ и f = 2,99˝ оказываются за
границей интервала 3m, то есть к = 2. В этом случае
|2 – 0,172| > 1,025.
Так как 1,83 > 1,025, две невязки в границах заданного интервала при n =
129 находиться не могут. Одну из них следует считать следствием грубой
ошибки или результатом уклонения эмпирического распределения от
нормального закона.
В отличие от критериев Грэббса, Смирнова и т. п. критерий равенства
вероятностей позволяет анализировать ряды случайных ошибок достаточно
большого объема выборочной совокупности. В табл. 47 приведены
минимальные значения объемов выборки n, при которых выполняется условие
формулы (103) для к = 1 и β = 0,988:
|1 – np| < 2,5σ .
(107)
Таблица 47. Значения nmin
β
α
3,0m
3,2m
3,4m
3,2m
3,4m
93
3,6m
61
176
3,8m
52
118
350
4,0m
49
101
233
47
95
202
В соответствии с данными табл. 47, если одна случайная ошибка оказалась
в интервале (3,0m < |∆| < 3,2m) при числе измерений n ≥ 93, это значит, что
условие (107) выполняется. Появление одной случайной ошибки в интервале
(3,4m < |∆| < 3,6m) может произойти достаточно редко, количество наблюдений
в этом случае должно быть не менее n = 350.
Критерий равенства вероятностей (103) дает дополнительную информацию
для принятия решения о допустимости сомнительной ошибки измерения.
ЗАКЛЮЧЕНИЕ
Статистический анализ законов распределения случайных величин в
геодезии был выполнен с использованием следующих данных: w – невязок; v –
поправок к результатам измерений; δx – поправок к приближенным значениям
параметров; ∆h – разностей двойных измерений высокоточного нивелирования;
∆H – разностей отметок повторных наблюдений за осадками стеновых панелей
Ленинградской АЭС.
Установлено, что перечисленные величины могут подчиняться законам:
нормальному, Коши, Лапласа, логистическому, максимальных и минимальных
значений и некоторым другим, а также усеченным распределениям и смесям
законов (табл. 48). К другим возможным моделям законов относятся
распределения Su-Джонсона, Sb-Джонсона, двойное экспоненциальное,
Накагами, бета 1-го рода и двойное показательное, не получившие приоритета,
согласно компромиссному критерию [30], [11], [7].
Таблица 48. Законы распределения геодезических данных
Законы
распределения
Нормальный
Коши
Лапласа
Логистический
Мин. значений
Макс. значений
Другие законы
w
v
+
+
+
+
+
+
+
+
+
Геодезические данные
δx
∆h
+
+
+
+
+
+
+
+
+
∆H
+
+
+
+
+
+
+
Знак «+» обозначает, что с указанным распределением наилучшим образом
согласовывались некоторые выборки данной случайной величины.
Двухпараметрические
законы
распределения:
Коши,
Лапласа,
логистический, экстремальных значений – обладают некоторыми общими
свойствами с нормальным законом. Функции распределения этих законов в
границах σ, 2σ, 3σ совпадают с функцией нормального распределения с
точностью до одной-двух значащих цифр. Однако допуски нормального
распределения, в частности ∆ пред = 3σ , при котором коэффициент t = 3
соответствует доверительной вероятности β = 0,997, для всех указанных выше
двухпараметрических законов занижены. Для β = 0,997
∆ пред = 4σ
– таков максимально возможный размах случайных ошибок измерений для
законов Коши, Лапласа и экстремальных значений. Для логистического закона t
= 3,6.
Установление модели закона распределения ошибок геодезических
измерений в каждом конкретном случае могло бы послужить обоснованием для
принятия решения по отбраковке сомнительного результата.
Нормальный закон распределения случайных ошибок измерений не
исключает возможного наличия систематических влияний (систематических
ошибок постоянного характера или единичных грубых ошибок) в ряду
измерений геодезической сети.
Определение случайных ошибок измерений, как ошибок, математическое
ожидание которых равно нулю, не вполне корректно для асимметричных
законов распределения максимальных и минимальных значений и не годится
для закона распределения Коши, не имеющего математического ожидания.
Возможная поправка к данному определению – «… в предположении о
нормальном законе их распределения…».
Проверку свойств случайных ошибок измерений целесообразно выполнять
с использованием критериев математической статистики, которые позволяют
сделать надежные вероятностные выводы о согласии эмпирических и
теоретических характеристик интересующего закона распределения.
Критерий равенства вероятностей универсален и прост в использовании.
Его рекомендуется применять для проверки трех свойств случайных ошибок
измерений и для решения вопроса отбраковки грубых ошибок измерений.
Дальнейшее развитие данной темы возможно в направлении расширения
объектов исследования, изучения свойств композиций законов распределения
геодезических данных, создания программной системы статистического
анализа с учетом специфических особенностей случайных величин в геодезии
ПРИЛОЖЕНИЕ
Ф( t ) =
Таблица 1. Интеграл вероятностей
t
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1,00
1,10
Ф(t)
0,00000
0,07966
0,15852
0,23582
0,31084
0,38292
0,45149
0,51607
0,57629
0,63188
0,68269
0,72867
t
1,20
1,30
1,40
1,50
1,60
1,70
1,80
1,90
2,00
2,10
2,20
2,30
Ф(t)
0,76986
0,80640
0,83849
0,86639
0,89040
0,91087
0,92814
0,94257
0,95450
0,96427
0,97219
0,97855
t
2,40
2,50
2,60
2,70
2,80
2,90
3,00
3,20
3,40
3,60
3,80
4,00
+t −
1
∫e
2π − t
t2
2 dt
Ф(t)
0,98360
0,98758
0,99068
0,99307
0,99489
0,99627
0,99730
0,99863
0,99933
0,99968
0,99986
0,99994
Таблица 2. Критерий Пирсона χ2
r
3
4
5
6
7
8
9
10
Уровень
значимости α
0,10
0,05
6,25
7,81
7,78
9,49
9,24
11,1
10,6
12,6
12,0
14,1
13,4
15,5
14,7
16,9
16,0
18,3
r
11
12
13
14
15
16
17
18
Уровень
значимости α
0,10
0,05
17,3
19,7
18,5
21,0
19,8
22,4
21,1
23,7
22,3
25,0
23,5
26,3
24,8
27,6
26,0
28,9
r = к – s – 1 – число степеней свободы;
s – число параметров, оцениваемых по выборке (s = 2 для нормального
закона распределения).
Таблица 3. Критерий Колмогорова
λ
0,0
0,1
0,2
0,3
0,4
0,5
0,6
Р(λ)
1,000
1,000
1,000
1,000
0,997
0,964
0,864
λ
0,7
0,8
0,9
1,0
1,1
1,2
1,3
Р(λ)
0,711
0,544
0,393
0,270
0,178
0,112
0,068
λ
1,4
1,5
1,6
1,7
1,8
1,9
2,0
Р(λ)
0,040
0,022
0,012
0,006
0,003
0,001
0,001
Таблица 4. Критические точки распределения Стьюдента
t
Ф ( t ) = 2 ∫ S n −1 ( t )dt
'
0
r = n – 1 – число степеней свободы.
r
5
6
7
8
9
10
11
12
13
14
15
16
17
Уровень значимости α
0,10
0,05
2,02
2,57
1,94
2,45
1,89
2,36
1,86
2,31
1,83
2,26
1,81
2,23
1,80
2,20
1,78
2,18
1,77
2,16
1,76
2,14
1,75
2,13
1,75
2,12
1,74
2,11
r
18
20
21
22
23
24
25
27
30
40
60
120
∞
1,73
1,72
1,72
1,72
1,71
1,71
1,71
1,70
1,70
1,68
1,67
1,66
1,64
Уровень значимости α
0,10
0,05
2,10
2,09
2,08
2,07
2,07
2,06
2,06
2,05
2,04
2,02
2,00
1,98
1,96
СПИСОК ЛИТЕРАТУРЫ
1. Большаков В.Д., Гайдаев П.А. Теория математической обработки
геодезических измерений. – М.: Недра, 1977. – 367 с.
2. Большаков В.Д., Маркузе Ю.И., Голубев В.В. Уравнивание
геодезических построений. – М.: Недра, 1989. – 413 с.
3. Большаков В.Д. Теория ошибок наблюдений. – М.: Недра, 1983. – 223 с.
4. Бурмистров Г.А. Задачник по способу наименьших квадратов. – М.:
Геодезиздат, 1960. – 347 с.
5. Вентцель Е.С. Теория вероятностей. – М.: Наука, 2000. – 576 с.
6. Гмурман В.Е. Теория вероятностей и математическая статистика. – М.:
Высш. школа, 2000. – 480 с.
7. Губарев В.В. Вероятностные модели: Справочник: В 2 ч. –
Новосибирск: НЭТИ, 1992. – 422 с.
8. Демидович Б.П., Марон И.А. Основы вычислительной математики. –
М.: Наука, 1966. – 664 с.
9. Исследование деформаций наружных строительных элементов
(панелей) Ленинградской АЭС: Отчет о НИР (Заключительный) / СГГА;
Руководитель И.В. Лесных. – № ГР 0 197.000. Инв. № 147 9566. – Новосибирск,
1996. – 180 с.
10. Кемниц Ю.В. Теория ошибок измерений. – М.: Недра, 1967. – 176 с.
11. Лемешко Б.Ю. Статистический анализ одномерных наблюдений
случайных величин: Программная система. – Новосибирск: НГТУ, 1995. –
125 с.
12. Лесных Н.Б. Теория математической обработки геодезических
измерений. Метод наименьших квадратов: Учеб. пособие. – Новосибирск:
СГГА, 2003. – 60 с.
13. Лесных Н.Б. Основы теории вероятностей и математической
статистики. Теория ошибок измерений: Учеб. пособие. – Новосибирск: СГГА,
1992. – 75 с.
123
14. Лесных Н.Б., Малиновский А.Л., Мизина Г.И. Анализ результатов
уравнивания нивелирных сетей АЭС // Межвуз. сб. науч. трудов
«Совершенствование
методов
инженерно-геодезических
работ».
–
Новосибирск, 1988. – С. 41 – 45.
15. Лесных Н.Б., Мизина Г.И. Законы распределения зависимых и
независимых поправок // Вестник СГГА. – 1999. – № 4 – С. 54 – 55.
16. Лесных Н.Б., Мизина Г.И., Лесных А.И. Статистический анализ
разностей двойных измерений // Тез. докл. XLVIII научн.-техн. конф. препод.
СГГА. – Новосибирск, 1998. – С. 82.
17. Лесных Н.Б., Лесных А.И., Мизина Г.И. Сравнительная характеристика
законов распределения геодезических данных // Вестник СГГА. – 2000. – № 5. –
С. 49 – 54.
18. Лесных Н.Б., Лесных А.И., Мизина Г.И. Свойства кривых
распределения геодезических данных// Вестник СГГА. – 2003. – № 8 – С. 132 –
135.
19. Лесных Н.Б. Нормальный закон в оценке качества измерений// Вестник
СГГА. – 2003. – № 8 – С. 135 – 138.
20. Лесных Н.Б. Свойства случайных ошибок для двухпараметрических
законов распределения // Материалы LIII международной науч.-техн. конф.,
посвященной 70-летию СГГА «Современные проблемы геодезии и оптики». Ч.
II. – Новосибирск, 2003. – С. 113 – 115.
21. Лесных Н.Б. Методика вероятностного анализа ошибок и поправок //
Межвуз. сб. науч. трудов «Исследования по совершенствованию средств и
методов инженерной геодезии». – Новосибирск, 1984. – С. 55 – 57.
22. Лесных Н.Б. Отбраковка грубых ошибок критерием равенства
вероятностей // Вестник СГГА. – 2005. – № 10 – С. 72 – 76.
23. Маркузе Ю.И., Бойко Е.Г., Голубев В.В. Геодезия. Вычисление и
уравнивание геодезических сетей. – М.: Картцентр – Геодезиздат, 1994. – 431 с.
24. Маркузе Ю.И. Основы уравнительных вычислений. – М.: Недра, 1990.
– 240 с.
25. Митропольский А.К. Техника статистических вычислений. – М.: Наука,
1971. – 576 с.
26. Смирнов Н.В., Белугин Д.А. Теория вероятностей и математическая
статистика в приложении к геодезии. – М.: Недра, 1969. – 382 с.
27. Проворов К.Л. О точности сплошных сетей триангуляции. – М.:
Геодезиздат, 1956. – 164 с.
28. Статистический анализ независимых и зависимых случайных величин
в геодезии: Отчет о НИР (промежуточный) / НГТУ; Руководитель Б.Ю.
Лемешко. Исполнители Б.Ю. Лемешко, Н.Б. Лесных и др. – № ГР
01.96.0003120; Инв. № 02.96.0008130. – Новосибирск, 1996. – 69 с.
29. Статистический анализ независимых и зависимых случайных величин
в геодезии: Отчет о НИР (заключительный)/ НГТУ; Руководитель Б.Ю.
Лемешко. Исполнители Б.Ю. Лемешко, Н.Б. Лесных и др. – № ГР
01.96.0003120; Инв. № 02.98.0001109. – Новосибирск, 1997. – 40 с.
30. Теория, методы и программное обеспечение задач статистического
анализа независимых и зависимых случайных величин в геодезии: Отчет о
НИР (промежуточный) / НГТУ; Руководитель В.И. Денисов. Исполнители
Б.Ю. Лемешко, Н.Б. Лесных и др. – № ГР 01.95.000159; Инв. № 02.95.0001199. –
Новосибирск, 1994. – 40 с.
31. Теория, методы и программное обеспечение задач статистического
анализа независимых и зависимых случайных величин в геодезии:
Вероятностные модели, непараметрические критерии, анализ: Отчет о НИР
(заключительный) / НГТУ; Руководитель В.И. Денисов. Исполнители Б.Ю.
Лемешко, Н.Б. Лесных и др. – № ГР 01.96.0003119; Инв. № 02.96.0005332. –
Новосибирск, 1995. – 42 с.
32. Чеботарев А.С. Способ наименьших квадратов с основами теории
вероятностей. – М.: Геодезиздат, 1958. – 606 с.
Скачать