Загрузил aistomin1998

Раздел 3

реклама
Раздел 1. Задание 1
Введение
Пусть две величины x и y связаны табличной зависимостью, полученной,
например, из опытов.
x
x1
x
x
y
y1
У2
yn
n
На плоскости xO y данной таблице соответствует n точек Mi (Xi,yt) , где i = 1,2,3,...,n
. Точки Mt называют экспериментальными точками (рисунок 1).
Рисунок 1.1 – Экспериментальные точки
Требуется установить функциональную зависимость y = f (x) между переменными x
и y по результатам экспериментальных исследований, приведенных в таблице.
Применение интерполяции в данном случае нецелесообразно, так как значения y в
узлах x получены экспериментально и поэтому являются сомнительными (в ходе
эксперимента
возникает
неустранимая
погрешность,
обусловленная
неточностью
измерений). Кроме того, совпадение значений в узлах не означает совпадения характеров
поведения исходной и интерполирующей функций. Поэтому необходимо найти такой
метод подбора эмпирической формулы, который не только позволяет найти саму
формулу, но и оценить погрешность подгонки.
Постановка задачи
Найти аппроксимирующую функцию.
В общем случае искомая функция y
= f (X) будет зависеть не только от x , но и от
некоторого количества параметров:
y = f (x, a, b,...)
( 1.1 )
такую, чтобы в точках x= xi она принимала значения по возможности близкие к
табличным, то есть график искомой функции должен проходить как можно ближе к
экспериментальным точкам. Вид функции (1) может быть известен из теоретических
соображений или определяться характером расположения экспериментальных точек M
i
на плоскости xOy.
Для отыскания коэффициентов a, b,... в функции (1.1) применяется метод
наименьших квадратов, который состоит в следующем. Между искомой функцией и
табличными значениями в точках x наблюдаются отклонения. Обозначим их
(1.2)
где i = 1,2,3,...,n .
Выбираем значения коэффициентов a,b,... так, чтобы сумма квадратов отклонений
принимала минимальное значение:
(1.3)
Сумма S (a,b,...) является функцией нескольких переменных. Необходимый
признак экстремума функции нескольких переменных состоит в том, что обращаются в
нуль частные производные:
(1.4)
План решения задачи
1. Выбираем функцию y = f (X,a,b,...) .
2. Для отыскания коэффициентов a,b,... составляем системууравнений ( 1.4 ) .
3. Решая систему уравнений (3), находим значения коэффициентов a,b,... .
4. Подставляя a,b,... в уравнение (1), получаем искомую функцию y
= f (X,a,b,...') .
5. По достаточному признаку экстремума функции нескольких переменных следует
убедиться в постоянстве знака дифференциала второго порядка этой функции:
d2S > 0 при любых приращениях аргументов da, db,... .
Такая проверка делается в теоретической части метода наименьших квадратов и на
практике не повторяется.
Обычно рассматривают несколько видов функций y = f (x, a, b,...) и выбирают ту
функцию, для которой суммарная погрешность окажется наименьшей:
(1.5)
Задание №1
Исходные данные
№ Вар.
7
1
2
3
4
5
6
7
8
9
10
11
x
0,01
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
y
1
1,22
1,48
1,78
2,12
2,5
2,92
3,38
3,88
4,42
5
Решение задачи 1
Решение производилось в Microsoft Excel. Само решение представлено ниже.
Нам дана таблица значений некоторой функциональной зависимости, полученной
из n = 11 опытов.
1.1 Найдем зависимость y от x в виде линейной функции y = ax + b.
Выберем значения коэффициентов a и b так, чтобы сумма квадратов отклонений была
минимальной.
(1.6)
Функция S(a, b) будет принимать минимальное значение, если обращаются в нуль
частные производные:
(1.7)
Преобразуем уравнения системы:
(1.8)
При этом:
11
11
11
∑ 𝑥𝑖 = 5,51 ,
∑ 𝑦𝑖 =
𝑖=1
𝑖=1
29,7 , ∑ 𝑥𝑖2
𝑖=1
11
= 3,8501 , ∑ 𝑥𝑖 ∗ 𝑦𝑖 = 19,26
𝑖=1
Тогда система уравнений примет вид:
{
3,8501𝑎 + 5,51𝑏 = 19,26
}
5,51𝑎 + 11𝑏 = 29,7
Решим систему уравнений по формулам Крамера:
3,8501
∆= |
5,51
5,51
| = 11,991
11
19,26 5,51
∆1 = |
| = 48,213
29,7
11
3,8501
∆2 = |
5,51
19,26
| = 8,2254
29,7
Тогда
𝑎=
∆1 48,213
∆2 8,2254
=
= 4,02; 𝑏 =
=
= 0,69.
∆
11,991
∆
11,991
Следовательно, искомая линейная функция будет иметь вид:
𝑦 = 4,02𝑥 + 0,69.
1.2 Найдем зависимость y от x в виде степенной функции 𝑦 = 𝛽 ∗ 𝑥 𝛼 .
Прологарифмируем равенство y = β ∗ x a .по основанию e и получим lny = a ∗
lnx + lnβ.
Обозначим Y = lny, X = lnx, b = lnβ.
Тогда получим линейную функцию Y = aX + b, где переменные и связаны
следующей табличной зависимостью.
Система имеет вид:
(1.9)
Найдем коэффициенты системы.
11
11
11
11
2
∑ 𝑙𝑛𝑥𝑖 = −12,5266 ,
∑ 𝑙𝑛𝑦𝑖 = 9,5761 , ∑ 𝑙𝑛 𝑥𝑖 = 32,3184 , ∑ 𝑙𝑛𝑥𝑖 ∗ 𝑙𝑛𝑦𝑖 = −4,5476
𝑖=1
𝑖=1
𝑖=1
𝑖=1
Система уравнений будет иметь вид:
32,3184𝑎 − 12,5266𝑏 = −4,5476
{
}
−12,5266𝑎 + 11𝑏 = 9,5761
Решим систему уравнений по формулам Крамера:
32,3184 −12,5266
∆= |
| = 198,5868
−12,5266
11
−4,5476 −12,5266
∆1 = |
| = 69,9322
9,5761
11
32,3184 −4,5476
∆2 = |
| = 252,5179
−12,5266 9,5761
Тогда
∆1
69,9322
∆2 252,5179
𝑎=
=
= 0,35; 𝑏 =
=
= 1,27.
∆
198,5868
∆
198,5868
Находим 𝛽 = 𝑒 𝑏 = 𝑒 1,27 = 3,57.
Получаем искомую степенную функцию 𝑦 = 3,57𝑥 0,35 .
1.3
Найдем зависимость y от x в виде показательной функции 𝑦 = 𝛽 ∗ 𝑒 𝑎𝑥 .
Для этого требуется прологарифмировать равенство 𝑦 = 𝛽 ∗ 𝑒 𝑎𝑥 по основанию e.
Получим 𝑙𝑛𝑦 = 𝑎𝑥 + 𝑙𝑛𝛽.
Тогда получим линейную функцию 𝑌 = 𝑎𝑋 + 𝑏, где переменные и связаны
следующей табличной зависимостью.
Тогда система имеет вид:
(1.10)
Найдем коэффициенты системы.
11
11
11
11
2
∑ 𝑥𝑖 = 5,51 ,
∑ 𝑙𝑛𝑦𝑖 = 9,5761 , ∑ 𝑥𝑖 = 3,8501 , ∑ 𝑥𝑖 ∗ 𝑙𝑛𝑦𝑖 = 6,5571
𝑖=1
𝑖=1
Система уравнений имеет вид:
𝑖=1
𝑖=1
3,8501𝑎 + 5,51𝑏 = 6,5571
{
}
5,51𝑎 + 11𝑏 = 9,5761
Решим систему уравнений по формулам Крамера:
3,8501
∆= |
5,51
5,51
| = 11,991
11
6,5571
∆1 = |
9,5761
5,51
| = 19,3637
11
3,8501
∆2 = |
5,51
6,5571
| = 0,7394
9,5761
Тогда
𝑎=
∆1 19,3637
∆2 0,7394
=
= 1,61; 𝑏 =
=
= 0,06.
∆
11,991
∆
22,405
Находим 𝛽 = 𝑒 𝑏 = 𝑒 0,7394 = 1,06.
Искомая показательная функция 𝑦 = 1,06𝑒1,61𝑥 .
1.4
Найдем зависимость y от x в виде квадратичной функции y = ax2 + bx + c.
Выберем коэффициенты a , b и c так, чтобы сумма квадратов отклонений была
минимальной.
(1.11)
Функция S (a, b, c) будет принимать минимальное значение, если частные
производныеS’a (a, b, c), S’b (a, b, c), S’c (a, b, c) обращаются в нуль.
(1.12)
Преобразуем выражение выше.
(1.13)
11
11
∑ 𝑥𝑖4
= 2,5333 ,
𝑖=1
∑ 𝑥𝑖3
11
=
3,025 , ∑ 𝑥𝑖2
𝑖=1
11
∑ 𝑥𝑖2
𝑖=1
11
= 3,8501 , ∑ 𝑥𝑖 = 5,51
𝑖=1
11
∗ 𝑦𝑖 = 14,9667 ,
𝑖=1
11
∑ 𝑥𝑖 ∗ 𝑦𝑖 = 19,26 , ∑ 𝑦𝑖 = 29,7
𝑖=1
𝑖=1
Тогда система уравнений примет вид:
2,5333𝑎 + 3,025𝑏 + 3,8501с = 14,9667
{ 3,025𝑎 + 3,8501𝑏 + 5,51𝑐 = 19,26 }
3,8501𝑎 + 5,51𝑏 + 11с = 29,7
Решим систему уравнений по формулам Крамера:
2,5333 3,025 3,8501
∆= | 3,025 3,8501
5,51 | = 0,9938
3,8501
5,51
11
14,9667 3,025 3,8501
∆1 = | 19,26
3,8501
5,51 | = 1,9528
29,7
5,51
11
2,5333 14,9667 3,8501
∆2 = | 3,025
19,26
5,51 | = 2,0318
3,8501
29,7
11
2,5333 3,025 14,9667
∆3 = | 3,025 3,8501
19,26 | = 0,9821
3,8501
5,51
29,7
Тогда
𝑎=
∆1 1,9528
∆2 2,0318
∆3 0,9821
=
= 1,96; 𝑏 =
=
= 2,04; 𝑐 =
=
= 0,99.
∆
0,9938
∆
0,9938
∆
0,9938
Следовательно, искомая квадратичная функция будет иметь вид:
𝑦 = 1,96𝑥 2 + 2,04𝑥 + 0,99.
2.
Построим
в
плоскости
графики
полученных
функций
и
нанесем
экспериментальные точки xOy.
x
y
0,01
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
y1
y2
1
1,14
1,36
1,66
2,04
2,5
3,04
3,66
4,36
5,14
6
y3
0,73
1,09
1,49
1,89
2,29
2,70
3,10
3,50
3,90
4,30
4,71
0,70
1,59
2,02
2,33
2,58
2,79
2,98
3,15
3,30
3,44
3,57
y4
1,08
1,25
1,47
1,73
2,03
2,38
2,80
3,29
3,87
4,55
5,35
1,01
1,21
1,48
1,78
2,12
2,50
2,92
3,38
3,88
4,42
5,00
7
6
5
y
4
y1
y2
3
y3
2
y4
1
0
0
0,2
0,4
0,6
0,8
1
1,2
Рисунок 1.2 - Графики аппроксимирующих функций и экспериментальные точки
3. Сравним полученные результаты. Для этого найдем соответствующие суммарные погрешности.
2
𝑆(𝑎, 𝑏) = ∑11
𝑖=1(∆𝑦𝑖 )
(1.14)
Значения S1, S2, S3, S4 найдем с использованием Excel.
Значения S1
Значения S2
Значения S3
Значения S4
0,074983073
0,08726418
0,006547148
7,83876E-05
0,002699994
0,198217931
0,012100159
0,005227191
0,016929936
0,440188329
0,011896213
0,013382749
0,053912959
0,454316872
0,004426477
0,01401077
0,064652318
0,294714399
0,000118476
0,006455981
0,038551264
0,086450913
0,013287589
2,65651E-06
0,00341305
0,003684726
0,056328354
0,013874627
0,025440928
0,264713836
0,134069263
0,077235271
0,209238151
1,130096885
0,23901481
0,229187519
0,697807971
2,901696765
0,348642737
0,518773854
1,672553641
5,92209912
0,426578144
1,004976308
Вывод
В данной задаче лучшей аппроксимирующей функцией является показательная
функция: y3 = 1,06𝑒 1,61𝑥 .
Раздел 2. Задание 2
Таблица 2.1 – Исходные данные задания 2
№вар.
Интервалы (0,2)
(2,4)
(4,6)
(6,8)
(8,10)
(10,12)
значений
7
Число
8
11
32
28
10
11
попаданий
Произведем оценку ряда. Для этого составим таблицу в Microsoft Excel и найдем
совокупность показатели.
Рисунок 2.1 – Расчеты для задания 2
Средняя взвешенная (выборочная средняя)
𝑥̅ =
∑ 𝑥𝑖 ∗ 𝑓𝑖 8 ∗ 1 + 11 ∗ 3 + 32 ∗ 5 + 28 ∗ 7 + 10 ∗ 9 + 11 ∗ 11 608
=
=
= 6,08.
∑ 𝑓𝑖
100
100
Мода - наиболее часто встречающееся значение признака у единиц данной
совокупности. В симметричных рядах распределения значение моды и медианы
совпадают со средней величиной, а в умеренно асимметричных они соотносятся таким
образом: 3(xср-Me) ≈ xср-Mo
Среднее значение изучаемого признака по способу моментов.
𝑥̅ =
𝑥𝑖 ∗ 𝑓𝑖
∗ ℎ + 𝐴.
∑ 𝑓𝑖
А – условный нуль, равный варианте с максимальной частотой (середина интервала
с максимальной частотой), h – шаг интервала.
𝑥𝑖. =
𝑥𝑖 − 𝐴 𝑥𝑖 − 5
=
ℎ
2
Средний квадрат отклонений по способу моментов.
𝐷=
Тогда
[𝑥𝑖 ]2 ∗𝑓𝑖
∑ 𝑓𝑖
∗ ℎ2 + (𝑥̅ − 𝐴)2
(2.1)
54
𝑥̅ =
∗ 2 + 5 = 6,08.
100
210 2
𝐷=
∗ 2 + (6,08 − 5)2 = 7,234.
100
Найдём среднее квадратическое отклонение.
𝜎 = √𝐷 = √7,234 = 2,69.
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями
признака первичного ряда.
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 12 − 0 = 12
Дисперсия - характеризует меру разброса около ее среднего значения (мера
рассеивания, т.е. отклонения от среднего).
∑(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖 218,16
𝐷=
=
= 2,182.
∑ 𝑓𝑖
100
Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная
дисперсия).
𝑆2 =
∑(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖 723,36
=
= 7,307.
∑ 𝑓𝑖 − 1
99
Каждое значение ряда отличается от среднего значения 6,08 в среднем на 2,69.
Оценка среднеквадратического отклонения.
𝑠 = √𝑆 2 = √7,307 = 2,703.
Показатели формы распределения.
Относительный показатель квартильной вариации –
𝐾𝑞 =
4,375
∗ 100% = 73,68%.
5,938
Степень асимметрии.
Симметричным является распределение, в котором частоты любых двух вариантов,
равностоящих в обе стороны от центра распределения, равны между собой.
Наиболее точным и распространенным показателем асимметрии является
моментный коэффициент асимметрии.
(2.2)
где M3 - центральный момент третьего порядка; s - среднеквадратическое
отклонение.
170,34
= 1,7.
100
1,7
𝐴𝑆 =
= 0,0996.
2,693
𝑀3 =
Положительная величина указывает на наличие правосторонней асимметрии
Оценка существенности показателя асимметрии дается с помощью средней
квадратической ошибки коэффициента асимметрии:
𝑠𝐴𝑠 = √6 ∗
𝑛−2
(𝑛 + 1) ∗ (𝑛 + 3)
Расчет необходимых компонентов произведем в электронной таблице:
Рисунок 2.3 – Продолжение расчетов задания 2
𝑠𝐴𝑠 = √6 ∗
6−2
= 0,617.
(6 + 1) ∗ (6 + 3)
В анализируемом ряду распределения наблюдается несущественная асимметрия
(0,0876/0,617 = 0,14 < 3).
Применяются также структурные показатели (коэффициенты) асимметрии,
характеризующие асимметрию только в центральной части распределения, т.е. основной
массы единиц, и независящие от крайних значений признака. Рассчитаем структурный
коэффициент асимметрии Пирсона:
𝐴𝑠𝑝 = 𝑥 −
Другой
показатель
𝑀0 6,08 − 5,68
=
= 0,15.
𝜎
2,69
асимметрии,
предложенный
шведским
математиком
Линдбергом, исчисляется по формуле:
𝐴𝑠 = П − 50
(2.3)
где П – процент тех значений признака, которые превышают величину средней
арифметической; 50 – процент вариант, превосходящих среднюю арифметическую ряда
нормального распределения..
49
∗ 100 − 50 = −1
100
распределений рассчитывается
𝐴𝑠 =
Для
симметричных
показатель
эксцесса
(островершинности). Эксцесс представляет собой выпад вершины эмпирического
распределения вверх или вниз от вершины кривой нормального распределения.
Чаще всего эксцесс оценивается с помощью показателя:
(2.4)
Для распределений более островершинных (вытянутых), чем нормальное,
показатель эксцесса положительный (Ex > 0), для более плосковершинных (сплюснутых) отрицательный (Ex < 0), т.к. для нормального распределения M4/s4 = 3.
𝑀4 =
𝐸𝑥 =
13553,71
= 135,54.
100
135,54
− 3 = 2,5903 − 3 = −0,41.
2,694
Число 3 вычитается из отношения μ4/ σ4 потому, что для нормального закона
распределения μ4/ σ4 = 3. Таким образом, для нормального распределения эксцесс равен
нулю. Островершинные кривые обладают положительным эксцессом, кривые более
плосковершинные - отрицательным эксцессом.
Ex < 0 - плосковершинное распределение
Для приближенного определения величины эксцесса может быть использована
формула Линдберга:
Es=П-38,29
(2.5)
где П – процент количества вариант, лежащих в интервале, равном половине
среднего квадратического отклонения (в ту и другую сторону от величины средней); 38,29
– процент количества вариант, лежащих в интервале, равном половине среднего
квадратического
отклонения,
в
общем
количестве
вариант
ряда
нормального
распределения.
60
∗ 100 − 38,29 = 21,71.
100
Чтобы оценить существенность эксцесса рассчитывают статистику Ex/sEx
𝐸𝑠 =
где sEx - средняя квадратическая ошибка коэффициента эксцесса.
(2.6)
Если отношение Ex/sEx > 3, то отклонение от нормального распределения считается
существенным.
Ex/sEx = -0.41/0,597 = 0.687.
Поскольку sEx < 3, то отклонение от нормального распределения считается не
существенным.
Построим гистограмму распределения в Microsoft Excel.
Рисунок 2.4 – Гистограмма задания 2
Проверка гипотез о виде распределения
1. Проверим гипотезу о том, что Х распределено по нормальному закону с
помощью критерия согласия Пирсона.
(2.7)
где
pi —
вероятность
попадания
в
i-й
интервал
случайной
величины,
распределенной по гипотетическому закону
Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа
(2.8)
где
s = 2,703, xср = 6,08
Теоретическая (ожидаемая) частота равна fi = fpi, где f = 100
Вероятность попадания в i-й интервал: pi = Ф(x2) - Ф(x1). Расчеты приведены в
электронной таблице.
Рисунок 2.5 – Определение вероятностей
Определим границу критической области.
Так как статистика Пирсона измеряет разницу между эмпирическим и
теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем
сильнее довод против основной гипотезы. Поэтому критическая область для этой
статистики всегда правосторонняя: [Kkp;+∞). Её границу Kkp = χ2(k-r-1;α) находим по
таблицам распределения χ2 и заданным значениям s, k (число интервалов), r=2 (параметры
xcp и s оценены по выборке).
𝐾𝑘𝑝 = 𝜒 2 (6 − 2 − 1; 0,05) = 7,81473; 𝐾набл = 10,7407.
Наблюдаемое значение статистики Пирсона попадает в критическую область:
Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Справедливо
предположение о том, что данные выборки распределены не по нормальному закону.
Проверим гипотезу о том, что Х распределено по нормальному закону с помощью
показателей As и Ex.
В случае нормального распределения справедливо следующее условие: |As| < 3S As;
|A| < 3SAs; |E| < 3SEx
Проверим выполнение этого условия для заданного варианта.
𝑆𝐴𝑠 = 0,6172, 𝑆𝐸𝑥 = 0,5968
𝐴𝑠 = 0,0876, 𝐸𝑥 = −0,41
|0,0876| < 3 ∗ 0,6172 = 1,8516
| − 0,41| < 3 ∗ 0,5968 = 1,7905
Условия выполняются.
Проверку выборочной совокупности на близость ее к нормальному распределению
можно производить, используя статистики χ2, As и Ex.
Скачать