3.3. Сглаживание экспериментальных зависимостей методом наименьших квадратов Пусть проводится некоторый опыт, целью которого является исследование зависимости определённой физической величины от другой ( y от x ). Будем предполагать, что величины y и x связаны функциональной зависимостью y x . Вид этой зависимости и требуется определить из опыта. Предположим сначала, что зависимость y x известна и в результате опыта получен ряд экспериментальных точек xi , yi . Обычно эти точки не ложатся точно на график функции y x . Всегда имеется некоторый разброс, то есть обнаруживаются случайные отклонения от этой функциональной зависимости. Эти отклонения связаны с неизбежными при любом опыте ошибками. Возникает естественный вопрос, как, не зная зависимости y x , наилучшим образом воспроизвести эту зависимость по полученным экспериментальным данным. Простое проведение через все экспериментальные точки некоторой кривой, являющейся графиком определённой функции, лишено смысла. Вид этой зависимости будет меняться от одной серии измерений к другой, а в некоторых случаях её в принципе нельзя получить (несколько экспериментальных точек могут иметь одинаковые абсциссы и разные ординаты). В этом случае возникает типичная для практики задача сглаживания экспериментальных зависимостей, то есть требуется найти такую функцию y x , чтобы она некоторым наилучшим образом отражала функциональную зависимость y от x , и вместе с тем были бы сглажены случайные незакономерные отклонения измерений, связанные с неизбежными погрешностями самих измерений. К счастью, обычно ситуация облегчается тем, что из теоретических или других соображений, связанных с существом рассматриваемой задачи, и даже по полученному экспериментальному материалу можно указать вид функциональной зависимости y от x (линейная, квадратичная, показательная или какая-нибудь другая функция). Требуется только установить численные значения параметров этой зависимости. Именно задачу рационального выбора таких числовых значений параметров мы и рассмотрим. Итак, пусть имеются результаты n независимых измерений – опытные точки xi , yi , где i 1,..., n. Из теоретических или иных соображений с точностью до неизвестных параметров (для простоты мы ограничимся двумя) a и b известна функциональная зависимость y от x , то есть y x, a, b . (3.10) Экспериментальные точки отклоняются от этой зависимости вследствие неизбежных ошибок измерений. Ранее мы отмечали, что ошибки измерений распределены по нормальному закону. Рассмотрим некоторое значение независимой переменной xi . Результат измерений может рассматриваться как нормально распределённая случайная величина i с математическим ожиданием xi , a, b и среднеквадратическим отклонением i , характеризующим ошибку измерений. Предположим дополнительно, что точность измерений во всех точках одинакова, то есть i . Тогда плотность вероятности случайной величины i имеет вид y x ,a,b i i f yi i 1 e 2 2 2 . В результате получена n-мерная случайная величина (3.11) 1,...,n , компоненты которой независимы и плотности вероятности и плотности вероятности которых определяются по формуле (3.2). Как было показано ранее, плотность вероятности системы независимых случайных величин равна произведению плотностей вероятности компонент: f ,...,n y1,... yn , a, b 1 1 e n 1 2 yi xi ,a,b 2 i1 2 . (3.12) 2 2 Теперь для определения параметров a и b воспользуемся идеей метода максимального правдоподобия, согласно которой в эксперименте реализуются те значения компонент, при которых плотность вероятности системы (3.12) близка к максимальному значению. Учитывая специальный вид функции (3.12), можно заметить, что она достигает максимума тогда, когда показатель степени принимает минимальное значение. Отбрасывая постоянный множитель задаче отыскания минимума выражения 13 yi i 1 xi , a,b 1 , приходим к 2 2 2 . (3.13) Поскольку минимизируется сумма квадратов разностей экспериментальных и теоретических значений функции (их называют навязками), предложенную процедуру называют методом наименьших квадратов. Задача сводится к решению двух уравнений: n y a i 1 i n yi b i 1 xi , a,b 2 xi , a,b 2 0; (3.14) 0. Если функциональная зависимость (3.10) линейна относительно параметров a и b , то система уравнений (3.14) также будет линейной и её решение можно найти обычным способом. Пример 3. Проведена серия опытов по определению влияния дозы внесённых удобрений на повышение урожайности пшеницы. Соответствующие данные приведены в первых трёх столбцах таблицы ( x – внесённая доза удобрений в центнерах на гектар, y –прирост урожайности в центнерах с гектара). i 1 2 3 4 5 6 7 8 9 10 11 12 13 1 13 13 i1 xi yi xi2 yi2 xi yi 0.342 0.417 0.675 0.867 1.000 1.158 1.283 1.500 1.733 2.008 2.083 2.242 2.508 2.10 4.70 6.05 8.65 10.00 12.60 12.08 14.68 16.65 19.25 19.98 23.20 23.93 0.1170 0.1739 0.4556 0.7517 1.0000 1.3410 1.6461 2.2500 3.0033 4.0321 4.3389 5.0266 6.2901 4.41 22.09 36.60 74.82 100.00 158.76 145.93 215.50 277.22 370.56 399.20 538.24 572.64 0.718 1.960 4.084 7.500 10.000 14.591 15.499 22.020 28.854 38.654 41.618 52.014 60.016 1.370 13.37 2.3405 224.31 22.887 Требуется по методу наименьших квадратов подобрать линейную функцию, выражающую y через x . Решение. Искомые величины связаны линейной зависимостью y ax b , коэффициенты которой требуется определить. Соотношение (3.13) в этом случае принимает вид: yi axi b i 1 n 2 , а система уравнений (3.14) представляется в виде: 13 a i 1 13 b i 1 yi axi b 0; 13 2 yi axi b xi 0; i 1 13 yi axi b 0. 2 i 1 yi axi b 2 2 0. Раскрывая скобки и группируя, в результате получаем следующую систему линейных уравнений для определения a и b : 13 13 13 2 a 1 1 b 1 x x xi yi ; i i 13 13 13 i 1 i 1 i 1 1 13 1 13 y . x a b 13 i 1 i 13 i1 i Решая эту систему методом исключения (Гаусса), в итоге получаем: a 9.86; b 0.14 y 9.86x 0.14. Во многих приложениях часто используются зависимости вида y a x k b , линейные относительно параметров a и b 1 x (в частности, y a b при k 1), где k – известная константа. В этом случае задача легко сводится к предыдущей заменой переменной u xk .