РАБОТА 1. РАСПРЕДЕЛЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН Цель работы. Изучить статистические закономерности распределения случайных величин и определить основные характеристики этого распределения. Объектом изучения являются результаты экспериментов, которые неоднозначно определяются условиями опыта. Примером такого эксперимента будет служить регистрация за определенное время квантов фонового гамма-излучения счетчиком Гейгера-Мюллера в радиометре РКСБ-104. Сведения из теории вероятностей В случае, когда результат одного и того же эксперимента может меняться от одного наблюдения к другому непредсказуемым образом о результатах измерений говорят как о случайных величинах. По своей природе многие величины в классической физике являются вполне определенными. Однако из-за влияния случайных факторов в процессе эксперимента результаты измерений – случайные величины. Однако имеются и такие величины, которые случайны по своей природе. Например, число броуновских частиц в поле зрения микроскопа, радиоактивный распад элементов. Предсказать. Сколько броуновских частиц можно увидеть в поле зрения при очередном наблюдении невозможно. Но если проделать достаточно большое количество наблюдений n, а затем спросить сколько раз в поле зрения будет наблюдаться, например А частиц, то можно предсказать вероятность этого события. Пусть А частиц наблюдается m раз. Величину m называют частотой соn бытия, состоящего в наблюдении А частиц. Для каждого события можно указать такое число P , называемое вероятностью этого события, что при длительном повторении одного и того же эксперимента частота рассматриваемого события окажется приблизительно равной P. Если событие А не может произойти ни при каких условиях, то оно называется невозможным и его вероятность равна нулю: P(A) = 0. Если событие обязательно произойдет, то оно называется достоверным и его вероятность принимается равной единице. Вероятность P любого события лежит в интервале [0;1] Рассмотрим, как можно оценить вероятность появления события (событие - любой мыслимый результат эксперимента) из результатов многократно повторённого эксперимента. Ясно, что вследствие случайных ошибок (предполагается, что все систематические ошибки, как постоянные, так и переменные, устранены или пренебрежимо малы) результаты повторных наблюдений будут различаться между собой. Пусть проведено N наблюдений и получено п различных результатов. Естественно, что среди всех результатов наблюдений будут и повторяющиеся. Предположим, что N1 раз повторился результат x1, N2 раз - x2, ..., Nn раз - хп. Величина Ni называется абсолютной частотой появления результата xi. Сумма n Ni N . (1) i 1 Отношение числа появления i-го результата к общему числу наблюдений называется относительной частотой появления этого результата: W xi Ni N . (2) Как показывает опыт, при большом числе наблюдений выражение (2) стремится к определённому пределу, который называется вероятностью осуществления события: Ni N N . P xi lim W xi lim N (3) Если событие А не может произойти ни при каких условиях, то оно называется невозможным и его вероятность равна нулю: P(A)=0. Если событие обязательно произойдет, то оно называется достоверным и его вероятность принимается равной единице. Вероятность Р любого события лежит в интервале [0; 1]. Из (1) следует, что n n i 1 i 1 N i 1 P xi Nlim N . (4) Это соотношение (условие нормировки) отражает вероятность достоверного события, т. е. вероятность получения любого результата при измерении. Для нахождения среднего значения дискретной случайной величины по вероятности появления различных результатов наблюдений используют формулу (5) n 1 n x Ni xi P xi xi N N i 1 i 1 . (5) Если возможные значения случайной величины могут быть любыми на некотором интервале, говорят о непрерывной случайной величине. Поскольку значений величины х бесконечно много, то вероятность конкретного значения равна нулю, но можно говорить о вероятности попадания результата наблюдения в некоторый интервал. Разобьём всю область значений величины х на одинаковые интервалы шириной х каждый. Найдём число наблюдений Ni, попадающих в каждый i-й интервал, их относительную частоту появления Ni/N. Результаты представим графически (рис. 1.1). По оси абсцисс отложим значение величины х, а относительную частоту Ni/N представим высотой полоски, построенной на интервале xi как на основании. Всю совокупность полученных прямоугольных полосок ограничим сверху ломаной ступенчатой линией. Эта линия (она называется гистограммой) и характеризует распределение результатов данной серии наблюдений. Рис. 1.1 Рис. 1.2 При большом числе наблюдений на гистограмме проявляются основные статистические закономерности: 1. полученные в наблюдениях значения измеряемой величины симметрично распределяются около некоторого среднего значения <x>; 2. большие отклонения от среднего встречаются реже, чем малые. Если число наблюдений мало (рис. 1.2), то построить гистограмму трудно или вовсе невозможно. Среднее значение <x> при этом может быть далёким от истинного xист. Если же увеличивать число наблюдений N и одновременно уменьшать ширину интервала х, то в пределе при х0 и N ступенчатая линия превратится в плавную кривую (см. рис. 1.1). Эта кривая характеризует истинное распределение результатов измерений, которое можно получить данным методом при бесконечно большом числе наблюдений. Рис. 1.3 Рис. 1.4 Если при построении гистограммы по оси ординат откладывать частоту появления результата, отнесённую к единичному интервалу, т. е. плотность частоты Ni/(Nx), то получающаяся в пределе кривая (рис. 1.3) будет характеризовать распределение плотности вероятности получения результата хизм=х. Ордината этой кривой — плотность вероятности f x dP x Ni lim lim x 0 N N x , dx (6) где dP x f x dx — вероятность того, что результат наблюдения xизм окажется в пределах от х до x+dx (см. рис. 1.3). Площадь под кривой f(x) имеет смысл вероятности получения хоть какогонибудь результата измерения. Поэтому она равна единице: f x dx dP x 1 . (7) Здесь интегрирование проводится по всему интервалу возможных значений величины х. Формула (7) - аналог формулы (4). Она является условием нормировки для непрерывной случайной величины. Таким образом, со случайной величиной ζ связана некоторая функция f(x), называемая функцией плотности вероятности (или функцией плотности), такая, что величина f(x)dx пропорциональна вероятности события, состоящего в том, что величина ζ заключена в интервал x (x+dx). Вероятность того, что измеренное значение будет лежать в интервале [x1; x2], равна P x1 x x2 x2 f x dx x1 . Среднее значение измеряемой величины вычисляется по формуле, аналогичной (5): x xdP x x f x dx . (8) (9) Для случайной величины ζ вводят также функцию F(x); которая называется функцией распределения: F x p x x f x dx . Функция распределения в данной точке x равна вероятности того, что случайная величина меньше x. График этой функции – монотонная кривая, возрастающая от 0 до 1. Функцию распределения можно характеризовать параметром, показывающим насколько широко разбросаны значения случайной величины относительно «центра» распределения. Мерой. Характеризующей рассеяние случайной величины (расброс), является дисперсия D(x), которая определяется согласно формуле: D x x f x dx M x 2 2 2 . Здесь M(x), математическое ожидание, которое определяется по формуле: M x xf x dx . В случае дискретной случайной величины ζ M x Pi xi i (Pi – вероятность значения xi, - результат вычислений суммы). Формулу (№) можно переписать в виде (№) 1 n M x xi . n i 1 Квадратный корень дисперсии, т.е. величины называется среднеквадратичным отклонением. В пределе при N среднее значение x xèñò . Поэтому ели перенести начало координат в точку x xèñò , то пот оси абсцисс вместо x в том же масштабе будет отложена ошибка x, а по оси ординат – плотность вероятности f(x) получения ошибки x. Кривая распределения характеризует точность эксперимента. Чем острее и выше пик кривой (рис. 1.4), тем меньше ошибки (выше точность). Пологая кривая отражает наличие больших случайных ошибок. Покажем теперь, что среднее значение x равно истинному xèñò . Истинная абсолютная ошибка x является случайной величиной, характеризующейся некоторым распределением плотности вероятности f(x) . Распределение ошибок x подчиняется следующим закономерностям. 1. При большом числе наблюдений одинаковые по величине, но противоположные по знаку случайные ошибки встречаются одинаково часто. Математически это значит, что f(x) = f(-x). 2. Большие по абсолютной величине ошибки встречаются реже, чем малые, т.е. f x1 f x2 , если x1 x2 . Одним из часто встречающихся на практике распределений, обладающих такими свойствами, является распределение x x 2 x2 1 1 ист . f x exp 2 exp 2 2 2 2 2 (11) Счетчик Гейгера-Мюллера в радиометре РКСБ-104 является источником статистически независимых электрических сигналов. Поэтому регистрируемое прибором за определенное время количество гамма-квантов фонового радиоактивного излучения не постоянно, а изменяется статистически независимым образом от опыта к опыту. Ошибки определения частоты вызываются непостоянством во времени следования импульсов и носят случайный характер. Построение графика распределения случайных величин 1. Регистрируют достаточно большое (не менее 100) число наблюдений п частоты генератора. 2. Находят их наименьшее Nmin и наибольше Nmax значения. Весь диапазон наблюдаемых значений разбивают на 10–15 равных интервалов. Пусть Nmin=5 имп/, a Nmax=15 имп/, где -время измерения (для указанного радиометра около 15 сек). Для удобства последующей обработки полученный интервал частот несколько расширяют: [4;16] имп/. Расширенный таким образом диапазон составляет 16 имп/ -4 имп/ =12 имп/. Его удобно разбить на 8 интервалов по 2 имп/ каждый: [4; 6[, [6; 8[ и т. д. 3. Для каждого интервала подсчитывают абсолютную частоту появления результата, т. е. число наблюдений, результаты которых попадают в данный интервал. Разделив абсолютную частоту на полное число наблюдений п, получают относительную частоту появления результата в данном интервале. 4. На ось абсцисс наносят шкалу частот и разбивают её на интервалы шириной 2 имп. На каждом интервале строят прямоугольник, высота которого равна частоте (абсолютной или относительной) появления результата в данном интервале. Строят гистограмму, для чего всю совокупность построенных прямоугольников сверху ограничивают ломаной ступенчатой линией (см. рис. 1.1). Соединив середины верхних сторон прямоугольников плавной линией, получают экспериментальную кривую распределения результатов измерения. Кривую (или гистограмму) распределения результатов можно превратить в кривую (или гистограмму) распределения ошибок. Для этого начало координат совмещают со средним значением частоты (см. рис. 1.3), а на ось абсцисс, не меняя масштаба, наносят шкалу результатов измерения. Кривая распределения результатов дает сведения о вероятности появления того или иного значения частоты. Задание 1. Изучить инструкции к радиометру РКСБ-104. Включить блок питания и радиометр. 2. Зарегистрировать не менее ста значений для фоновой интенсивности потока гамма квантов. 3. Вычислить среднее значение частоты и стандартное отклонение единичного измерения. 4. Определить случайные отклонения отдельных наблюдений от среднего значения. 5. Построить гистограмму и кривую распределения результатов измерения. 6. Нанести на ось абсцисс шкалу результатов. Сделать качественные выводы о свойствах их распределения. 7. По графику распределения ошибок найти число наблюдений, попавших в интервалы [ ; ] и [ 2 ; 2 ]. Контрольные вопросы 1. Какие ошибки возможны при прямых измерениях? 2. От чего зависит величина дисперсии, стандартного отклонения? 3. Что такое доверительный интервал, доверительная вероятность? Гистограмма строится следующим образом. Диапазон имеющихся значений случайной величины разбивают на некоторое произвольное число равных интервалов и выписывают последовательно один под другим эти интервалы в первом столбце таблицы. Затем последовательно перебирают все значения случайной величины и смотрят, в какой интервал попадает каждое значение. Во втором столбце таблицы в строке, соответствующей найденному интервалу ставят какой либо условный знак (крестик). Подсчитывают число крестиков в каждой строке и записывают полученное значение (третий столбец таблицы). Обозначают интервалы на оси абсцисс и по оси ординат над каждым интервалом откладывают высоту, равную числу знаков в третем столбце. Рисуют прямоугольник. Полученная система прямоугольников образует гистограмму. Соединив середины верхних сторон прямоугольников получают кривую, которая мало отличается от графика функции плотности случайной величины.