ЛЕКЦИЯ 1 • Классификация экспериментальных исследований • Определение и свойства функции распределения. • Вероятность попадания случайной величины на заданный интервал • Квантиль распределения • Выборочная функция распределения. • Плотность распределения • Оценка математического ожидания • Оценка дисперсии и стандартного отклонения • Мода • Медиана • Эксцесс • Асимметрия • Описательная статистика (программа «Анализ данных») 09.05.2016 1 Классификация экспериментальных исследований • • • Натурные Модельные Имитационные Или • • • Лабораторные Стендовые Промышленные Или • • • Обычные Специальные Уникальные Или • • • • Пассивные Активные Активные управляемые Активно-пассивные https://sites.google.com/site/ingexper/ https://retinskaya.jimdo.com Три основные направления теории эксперимента 1) Подобие и моделирование 2) Математическое планирование активного эксперимента 3) Обработка экспериментальных данных Программа курса. 09.05.2016 3 Понятие дискретной и непрерывной величины Дискретной (прерывной) случайной величиной называют случайную величину, которая может принимать отдельные, изолированные значения с определенными вероятностями. Непрерывной случайной величиной называют случайную величину, которая может принимать все значения из некоторого конечного или бесконечного промежутка. 09.05.2016 4 (ИНТЕГРАЛЬНАЯ) ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ НЕПРЕРЫВНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (distribution function) F(x) = P(X x) 1,2 F(x) 1 0,8 0,6 0,4 0,2 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 x 09.05.2016 5 Свойства функции распределения •неубывающая; •F(-)=0 (невозможное событие); •F(+)=1(достоверное событие). 09.05.2016 6 Вероятность попадания случайной величины на заданный интервал F(x) = P(X x) 1,2 1 )0,8 F(x) F()-F( 0,6 0,4 0,2 0 -5 09.05.2016 -4 -3 -2 -1 0 1 x 2 3 4 5 7 Вероятность попадания случайной величины на заданный интервал P( Х <)=F()-F() Вероятность попадания случайной величины на заданный интервал равна приращению функции распределения на этом интервале. 09.05.2016 8 Квантиль распределения Кванти́ль в математической статистике — число, такое что заданная случайная величина не превышает его лишь с фиксированной вероятностью. x F ( ) -1 1,2 F(x) 1 0,8 0,6 0,4 0,2 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 x 09.05.2016 x 9 Понятие генеральной совокупности (population) Определение 1. Все гипотетически возможное число измерений изучаемой характеристики объекта. Определение 2. Совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений случайной величины, или совокупность результатов всех мыслимых наблюдений, проводимых в неизменных условиях над одной из случайных величин, связанных с данным видом объектов. ПРИМЕРЫ 09.05.2016 10 Выборка (sample) Часть генеральной совокупности (эксперименты, опыты, измерения), которая характеризует генеральную совокупность. Репрезентативная выборка. Примеры. 09.05.2016 11 Виды шкал для измерения данных Номинальная шкала - это категориальная (т.е. качественная, а не количественная) шкала измерения, где каждое значение определяет отдельную категорию, в которую попадают значения переменной Свойства шкалы: каждая категория "отличается" от других, но это отличие не может быть количественно измерено. ПРИМЕРЫ. 09.05.2016 12 Виды шкал для измерения данных Порядковая шкала измерений ранжировать значения переменных. позволяет Свойства шкалы: Измерения в порядковой шкале содержат информацию только о порядке следования величин, но не позволяют сказать "насколько одна величина больше другой", или "насколько она меньше другой". ПРИМЕРЫ. 09.05.2016 13 Виды шкал для измерения данных - Шкала отношений (ratio scale) это количественная шкала для измерения значений переменной, самая информативная шкала. Свойства шкалы : (1) Шкала отношений начинается с абсолютного нуля, то есть нуль шкалы, соответствует нулевому значению меры, переменной, показателя, характеристики объекта исследования. (3) Разница или сумма значений шкалы, соответствуют разнице или сумме значений меры, переменной, показателя, характеристики объекта исследования. (4) Значения шкалы отношений, связанные отношениями пропорции соответствуют отношениям пропорции меры, переменной, показателя, характеристики объекта исследования. ПРИМЕРЫ. 09.05.2016 14 Порядковая статистика пример (дебит скважины м3/сут.) Случайная величина X Вариационный ряд: 09.05.2016 Выборка: x1*= 115 Опыт 1 x1= 135 x2*= 125 Опыт 2 x2= 125 Опыт 3 x3= 145 Опыт 4 x4= 155 Опыт 5 x5= 115 ………………... Опыт n xn= 125 x3*= 125 x4*= 135 …... xn*= 155 15 Выборочная (эмпирическая) функция распределения вариационный ряд из выборки: Х1……Хn X(1)<X(2)<……<X(n) , Fn(x)=P*(Xi<x) P*- частота 1 mi/n х X (1) X(2) X(3) mi - число данных, меньших X(i) n - общее число данных 09.05.2016 16 Пример: построение выборочной функции распределения размера обуви студентов 09.05.2016 17 ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ случайной величины (СВ) Плотность распределения p(x)=F/(x) x F(x)= p(t)dt 09.05.2016 18 Вероятность попадания случайной величины на заданный интервал значений от до -элемент вероятности P( <Х<)= p(x)dx 09.05.2016 19 Свойства плотности 1) площадь под кривой=1 (т.к. сумма вероятностей несовместных событий = 1); 2) всегда лежит выше оси абсцисс, т.к. F(x) неубывающая. 09.05.2016 20 Описательная статистика x1*= 115 Частотное распределение x2*= 125 x3*= 125 1/n x4*= 135 …... xn*= 155 09.05.2016 x1* xср x xn* 21 Описательная статистика p(x) Плотность распределения Частотное распределение x1* xср x xn* Частота результата опыта pi = mi/n 09.05.2016 22 ГИСТОГРАММА – ЭМПИРИЧЕСКАЯ ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ диапазон выборочных значений разбивается на некоторое число равных интервалов и подсчитывается число значений, попадающих в каждый интервал 09.05.2016 23 Алгоритм построения гистограммы 1) Вычисляется размах x max-xmin. 2)Вычисляется число интервалов группирования: k = 1+3.32*log10n (n-длина выборки) При этом 20k6, т.е., если число интервалов в результате расчета больше 20, то принимается число 20, а если меньше 6, то 6. 3)Вычисляется длина интервала группирования D = (x max-xmin)/k 4)Устанавливается правило для значений, попадающих на границу (относить вправо или влево). 09.05.2016 24 Алгоритм построения гистограммы В Excel - СЕРВИС->АНАЛИЗ ДАННЫХ-> ГИСТОГРАММА 09.05.2016 25