Лабораторная работа №3 Выборка. Вариационный ряд. Таблица частот (статистический ряд распределения). Числовые характеристики: выборочное среднее, медиана, выборочная дисперсия, выборочное среднеквадратичное отклонение. Графическое представление диаграмма Парето, кривая Лоренца. выборки: полигон, гистограмма, Выборочной медианой называется число Ме, которое делит вариационный ряд на две части, содержащие равное число элементов. Если объём выборки n – нечётное число (т.е. n=2k+1), Ме=xk+1, то есть является элементом вариационного ряда со средним номером. Если n=2k, Ме=(xk+xk+1)/2. Задание1. Определить объём выборки n. Построить вариационный ряд, таблицу частот, полигон, гистограмму. Вычислить медиану, среднее, дисперсию и среднеквадратичное отклонение вручную и с использованием MS Excel для следующих выборок. Номер выборки 1 7 Элементы выборки 3 3 6 4 5 1 2 1 2 3 4 5 5 9 3 1 2 3 4 5 5 12 4 3,1 3,0 1,5 1,8 2,5 3,1 2,4 2 1 2,8 1,3 3 Рассмотрим 1-ю выборку X={7,3,3,6,4,5,1,2,1,3}. Решение. Определим объём выборки n . Объём выборки равен 10, n=10. Построим вариационный ряд: 1,1,2,3,3,3,4,5,6,7. Определяем значение k: n=2 k=10. Следовательно, k=5. Таким образом, Ме=(3+3)/2=3. Задачи. Распределение скорости автомобилей на одном из участков шоссе (км/ч.) Границы интервалов Частоты 61-65 65-69 69-73 73-77 77-81 1 4 5 8 14 Замечание. Если задана таблица с интервалами (выборка разбита на интервалы), то за значения выборки берут середины интервала, например, для вычисления среднего. Это конечно приведёт искажению результата, т.е. вычисления проведённые по исходной выборке и по интервальной будут различаться. Задача 3. Время выполнения упражнения (сек.) Границы интервалов Частоты 8,95-9,05 9,05-9,15 9,15-9,25 9,25-9,35 4 8 11 7 Задача 4. Имеются следующие данные о возрастном составе студентов группы заочного отделения ВУЗа (лет): 19; 19; 19; 20; 20; 20; 20; 20; 20; 20; 20; 20; 21; 21; 21; 22; 23; 23; 24; 25; 25; 25; 26; 27; 29. Для анализа распределения студентов по возрасту требуется: 1) построить ряд распределения и его графики (полигон, гистограмму, накопленных частот); 2) рассчитать модальный, медианный и средний возраст, установить его типичность с помощью коэффициентов вариации. Пример. С производственной линии случайным образом 36 раз отбирали 10 единиц некоторого изделия. Каждый раз отмечалось число дефектных изделий. Получена выборка см. табл.1: Таблица 1. Выборка 0 0 1 0 2 0 1 2 1 0 0 0 0 3 1 0 0 0 0 2 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 1 Пример. У 50 новорождённых измерили массу тела с точностью до 10 г. Результаты (в кг.) таковы: 3,7 3,85 3,7 3,78 3,6 4,45 4,2 3,87 3,33 3,76 3,75 4,03 3,75 4,18 3,8 4,75 3,25 4,1 3,55 3,35 3,38 3,3 4,15 3,95 3,5 3,88 3,71 3,15 4,15 3,8 4,22 3,75 3,58 3,55 4,08 4,03 3,24 4,05 3,56 3,05 3,58 3,98 3,88 3,78 4,05 3,4 3,8 3,06 4,38 4,2 Находим наименьшее значение выборки. Оно равно 3.05 кг. Находим наибольшее значение выборки. Оно равно 4.75 кг. Размах выборки равен h=4.75-3.05=1.7. Число интервалов k равно 5. Использование функций MS Excel. Функции: СЧЕТЗ(Диапазон), СЧЕТЕСЛИ(Диапазон; Критерий), Описательная статистика в Анализе данных используется для определения числовых характеристик выборки: выборочное среднее, выборочная дисперсия и т.д. Функцию СЧЕТЗ() использовать для определения объёма выборки n. Функцию СЧЕТЕСЛИ() использовать для подсчёта частот вариант в выборке.