Институт экономики, управления и права (г. Казань) Зеленодольский филиал Кафедра высшей математики Контрольная работа по дисциплине «Основы математической обработки информации» Вариант № Работу выполнил (ла) студент (ка) группы № _____ заочной (очной) формы обучения Ф.И.О.______________________ Работу проверил (а)____________ Ф.И.О. преподавателя дисциплины направления подготовки 050100.62 «Педагогическое образование» Квалификация (степень) выпускника Бакалавр Зеленодольск – 2014 Задание №1. Пусть дана последовательность значений некоторого признака: 182; 184; 176; 177; 180; 184; 186; 186; 179; 190; 170; 172; 185; 184; 182; 180; 177; 176;172; 189; 174; 176; 172; 174; 175; 182; 186; 186; 183; 165; 177; 172. Выполните статистическую обработку данных по следующей схеме: 1. выполнить ранжирование признака и составить безинтервальный вариационный ряд распределения; 2. составить равноинтервальный вариационный ряд, разбив всю вариацию на k интервалов (k = 5); 3. построить гистограмму распределения; 4. найти числовые характеристики выборочной совокупности: характеристики положения (выборочную среднюю, моду, медиану); характеристики рассеяния (выборочную дисперсию, среднеквадратическое отклонение); 5. найти доверительный интервал для генеральной средней Х г. Принять уровень значимости α = 0,05. Решение: 1) Выполним ранжирование признака 165; 170; 172; 172; 172; 172; 174; 174; 175; 176; 176; 176; 177; 177; 177; 179; 180; 180; 182; 182; 182; 183; 184; 184; 184; 185; 186; 186; 186; 186; 189; 190. Составим безинтервальный вариационный ряд распределения при n = 32 i xi mi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 165 170 172 174 175 176 177 179 180 182 183 184 185 186 189 190 1 1 4 2 1 3 3 1 2 3 1 3 1 4 1 1 2) Составим равноинтервальный вариационный ряд, разбив всю вариацию на k интервалов (k=5) Определим в данной выборке xmax = 190; xmin = 165 Рассчитаем ширину частичного интервала ℎ = 𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛 𝑘 = 25 5 = 5, где k – число равных интервалов. Определим частоту вариант, попавших в соответствующий частичный интервал и относительную частоту. № интервала 1 2 3 4 Частичный интервал 165-174 174-177 177-182 182-185 Частота вариант mi 8 7 6 5 2 Относительная частота 𝑝𝑖∗ 8/32 = 0,25 7/32 = 0,22 6/32 = 0,19 5/32 = 0,16 5 185-190 6 6/32 = 0,19 3) Построим гистограмму относительных частот распределения, отложив по * оси абсцисс (xi) интервалы, по оси ординат ( pi ) относительные частоты (смотри рис.1.). Рис.1. Гистограмма относительных частот распределения 4) Рассчитаем числовые характеристики выборочной совокупности 𝑥̅В = ∑ 𝑥𝑖 𝑚𝑖 165 ∗ 1 + 170 ∗ 1 + 172 ∗ 4 + 174 ∗ 2 + 175 ∗ 1 + 176 ∗ 3 = + 𝑛 32 177 ∗ 3 + 179 ∗ 1 + 180 ∗ 2 + 182 ∗ 3 + 183 ∗ 1 + 184 ∗ 3 + 185 ∗ 1 + 32 186 ∗ 4 + 189 ∗ 1 + 190 ∗ 1 + = 179,16 32 + ∑(𝑥𝑖 − 𝑥̅в )2 𝑚𝑖 (165 − 179,16)2 ∗ 1 + (170 − 179,16)2 ∗ 1 𝐷В = = + 𝑛 32 (172 − 179,16)2 ∗ 4 + (174 − 179,16)2 ∗ 2 + (175 − 179,16)2 ∗ 1 + + 32 (176 − 179,16)2 ∗ 3 + (177 − 179,16)2 ∗ 3 + (179 − 179,16)2 ∗ 1 + + 32 (180 − 179,16)2 ∗ 2 + (182 − 179,16)2 ∗ 3 + (183 − 179,16)2 ∗ 1 + + 32 (184 − 179,16)2 ∗ 3 + (185 − 179,16)2 ∗ 1 + (186 − 179,16)2 ∗ 4 + + 32 3 (189 − 179,16)2 ∗ 1 + (190 − 179,16)2 ∗ 1 1150,2192 + = = 35,94435 32 32 𝜎В = √𝐷В = √35,94435 = 6 Мода: Ряд называется полимодальным, если есть несколько значений признака, которые встречаются одинаково часто. Для полимодального ряда моду не вычисляют. Медиана: Если выборка содержит четное число членов, то ранг медианы равен 𝑅𝑀𝑒 = 32+1 2 = 16,5. Медианой в этом случае может быть любое число между 16-м и 17-м членами ряда. 5) Рассчитаем границы доверительного интервала для среднего значения (математического ожидания ) 𝑥̅В , принимая уровень значимости α = 0,05. Вычислим исправленную дисперсию по формуле ∑(𝑥𝑖 − 𝑥̅в )2 𝑚𝑖 1150,2192 1150,2192 2 𝑆 = = = = 37,1038 𝑛−1 32 − 1 31 Найдем исправленное среднее квадратическое отклонение 𝑆 = √𝑆 2 = √37,1038 = 6,09 По таблице приложения (основной литературы) определим значение коэффициента Стьюдента tα,n= 2,037 при α = 0,05 n = 32 Определим точность оценки по формуле 𝛿 = 𝑡𝛼,𝑛 𝛿 = 2,037 ∗ 𝑆 √𝑛 6,09 = 2,19 √32 ( 𝑥̅В – δ< μ< 𝑥̅В + δ) (179,16 – 2,19 < μ < 179,16 + 2,19) или (176,97; 181,35) Ответ: 𝑥̅В = 179,16; М0 = –; me = –; Dв = 35,94435; σв = 6; (176,97; 181,35) – доверительный интервал для генеральной средней Х г. Задание №2. Вычислить выборочный коэффициент корреляции по следующим данным: xi 10 11 12 13 14 15 16 yi 2 2 3 3 4 5 6 Проверить его значимость с надежностью 0,95. Решение: Рассчитаем величины, входящие в формулу выборочного коэффициента корреляции 4 𝑥̅ = 10 + 11 + 12 + 13 + 14 + 15 + 16 91 = = 13 7 7 𝑦̅ = 2 + 2 + 3 + 3 + 4 + 5 + 6 25 = = 3,6 7 7 = 10,7 ∑ 𝑥𝑖 𝑦𝑖 = 10 ∗ 2 + 11 ∗ 2 + 12 ∗ 3 + 13 ∗ 3 + 14 ∗ 4 + 15 ∗ 5 + 16 ∗ 6 = = 344 𝜎𝑥 = √𝐷𝑥 = √ (10 − 13)2 + (11 − 13)2 + (12 − 13)2 + (13 − 13)2 + 7 +(14 − 13)2 + (15 − 13)2 + (16 − 13)2 28 √ = √ = √4 = 2 7 7 (2 − 3,6)2 + (2 − 3,6)2 + (3 − 3,6)2 + (3 − 3,6)2 + 𝜎𝑦 = √𝐷𝑦 = √ 7 +(4 − 3,6)2 + (5 − 3,6)2 + (6 − 3,6)2 13,72 √ =√ = √1,96 = 1,4 7 7 Подставим вычисленные величины в формулу для выборочного коэффициента корреляции 𝑟В = 344 − 7 ∗ 13 ∗ 3,6 = 0,84 7 ∗ 2 ∗ 1,4 При заданном уровне значимости p = 0,95 необходимо вычислить наблюдаемое значение критерия 𝑛−2 7−2 √ 𝑡набл = 𝑟В ∗ √ = 0,84 ∗ = 3,49 1 − 0,71 1 − 𝑟В2 Величина t имеет распределение Стьюдента с k = n – 2 степенями свободы. По таблице приложения (основной литературы) критических точек распределения Стьюдента, по заданному уровню значимости p = 0,95 и числу степеней свободы k = 5 находим критическую точку tкр(p;k) = 0,066. 5 Если |tнабл| < tкр, то совокупности Х и У линейно не коррелированы, если |tнабл| > tкр, то совокупности Х и У линейно коррелированны. В нашем случае |tнабл| = 3,49, tкр = 0,066. Т.к. 3,49 > 0,066, то совокупности Х и У линейно коррелированны. Ответ: 𝑟В =0,84 – выборочный коэффициент корреляции значим. Задание №3. Пяти дошкольникам предъявляют тест. Фиксируется время решения каждого задания. Будут ли найдены статистически значимые различия между временем решения первых трёх заданий теста? № Время решения Время решения Время решения испытуемых первого задания второго задания третьего задания п/п теста (в сек.). теста (в сек.). теста (в сек.). 1 9 4 12 2 11 6 18 3 10 5 24 4 12 6 20 5 9 5 23 Решение: Методом дисперсионного анализа при уровне значимости α = 0,05 проверим нулевую гипотезу (Hо) о существовании статистически значимых различий между временем решения первых трёх заданий теста у пяти дошкольников. Рассмотрим таблицу условия задания, в которой найдем среднее время решения каждого из трех заданий теста № Время решения Время решения Время решения испытуемых первого задания второго задания третьего задания п/п теста (в сек.). теста (в сек.). теста (в сек.). 1 9 4 12 2 11 6 18 3 10 5 24 4 12 6 20 5 9 5 23 групповая 10,2 5,2 19,4 средняя Находим общую среднюю: 6 𝑥̅ = 10,2 + 5,2 + 19,4 = 11,6 3 Рассчитаем общую сумму квадратов отклонений вариант от общей средней по формуле pq x x Rобщ ij j 1 i 1 p q 2 2 , где р – число измерений времени решений заданий теста, q – количество испытуемых. Для этого составим таблицу квадратов вариант № Время решения Время решения Время решения испытуемых первого задания второго задания третьего задания п/п теста (в сек.). теста (в сек.). теста (в сек.). 1 81 16 144 2 121 36 324 3 100 25 576 4 144 36 400 5 81 25 529 527 138 1973 𝑅общ = 527 + 138 + 1973 − 3 ∗ 5 ∗ (11,6)2 = 2638 − 2018,4 = 619,6 Рассчитаем факторную сумму квадратов отклонений групповых средних от общей средней, которая и характеризует значимость данного фактора, т.е. различия между временем решения первых трёх заданий теста, по следующей формуле R факт p q j 1 x 2 rj p x 2 𝑅факт = 5 ∗ (10,22 + 5,22 + 19,42 − 3 ∗ 11,62 ) = 5 ∗ (104,04 + 27,04 + +376,36 − 403,68) = 518,8 Остаточная сумма квадратов отклонений получается как разность 𝑅ост = 𝑅общ − 𝑅факт = 619,6 − 518,8 = 100,8 Определяем факторную и остаточную дисперсии 𝑅факт 518,8 2 = = 259,4 (𝑆факт )= 𝑝−1 2 2 ) (𝑆ост = 𝑅ост 100,8 = = 8,4 𝑝 ∗ (𝑞 − 1) 12 Находим 𝑓набл = 2 𝑆факт 2 𝑆ост = 259,4 8,4 = 30,88 Для уровня значимости α = 0,05 и чисел степеней свободы 2 и 12 находим f крит из таблицы распределения Фишера – Снедекора 𝑓крит (0,05; 2; 12) = 3,89 7 В связи с тем, что f набл f крит , то с вероятностью α основная гипотеза о незначимости коэффициента множественной регрессии отклоняется, и он признается значимым. Ответ: При предъявлении теста пяти дошкольникам фиксируемое время решения каждого задания является статистически значимым между временем решения первых трёх заданий теста. 8