2009 год Descriptive Statistics N Minimum Maximum Mean Std. Deviation Мясо 2009 80 37 105 64,36 11,550 Молоко 2009 80 63 368 238,16 52,413 Яйца 2009 80 83 327 244,44 50,620 Сахар 2009 80 24 58 38,03 7,058 Картоф 2009 80 42 202 113,61 32,391 Овощи 2009 80 12 202 100,70 26,395 Рмасло 2009 80 6,9 19,6 12,279 2,4082 Хлеб 2009 80 63 165 119,24 15,877 Valid N (listwise) 80 По таблице описательные статистики мы можем видеть, что минимальное и максимальное потребление некоторых видов товаров отличаются по регионам в несколько раз. Как пример Овощи в 16,8 раз или масло яйца в 4 раза. Меньшее потребление одних продуктов должно компенсироваться большим потреблением других. Для изучения таких взаимосвязей вычислим корреляции показателей потребления. Correlations Мясо 2009 Мясо Молоко 2009 2009 Pearson Correlation Молоко 2009 2009 2009 2009 2009 2009 ,079 ,026 ,001 ,006 ,485 ,821 80 80 80 -,036 ,194 ,134 ,085 ,235 ,754 80 80 80 80 1 ,441** ,054 ,215 ,166 ,002 ,275* Sig. (2-tailed) ,001 ,000 ,637 ,056 ,142 ,989 ,013 80 80 Pearson Correlation ,303** ,441** Sig. (2-tailed) ,006 ,000 80 80 80 ,079 ,054 ,171 Sig. (2-tailed) ,485 ,637 ,130 80 80 ,026 ,215 ,169 Sig. (2-tailed) ,821 ,056 ,134 Pearson Correlation -,036 ,166 80 80 80 80 ,169 ,240* ,285* ,136 ,130 ,134 ,032 ,010 ,230 80 80 1 80 80 ,341** ,088 ,067 ,002 80 80 ,892 ,252 80 ,130 80 -,223* ,343** 1 ,130 80 80 ,206 80 -,015 ,192 80 -,015 ,192 ,892 80 ,240* 80 1 ,171 80 Pearson Correlation 80 80 80 Pearson Correlation N Овощи 2009 Хлеб ,363** N Картоф 2009 Рмасло Pearson Correlation N Сахар 2009 Овощи ,303** 80 N Яйца 2009 Картоф 1 ,363** Sig. (2-tailed) N Яйца 2009 Сахар ,047 80 1 ,028 ,002 80 80 ,228* Sig. (2-tailed) ,754 N Рмасло 2009 80 ,032 80 ,088 80 ,194 ,002 ,285* ,206 Sig. (2-tailed) ,085 ,989 ,010 ,067 80 ,252 80 Pearson Correlation N Хлеб 2009 ,142 80 ,804 80 80 -,223* ,028 ,047 80 80 80 ,275* ,136 ,341** ,343** ,228* Sig. (2-tailed) ,235 ,013 ,230 ,002 ,002 ,042 80 80 80 80 1 -,139 ,219 80 ,134 80 80 ,804 Pearson Correlation N ,042 80 80 80 -,139 1 80 80 ,219 80 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). Матрица корреляции показывает, что среди параметров нет строгой линейной зависимости. Наиболее сильная линейная зависимость присутствует между потреблением молока и яиц с коэффициентом корреляции 0,441 . Кроме этой пары признаков сильно коррелированы хлеб и картофель (коэффициент 0,343), также сильно коррелированы хлеб и сахар (коэффициент 0,341) и молоко с мясом (коэффициент 0,363). Кроме того, по матрице корреляций можем сказать, что потребление овощей положительно слабо коррелировано с потреблением яиц, сахара и хлеба, а про остальные продукты мы ничего не можем сказать. Иными словами, регионы, потребляющие больше овощей, имеют тенденцию потреблять больше яиц, сахара и хлеба. Так как матрица корреляций значимо отличается от единичной, для изучения структуры потребления можно применять метод главных компонент. Анализ будем проводить для исходных показателей, и главные компоненты будут выделены на основе матрицы корреляций. Total Variance Explained Initial Eigenvalues Compo nent Total % of Variance Extraction Sums of Squared Loadings Cumulative % Total % of Variance Cumulative % 1 2,207 27,586 27,586 2,207 27,586 27,586 2 1,486 18,574 46,160 1,486 18,574 46,160 3 1,195 14,933 61,093 1,195 14,933 61,093 4 ,919 11,488 72,581 5 ,712 8,894 81,475 6 ,580 7,245 88,720 7 ,480 6,001 94,721 8 ,422 5,279 100,000 Extraction Method: Principal Component Analysis. Из таблицы доли объясненной дисперсии следует, что дисперсии первых трех главных компонент составляют 2,207, 1,486 и 1,195 и согласно запросу на критерий Кайзера с целью снижения размерности извлечены первые три компоненты (только их дисперсии превышают единицу). При этом первая главная компонента объясняет 27,5% суммарной дисперсии, вторая еще 18,5%, третья еще 14,9%. И тремя компонентами вместе объяснены 60,9% суммарной дисперсии стандартизованных показателей потребления. На рисунке показан график «каменистой осыпи». График свидетельствует в пользу извлечения лишь одной – первой главной компоненты, т.к. дисперсии остальных компонент заметно меньше. Вместе с тем с целью извлечь три главные компоненты (по критерию Кайзера) или даже четыре (так как дисперсии третьей и четвертой компоненты почти одинаковы). Communalities Initial Extraction Мясо 2009 1,000 ,579 Молоко 2009 1,000 ,664 Яйца 2009 1,000 ,611 Сахар 2009 1,000 ,691 Картоф 2009 1,000 ,587 Овощи 2009 1,000 ,419 Рмасло 2009 1,000 ,702 Хлеб 2009 1,000 ,634 Extraction Method: Principal Component Analysis. Из таблицы Общностей мы видим, что наилучшим образом учтена дисперсия стандартизованного потребления рмасла, молоко и сахара (70,2%, 66,4%, 69,1% ) и достаточно полно учтена дисперсия потребления хлеба и яиц (63,4% и 61,1%).Изменчивость показателей потребления остальных видов продуктов учтена в меньшей степени (57,9%, 58,7% и 41,9%) (критерий разделения 60%). Component Score Coefficient Matrix Component 1 2 3 Мясо 2009 ,231 Молоко 2009 ,318 Яйца 2009 ,320 ,207 Сахар 2009 ,196 ,091 Картоф 2009 ,187 -,413 Овощи 2009 ,205 -,108 ,364 Рмасло 2009 ,085 Хлеб 2009 ,272 ,249 -,358 -,009 ,531 -,346 -,118 ,583 -,165 ,176 -,309 ,211 Extraction Method: Principal Component Analysis. Component Scores. С помощью таблицы весовых коэффициентов в соответствии с методом главных компонент определяем стандартизованные значения трех главных компонент: Здесь через , j=1,2,3, обозначены три стандартизованные главные компоненты, а нижний индекс ст указывает на то, что показатель потребления соответствующего продукта стандартизован. Для определения значения , j=1,2,3 для конкретного региона в приведенные выше формулы нужно подставить значения стандартизованных показателей потребления, соответствующие данному региону. Component Matrixa Component 1 2 3 Мясо 2009 ,509 Молоко 2009 ,702 Яйца 2009 ,705 ,307 Сахар 2009 ,432 ,135 Картоф 2009 ,413 -,614 Овощи 2009 ,452 -,160 ,434 Рмасло 2009 ,188 Хлеб 2009 ,600 ,370 -,427 -,014 ,789 -,413 -,141 ,697 -,197 ,211 -,460 ,252 Extraction Method: Principal Component Analysis. a. 3 components extracted. Из таблицы матрица компонент можно выразить стандартизованные показатели потребления через стандартизованные значения главных компонент: Многоточие напоминает о том, что из рассмотрения исключены компоненты с четвертой по восьмую. Таблица матрица компонент представляет собой где: - сумма квадратов элементов в столбце с номером S совпадает с дисперсией главной компоненты - сумма квадратов элементов в строке с номером j равна - сумма квадратов всех элементов матрицы - общности стандартизованного признака , s=1,...m; j=1,…k; равна сумме дисперсии выделенных m главных компонент, равна сумме общностей и не превышает числа k. Обычно главная компонента «получает имя» того признака, с которым наиболее тесно коррелирована. В нашем случае мы можем назвать первую, вторую, третью компоненту соответственно яичная, рмаслянная и сахарная. Сравнение с 1995 годом Descriptive Statistics N Minimum Maximum Mean Std. Deviation Мясо 1995 78 30 99 55,22 10,730 Молоко 1995 78 121 394 255,38 58,453 Яйца 1995 78 24 380 207,12 59,546 Сахар 1995 78 22 51 32,01 5,828 Картоф 1995 78 24 238 132,67 51,782 Овощи 1995 78 15 149 77,95 26,536 Рмасло 1995 78 4,6 11,0 7,079 1,3717 Хлеб 1995 78 80 158 120,49 16,286 Valid N (listwise) 78 Descriptive Statistics N Minimum Maximum Mean Std. Deviation Мясо 2009 80 37 105 64,36 11,550 Молоко 2009 80 63 368 238,16 52,413 Яйца 2009 80 83 327 244,44 50,620 Сахар 2009 80 24 58 38,03 7,058 Картоф 2009 80 42 202 113,61 32,391 Овощи 2009 80 12 202 100,70 26,395 Рмасло 2009 80 6,9 19,6 12,279 2,4082 Хлеб 2009 80 63 165 119,24 15,877 Valid N (listwise) 80 По таблицам за 95 и 09 года мы можем сказать, что минимальное и максимальное потребление в среднем почти не изменилось в употреблении мяса, сахара минимальное потребление молока, овощей и хлеба стало еще меньше. Минимальное потребление картофеля и яиц увеличилось. Максимальное потребление молока, яиц и картофеля стало меньше и возросло у овощей и хлеба. Мы можем сказать, что мяса стали употреблять на 9 кг больше, молока на 17 кг больше, меньше яиц на 37, сахара на 6 кг, картофеля на 19кг больше, на 23 кг овощей больше, на 5 кг масла больше и хлеба на 1кг меньше. Другими словами жить стали лучше употребление почти всех товаров увеличилось, исключая хлеб, тут оно почти не изменилось, и исключая яйца их стали есть меньше. Различия по регионам в целом не изменились, различия по молоку яйцам и картофелю уменьшились. Рассмотрел значения по региону Чувашская республика. Что бросилось в глаза с 1995 по 2009 год стали меньше употреблять картофеля на 100кг, больше овощей на 32кг, меньше хлеба на 29 кг, молока меньше на 79 кг остальные продукты в целом также.