Полная версия научной работы 701 КБ

advertisement
ПРОГРАММНАЯ РЕАЛИЗАЦИЯ КОРРЕЛЯЦИОННО-РЕГРЕССИОННОГО
АНАЛИЗА ДЛЯ ИЗУЧЕНИЯ УРОВНЯ ЖИЗНИ НАСЕЛЕНИЯ СТРАНЫ
Пегов В.А., Назаров Д.А.
Колледж электроники и бизнеса ОГУ
Оренбург, Россия
SOFTWARE IMPLEMENTATION OF CORRELATION AND REGRESSION
ANALYSIS TO STUDY THE STANDARD OF LIVING OF THE POPULATION
Pegov VA, Nazarov DA
College of Electronics and business OSU
Orenburg, Russia
Социальная статистика исследует вопросы, затрагивающие личные интересы каждого
человека, с которыми связаны его благополучие, удовлетворение потребностей.
К числу наиболее значимых направлений исследования в социальной статистике
относятся: социальная и демографическая структура населения и ее динамика, уровень
жизни населения.
Одним из основных направлений анализа социально-экономического развития страны
является изучение уровня жизни населения. Одним из инструментов изучения данного
явления социально-экономической статистики, как уровень жизни населения страны,
является корреляционно-регрессионный анализ, суть которого состоит в составлении
уравнения регрессии и таблицы коэффициентов корреляции, показывающие взаимосвязь и ее
тесноту между изучаемыми объектами человеческой жизнедеятельности. Статистические
методы являются основным средством изучения массовых, повторяющихся явлений, и
играют важную роль в прогнозировании поведения экономических показателей.
В тенденциях современных реалий автоматизации и информационных технологий
есть необходимость программной реализации изучаемых статистически методов.
Целью работы является программная реализация корреляционно-регрессионного
анализа для изучения уровня жизни населения РФ.
Для достижения поставленной цели необходимо решение следующих задач:
- рассмотреть теоретические аспекты изучения уровня жизни населения;
- рассмотреть статистические методы изучения уровня жизни населения России;
- провести корреляционно-регрессионный анализ показателей уровня жизни
населения России;
- написать программу для реализации корреляционно-регрессионного анализа.
Уровень жизни населения во многом зависит от доходов населения, основным
источником которых является заработная плата. Рассмотрим методику проведения
корреляционно-регрессионного анализа (КРА) зависимости между уровнем заработной
платы населения и численностью населения с доходами ниже прожиточного минимума, чем
больше уровень заработной платы, тем ниже уровень бедного населения.
Для изучения уровня жизни населения страны в среде визуального программирования
Borland Delphi 7 реализован метод корреляционно-регрессионного анализа: составление
уравнения множественной регрессии, таблицы парных коэффициентов корреляции.
Данный программный продукт поможет избежать громоздкого аналитического
решения и составления большого числа вспомогательных таблиц при решении задач
методами статистического анализа.
Корреляцией называется такая связь между двумя варьирующими признаками в
статистической совокупности, при которой различиям в величине одного из них
соответствует закономерное различие между средними значениями другого. Задачами
корреляционно – регрессионного анализа являются отражение статистической связи в форме
уравнения регрессии (регрессионной анализ) и измерение тесноты связи (корреляционный
анализ), т.е. измерение всех основных параметров статистической связи.
Важнейшей задачей является определение формы связи с последующим расчетом
параметров уравнения, или, иначе, нахождение уравнения связи (уравнения регрессии).
С целью определения факторов, оказывающих наибольшее влияние на средний доход
населения России, будем рассматривать следующие показатели за 2001-2013 гг.:
Y - денежные доходы населения, млрд. руб.
Х1 - доходы консолидированного бюджета, млрд. руб.
Х2 - расходы консолидированного бюджета, млрд. руб.
Х3 - средний прожиточный минимум населения, руб.
Х4 - номинальная начисленная среднемесячная заработная плата, тыс. руб.
Х5 - денежные расходы и сбережения населения, млрд. руб.
На рисунке 1 представлены исходные данные для корреляционно-регрессионного
анализа.
Рисунок 1. Исходные данные
Уравнение множественной регрессии может быть представлено в виде:
Y = f(β , X) + ε
где X = X(x1, x2, ..., xm) - вектор независимых (объясняющих) переменных; β - вектор
параметров (подлежащих определению); ε - случайная ошибка (отклонение); Y - зависимая
(объясняемая) переменная.
Теоретическое линейное уравнение множественной регрессии имеет вид:
Y = β0 + β1X1 + β2X2 + ... + βmXm + ε
β0 - свободный член, определяющий значение Y, в случае, когда все объясняющие
переменные Xj равны 0.
Эмпирическое уравнение множественной регрессии представим в виде:
Y = b0 + b1X1 + b1X1 + ... + bmXm + e
Здесь b0, b1, ..., bm - оценки теоретических значений β0, β1, β2, ..., βm коэффициентов
регрессии (эмпирические коэффициенты регрессии); e - оценка отклонения ε.
При выполнении предпосылок МНК относительно ошибок εi, оценки b0, b1, ..., bm
параметров β0, β1, β2, ..., βm множественной линейной регрессии по МНК являются
несмещенными, эффективными и состоятельными (т.е. BLUE-оценками).
Для оценки параметров уравнения множественной регрессии применяют МНК.
1. Оценка уравнения регрессии.
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших
квадратов, вектор Y(X) получается из выражения:
Y(X) = (XTX)-1XTY
На рисунке 2 представлена форма программы, содержащая показатели матрицы Х.
Рисунок 2. Матрица X независимых (объясняющих) переменных
На рисунке 3 представлена форма программы, содержащая показатели матрицы Y.
Рисунок 3. Матрица Y зависимой (объясняемой) переменной
Умножаем искомые матрицы, получим матрицу (XTX) (рисунок 4).
Рисунок 4. Матрица (XTX)
В окне промежуточных результатов программы (XTX) число 6, лежащее на
пересечении 1-й строки и 1-го столбца, является суммой произведений элементов 1-й строки
матрицы XT и 1-го столбца матрицы X (рисунок 5).
Рисунок 5. Матрица (XTY)
Следующим шагом промежуточных результатов программы является находение
обратной матрицы (XTX)-1 (рисунок 6)
Рисунок 6. Матрица (XTX)-1
Вектор оценок коэффициентов регрессии равен:
Y(X) = XTY*(XTX)-1
Матрица Y(X) представлена на рисунке 7.
Рисунок 7. Матрица Y(X)
В результате всех программно реализованных операций, получим уравнение
регрессии (оценка уравнения регрессии).
Рисунок 8. Уравнение регрессии
2. Матрица парных коэффициентов корреляции R.
Число наблюдений N = 13. Число независимых переменных в модели равно 5, а число
регрессоров с учетом единичного вектора равно числу неизвестных коэффициентов. С
учетом признака Y, размерность матрицы становится равным 7. Матрица, независимых
переменных Х имеет размерность (13 х 6).
Матрица парных коэффициентов корреляции представлена в форме программы
(рисунок 9).
Рисунок 9. Матрица парных коэффициентов корреляции
Анализ первой строки этой матрицы позволяет произвести отбор факторных
признаков, которые могут быть включены в модель множественной корреляционной
зависимости. Факторные признаки, у которых |r yxi| < 0.5 исключают из модели. Можно дать
следующую качественную интерпретацию возможных значений коэффициента корреляции
(по шкале Чеддока): если |r|>0.3 – связь практически отсутствует; 0.3 ≤ |r| ≤ 0.7 - связь
средняя; 0.7 ≤ |r| ≤ 0.9 – связь сильная; |r| > 0.9 – связь весьма сильная.
Уровень жизни населения России постоянно изменяется. Но если смотреть тенденции
этого изменения, то видно явное снижение уровня жизни населения России в последние
годы. Несмотря на то, что и доходы и расходы населения с каждым годом растут, разница
между доходами и расходами снижается. Это далеко не положительно влияет на
благосостояние населения России.
В результате работы программы, выявлено, что связь между признаками (Y денежные доходы населения, Х1 - доходы консолидированного бюджета, Х2 - расходы
консолидированного бюджета, Х3 - средний прожиточный минимум населения, Х4 номинальная начисленная среднемесячная заработная плата, Х5 - денежные расходы и
сбережения населения) средняя, о чем свидетельствует построенная таблица парных
коэффициентов корреляции.
При возникших вопросах в ходе решения можно обратиться к справке, которая
находиться во вкладке помощь данной программы (рисунок 10).
Рисунок 10 - Справка
Для просмотра промежуточных таблиц можно воспользоваться кнопкой «Просмотр
промежуточных таблиц», которая откроет новую форму в программе со всеми
промежуточными таблицами (рисунок 11).
Рисунок 11 - Промежуточные результаты
В программном продукте реализованы ошибки ввода. Так, например, В случае если
какая либо ячейка исходных данных не заполнена, программа выводит ошибку (рисунок 12).
Рисунок 12- Ошибка «Пустая ячейка таблицы»
В результате работы над программным продуктом по реализации корреляционнорегрессионного анализа для изучения уровня жизни населения РФ за 2001 – 2013 гг. были
рассмотрены теоретические аспекты изучения уровня жизни населения; статистические
методы изучения уровня жизни населения России; проведено построение уравнение
регрессии и таблицы парных коэффициентов корреляции.
Таким образом, поставленные задачи выполнены, цель достигнута.
Список использованных источников
1.
Архангельский, А.Я. Программирование в Delphi для windows. Версия 2006,
2007, turbo Delphi: учеб.пособие. - 1248с.;
2.
Бондарев, В.М. Основы программирования / Рублинецкий В.И., Качко Е.Г. Харьков: Фолто; Ростов н/д: Феникс, 1998- 368с.;
3.
Голованов, М. Создание компонентов в среде Delphi: учеб.пособие.- И.Халдин.
Вильямс, 2006. – 768с.;
4.
Орлова И.В. Экономико-математические методы и модели. Выполнение
расчетов в среде Ехсе1. Практикум. – М.: ЗАО Финстатинформ, 2000.
5.
Партыка, Т.Л. Математические методы: учебник / Т.Л. Партыка, - М.; 2005.464 с.
6.
Практикум по эконометрике: Учеб. пособие/ И.И. Елисеева, С.В. Курышева
Н.М. Гордеенко и др. Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2005.
7.
Эконометрика. Учебник./ Елисеева И.И., Курышева С.В., Нерадовская Ю.В.
Под ред. И.И. Елисеевой. —М.: Проспект, 2010.
Download