Uploaded by romanerdogan

курсовая

advertisement
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ИМЕНИ М.В. ЛОМОНОСОВА
МОСКОВСКАЯ ШКОЛА ЭКОНОМИКИ
КАФЕДРА ЭКОНОМЕТРИКИ И МАТЕМАТИЧЕСКИХ МЕТОДОВ ЭКОНОМИКИ
Курсовая работа на тему:
«Эконометрическое моделирование уровня и структуры денежных
доходов домашних хозяйств в 2021 году»
«Econometrical model building of level and structure of cash income of
households in 2021»
Выполнила:
Студент 302 группы
Арутюнян Нарине Игоревна
Москва 2023
Содержание
Введение
Глава 1. Теоретические аспекты моделирования
1.1 Описание основных эконометрических моделей исследования
1.2 Информационная база исследования
Глава 2. Предварительный анализ данных
2.1 Описательные статистики признаков
2.2 Графическая визуализация
Глава 3. Построение эконометрических моделей
3.1 Модели парной регрессии
3.2 Модели множественной регрессии
3.3 Анализ различных спецификаций
3.4 Модели с фиктивной переменной (бинарного выбора)
3.5 Сравнительный анализ построенных моделей (при сравнении моделей
использовать основные критерии качества модели, обязательно проверить
остатки моделей, сделать вывод об эффективности оценок моделей)
Заключение
Литература
Введение
Экономика в нашей стране, за последние двадцать лет претерпела изменения,
один из которых характеризуется переходом к рыночной экономике. В
результате чего произошла трансформация условий жизнедеятельности всех
субъектов в экономике. Домохозяйства в настоящее время осуществляют
самостоятельные решения и несут полную ответственность. Появилась
необходимость в изучении деталей, а также выявлении роли финансовых
ресурсов в развитии потенциала страны.
Часто термин «домашнее хозяйство» в экономической литературе
используется как аналогичный̆ термину «семья», но в отличие от семьи
домохозяйства включают не только родственников и могут состоять из одного,
двух и более членов.
Домохозяйства играют важную роль в структуре экономики каждой страны.
Преимущественно представляет натуральный сектор современной экономики.
Наряду с фирмами и государством, оно является экономической единицей,
состоящей из одного и более лиц, которые принимают финансовые решения и
снабжают экономику исходными производственными ресурсами.
Финансы домашних хозяйств – это совокупность экономических денежных
отношений, связанных с формированием и использованием денежных
средств, создаваемых в результате индивидуальной трудовой деятельности.
Согласование экономических интересов различных участников домашнего
хозяйства обеспечивается их регулированием.
Денежные доходы домохозяйств составляют: заработная плата, премии,
надбавки к заработной плате, выплаты социального характера,
осуществляемые работодателем, командировочные расходы; доходы от
предпринимательской деятельности, от участия в прибылях, от операций с
личным имуществом, от кредитно-финансовых операций; социальные
трансферты, в том числе пенсии, пособия, стипендии; потребительский
кредит.
Целью работы является попытка раскрыть сущность бюджета домохозяйств с
целью рассмотреть источники формирования, а также сопоставить
статистические данные по субъектам Российской Федерации.
В курсовой работе изучены экономические показатели структуры уровня
денежных доходов домашних хозяйств за 2021 год. Рассматриваются такие
показатели, как доход от трудовой деятельности, доход от собственности,
социальные выплаты (в том числе пенсии и пособия, стипендии и другие
выплаты), а также поступления от частных лиц или организаций.
Глава 1. Теоретические аспекты моделирования
1.1 Описание основных эконометрических моделей исследования
С современных позиций эконометрику можно определить как науку о
моделировании экономических явлений, позволяющем объяснять и
прогнозировать их развитие, выявлять и измерять определяющие факторы.
Среди предпосылок возникновения эконометрики можно назвать разработку
количественных методов в экономических исследованиях, накопление учетностатистических данных, создание современной микро- и макроэкономики.
Особенно важным для развития количественного подхода был статистический
анализ поведения цен на различные товары – отечественные и импортные.
Появились исследования динамики цен на важнейшие товары, группы
товаров, анализ региональных особенностей роста цен; уделялось внимание
построению индексов цен, попыткам выявления цикличности в изменениях
цен и связи с бизнес - циклами.
Исследования экономики с неизбежностью опирается на данные пассивного
эксперимента, т.к. исследователь никак не может воздействовать на данные.
Таковыми являются все реальные данные, которые нам предлагает
официальная статистика, или учет, или специальное наблюдение.
Основные эконометрические модели.
Путь эконометрики в нашу страну был долгим и сложным. Первая попытка
внедрить эконометрику в науку принадлежит Василию Сергеевичу
Немчинову. Эта попытка привела к выделению экономико-математических
методов и экономической кибернетики.
Применяемые в настоящее время эконометрические модели делят на:
статистические и динамические – по характеру используемых данных.
Промежуточное положение занимают модели панельных данных, основанные
на данных по одной и той же совокупности за ряд лет;
комплексные или некомплексные. Первые отличаются тем, что отражают
связи между макроэкономическими показателями на всех стадиях процесса
воспроизводства.
аналитические, имитационные и прогностические. Деление по целям их
применения.
Этапы построения эконометрической модели:
Первый: теоретический, в ходе которого формируется цель исследования,
определяется круг участвующих в модели экономических характеристик,
создается описание связей между ними.
Второй: информационный, когда осуществляется поиск требуемых данных,
проверяется
их
достоверность,
сопоставимость,
осуществляются
необходимые пересчеты, используются пространственные и временные
данные.
Третий: спецификация модели, когда устанавливаются внешние и внутренние
переменные, выявляются связи и соотношения.
Четвертый: идентификация модели, т.е. выявление условий корректного
оценивания параметров модели на основе соотношения количества
переменных и связей между ними.
Пятый: оценка параметров модели.
Шестой: проверка адекватности модели, делается вывод о том, какова
точность расчетов на основе модели, получаемых прогнозных оценок,
производится анализ остатков.
Структура современной эконометрики.
Термин "эконометрика" состоит из двух частей: "эконо-" - от "экономика" и "метрика" - от "измерение". Эконометрика посвящена развитию и применению
статистических методов в конкретной области науки и практики.
В эконометрике выделяют три вида научной и прикладной деятельности:
а) разработка и исследование эконометрических методов (методов прикладной
статистики) с учетом специфики экономических данных;
б) разработка и исследование эконометрических моделей в соответствии с
конкретными потребностями экономической науки и практики;
в) применение эконометрических методов и моделей для статистического
анализа конкретных экономических данных.
Кратко рассмотрим виды научной и прикладной деятельности. Если работам
соответствуют научные результаты, значимость которых оценивается по
общеэконометрическим критериям, то для них основное - успешное решение
задач конкретной области экономики. Прикладная статистика - курс
математической статистики состоит в основном из доказательств теорем, как
и соответствующие учебные пособия. Математическая статистика играет роль
математического фундамента для прикладной статистики. Хотя
статистические данные собираются и анализируются с незапамятных времен,
современная математическая статистика как наука была создана сравнительно
недавно - в первой половине ХХ в. Именно тогда были разработаны основные
идеи и получены результаты, излагаемые ныне в учебных курсах
математической статистики.
В результате специалист по математической статистике оказывается зачастую
беспомощным при обработке реальных данных, а пакеты программ
применяют лица, не имеющие необходимой теоретической подготовки.
Специфика и принципы эконометрики.
Чтобы продемонстрировать основные принципы эконометрики, рассмотрим
пример из страхового бизнеса. Годовой пробег автомобиля - это важный
фактор, но пользоваться им как оценочным затруднительно. Практическое
решение состоит в определении ряда легко наблюдаемых факторов мощности машины, возраста, географического положения, износа, каждый из
которых имеет некоторую связь с истинным риском, в свою очередь
определяющим фактический размер страховой премии.
Эконометрические методы строятся на синтезе трех областей знаний:
экономики, математики и статистики. Основой является экономическая
модель,
под
которой
понимается
схематическое
представление
экономического явления или процесса с помощью научной абстракции,
отражения только характерных черт.
В эконометрике, как и в любой научной дисциплине, познание развивается в
соответствии с общим научным методом, предполагающим:
- формулировку гипотезы с учетом
данными;
соотношений между наблюдаемыми
- сбор статистических данных и представление гипотезы в сжатой или
математической форме;
- модификацию или улучшение гипотезы.
Таким образом, сердцевиной познания в экономике является эксперимент,
предполагающий либо непосредственное наблюдение (измерение), либо
математическое моделирование.
Область применения эконометрических моделей - все сферы экономической
теории и практики, где есть возможность сбора и обработки статистических
данных, прогнозирования их поведения.
Для анализа экономических данных могут применяться все разделы
прикладной статистики, а именно:
статистика случайных величин;
многомерный статистический анализ;
статистика временных рядов и случайных процессов;
статистика объектов нечисловой природы, в том числе статистика
интервальных данных.
Перечисленные четыре области выделены на основе математической природы
элементов выборки: в первой из них это - числа, во второй - вектора, в третьей
- функции, в четвертой - объекты нечисловой природы, т.е. элементы
пространств, в которых нет операций сложения и умножения на число.
Есть два принципиально различных подхода к изучению поведения
организаций и людей. Согласно первому из них вполне допустимо описывать
действия человека в вероятностных терминах, например, считать его ответ на
заданный вопрос случайной величиной. Сторонники второго подхода
полагают, что поведение человека или организации является
детерминированным, определяется теми или иными причинами, а случайность
при анализе выборки возникает лишь из-за случайности при отборе лиц для
опроса или предприятий для изучения. Если ответ на вопрос имеет вид "да" "нет", то число ответов "да" при первом подходе, как известно, имеет
биномиальное распределение, а при втором – гипергеометрическое.
1.2 Информационная база исследования
Эконометрическое знание выделилось и сформировалось как закономерный
результат развития и взаимодействия экономической теории, математической
экономики, экономической статистики, математической статистики и теории
вероятностей. Эконометрика формулирует собственные предмет, цель и
задачи исследования Метод исключения предполагает построение уравнения,
включающего всю совокупность переменных, с последующим
последовательным (пошаговым) сокращением числа переменных в модели
до тех пор, пока не выполнится некоторое наперед заданное условие. Суть
метода включения - в последовательном включении переменных в модель
до тех пор, пока регрессионная модель не будет отвечать заранее
установленному критерию качества. Последовательность включения
определяется с помощью частных коэффициентов корреляции:
переменные, имеющие относительно исследуемого показателя большее
значение частного коэффициента корреляции, первыми включаются в
регрессионное уравнение.
Модель процентных ставок. В рамках исследования возникает задача
построения модели, которая бы позволяла оценить взаимосвязь между
10
процентными ставками в экономике и ставками, которые выступают в
качестве инструментов денежно-кредитной политики, в частности базовой
ставкой рефинансирования. Наибольший интерес в рамках системы
представляет взаимосвязь базовой ставки рефинансирования со ставкой на
депозитном рынке. Ставка рефинансирования Национального банка,
играющая роль основного инструмента процентной политики
Национального банка, является ориентиром при установлении банками
процентных ставок по кредитам и депозитам. Кроме того, «вокруг» ставки
рефинансирования формируется коридор процентных ставок по
инструментам регулирования ликвидности. Устанавливая уровень
процентных ставок по инструментам и ставки рефинансирования,
Национальный банк оказывает влияние на уровень процентных ставок
вэкономике. оделирование – один из методов научного познания и
представляет собой исследование свойств и поведения настоящего объекта с
помощью изучения свойств и поведения его образа — модели. Необходимость
в моделировании появляется тогда, когда прямое изучение самого объекта
либо невозможно, либо затруднительно, недешево или потребует крупных
расходов времени. Модель должна иметь сходные с оригиналом особенности,
которые важны для данного исследования: сходство физических
характеристик, сходство функций, тождество математического описания
«поведения» оригинала и модели и т.п. Функции модели способна выполнять
как специально созданная экспериментальная установка, так и другое
наблюдаемое явление, или символическое описание оригинала: текстовое,
математическое, графическое и др.
Эконометрическое моделирование широко используется в различных сферах
современной жизни, как в технических, так и социально-экономических.
Сочетая в себе приемы экономической теории, экономической и
математической статистик, а также различные инструменты математики и
информационных технологий, специалисты овладели уникальным
инструментом при оценке технико–экономических процессов, построении
прогнозной и точностной характеристик всех этапов производства с целью
установления и повышения качества и надежности изделий; использовании
методов экспертных оценок в случаях принятия [4].
Следует отметить, что эконометрическое моделирование основано на 6
этапах:
1)
Постановка целей и задач исследования, определение основных
результативных и факторных переменных с учетом отсутствия эффекта
мультиколлинеарности
(переменные
не
должны
быть
высоко
коррелированными между собой);
2) Построение экономической задачи или априорный этап, в ходе которого
следует проанализировать теоретически сущность исследуемого явления и
выдвинуть соответствующие гипотезы и некоторые допущения [6];
3) Моделирование (этап параметризации) предназначен для окончательного
определения вида модели, формы связи. При этом следует отметить, что
моделирование может быть статистическим и динамическим. Статистическое
подразумевает
моделирование
взаимосвязи
между
статистически
однородными данными. Например, это может быть выборка предприятий
одной отрасли по размеру прибыли, объему выпускаемой продукции, уровню
производительности труда или фондоотдачи т .д. Динамическое в свою
очередь связывает значения результирующего признака в определенные
моменты времени с соответствующими для этих периодов факторными
(независимыми) переменными. Например, объем ВВП страны или объем
импорта/экспорта товаров за десятилетие может зависеть от нескольких
факторов: уровня инфляции, курса доллара и т. д [5].
В ходе выполнения расчетной части
моделирования подбирают
соответствующую функцию, которая может быть линейной или нелинейной.
В настоящее время существует множество программных продуктов, которые
облегчают выполнение трудоемких расчетов на этапе моделирования. Так,
например, широко используется Microsoft Excel. Благодаря наличию
соответствующего инструментария в интерфейсе программы, можно при
однофакторном моделировании добавлять линию тренда с соответствующим
представлением модели и коэффициента детерминации, либо проводить
анализ множественной регрессии с помощью функции «Регрессия» и т.д [4].
4) Идентификация модели, в ходе которого происходит оценка неизвестных
параметром процесса.
5) Оценка качества модели, в ходе которой проверяется успешность решения
задач идентификации с помощью оценки на достоверность и адекватность.
Чаще всего это происходит с помощью коэффициента детерминации, средней
ошибки аппроксимации, по критерию F–Фишера и т.д.
6) Интерпретация результатов моделированияДанные этапы носят условный
характер, так как они могут пересекаться, взаимно дополнять друг друга.
Таким образом, эконометрическое моделирование охватывает весь цикл
решения экономической задачи – от ее постановки до содержательной
интерпретации
итогов
статистического
анализа
и
прогнозирования.Практическая
значимость
эконометрического
моделирования велика. Правильно проведенный эконометрический анализ с
соблюдением всех правил и последовательностей является неотъемлемой
частью прогнозирования и управления экономическими, техническими и
социальными процессами как на уровне предприятий, так и на уровне
субъектов РФ и страны в целом.
Глава 2. Предварительный анализ данных
Описательные статистики признаков
Проведем эконометрический анализ социально-экономических показателей, полученных в
результате
выборочного
наблюдения,
проведенного
Федеральной
службой
государственной статистики в 84 равноправных субъектов Российской Федерации.
Для каждого регрессора и зависимой переменной вычислены основные описательные
статистики:
медиана
первый квартиль
третий квартиль
4,8
среднее
5,7
мин знач
0,9
макс знач
44,9
асимметрия
размах
дисперсия
ст отклонение
островершинност
ь
корреляция
3,3
6,9
5,3
44,0
27,2408658
6
5,21927828
9
38,2
70 306,8
63836,1
82322,2
51 474,6
45432,5
60101,5
353,9
170,1
590,9
16 909,4
15668,3
17996,1
1 047,2
818,8
1327,6
79 131,1
59 973,7
486,1
17 530,6
1 140,7
54 011,5
35 415,4
50,0
13 749,5
414,2
202 436,6
2,35504749
3
182 746,4
2,51405920
9
3 034,8
2,65717829
4
27 742,2
1,39429237
4
3 010,8
1,35621951
2
148 425,1
759795568,
3
2 984,8
250263,612
8
500,263543
3
9,18630969
1
13 992,7
7553465,31
9
27564,3895
6,07393130
3
147 331,0
684315925,
1
26159,4328
1
7,30843864
4
0,2
0,1
0,2
0,4
2 596,6
227203,983
6
476,659190
2
2,69007627
2
0,0
2748,35684
1,80058579
7
Вторая квартиль (медиана):
Она показывает, что 50% от выборки ниже этого значения
У 50% субъектов уровень здоровья оценивается ниже значения 4,8
У 50% субъектов уровень общего дохода оценивается ниже значения 70 306,8
У 50% субъектов уровень доходов от трудовой деятельности ниже значения 51 474,6
У 50% субъектов уровень доходов от собственности ниже значения 353,9
У 50% субъектов уровень социальных выплат ниже значения 16 909,4
У 50% субъектов уровень иных денежных поступлений от частных лиц и организаций ниже
значения 1 047,2
Первая квартиль:
Она показывает, что 25% от выборки ниже этого значения
У 25% субъектов уровень здоровья оценивается ниже значения 3,3
У 25% субъектов уровень общего дохода оценивается ниже значения 63836,1
У 25% субъектов уровень доходов от трудовой деятельности ниже значения 45432,5
У 25% субъектов уровень доходов от собственности ниже значения 170,1
У 25% субъектов уровень социальных выплат ниже значения 15668,3
У 25% субъектов уровень иных денежных поступлений от частных лиц и организаций ниже
значения 818,8
Третья квартиль:
Она показывает то, что ниже 75% в нашей выборке.
У 75% субъектов уровень здоровья оценивается ниже значения 6,9
У 75% субъектов уровень общего дохода оценивается ниже значения 82322,2
У 75% субъектов уровень доходов от трудовой деятельности ниже значения 60101,5
У 75% субъектов уровень доходов от собственности ниже значения 590,9
У 75% субъектов уровень социальных выплат ниже значения 17996,1
У 75% субъектов уровень иных денежных поступлений от частных лиц и организаций ниже
значения 1327,6
Среднее:
Определяется как число, равное сумме всех чисел множества, делённой на их количество
Y =5,7
X1=79 131,1
X2=59 973,7
X3=486,1
X4=17 530,6
X5=1 140,7
Минимальное значение:
Y = 0,9; самый низкий уровень здоровья у Чувашской Республики
X1=54 011,5; самый низкий уровень общего дохода у Саратовской области
X2=35 415,4; самый низкий уровень доходов от трудовой деятельности у Кировской
области
X3=50,0; самый низкий уровень доходов от собственности у Ульяновской области
X4=13 749,5; самый низкий уровень социальных выплат у Саратовской области
X5=414,2; самый низкий уровень иных денежных поступлений от частных лиц и
организаций у Рязанской области
Максимальное значение:
Y = 44,9; самый высокий уровень здоровья у Чеченской Республики
X1=202 436,6; самый высокий уровень общего дохода у Ямало-Ненецкого а.о.
X2=182 746,4; самый высокий уровень доходов от трудовой деятельности у ЯмалоНенецкого а.о.
X3=3 034,8; самый высокий уровень доходов от собственности у города Москва
X4=27 742,2; самый высокий уровень социальных выплат у Ненецкого а.о.
X5=3 010,8; самый высокий уровень иных денежных поступлений от частных лиц и
организаций у Чукотского а.о.
Коэффициент асимметрии:
этот коэффициент равен нулю в случае симметричных распределений, отрицателен при
завале вправо и положителен при левостороннем перекосе
Y = 5,3>0
X1=2,355047493>0
X2=2,514059209>0
X3=2,657178294>0
X4=1,394292374>0
X5=1,356219512>0
Размах:
Так как это разница между максимумом и минимумом, то мы можем увидеть, насколько
большая разница между субъектами с максимальным и минимальным показателем.
Y = 44,0
X1=148 425,1
X2=182 746,4
X3=3 034,8
X4=13 992,7
X5=3 010,8
Дисперсия:
Дисперсия позволяет нам увидеть степень отклонения от среднего значения
Чем больше значение дисперсии, тем больше разброс между числами. Наши дисперсии
получились:
Y = 27,24086586
X1=759795568,3
X2=684315925,1
X3=250263,6128
X4=7553465,319
X5=227203,9836
Стандартное отклонение:
Оно показывает на сколько сильно меняются показатели.
Y = 5,219278289
X1=27564,3895
X2=26159,43281
X3=500,2635433
X4=2748,35684
X5=476,6591902
Островершинность:
характеризует островершинность распределения величины
Если >0, распределение островершинное, если <0 – плосковершинное
Уровень здоровья 38,2 - островершинный
Уровень общего дохода 6,073931303 - островершинный
Уровень доходов от трудовой деятельности 7,308438644 - островершинный
Уровень доходов от собственности 9,186309691 - островершинный
уровень социальных выплат 1,800585797 - островершинный
Уровень иных денежных поступлений от частных лиц и организаций 2,690076272 островершинный
Попарные коэффициенты корреляции зависимой переменной с каждой из независимых
переменных:
чем ближе коэффициент корреляции от 0 к 1, тем сильнее прямая линейная зависимость,
чем ближе значение к 0, тем слабее линейная зависимость.
чем ближе от 0 к -1, тем сильнее обратная линейная зависимость.
Рассматриваем значимость зависимости У (уровень здоровья) от
Х1 = 0,2 значение очень маленькое – слабая прямая
Х2 = 0,1 значение очень маленькое – слабая прямая
Х3 = 0,2 значение очень маленькое – слабая прямая
Х4 = 0,4 значение очень маленькое – слабая прямая
Х5 = 0 – отсутствует
Корреляция слишком мала, чтобы можно было с уверенностью говорить о существовании
взаимосвязи между величинами. Более-менее значимая корреляция между Y и X4
(отличный уровень здоровья от социальных выплат).
Следовательно, зависимость между уровнем здоровья «отличный» и источниками
денежного дохода мала. Вероятно, хороший уровень здоровья зависит от ряда иных
показателей, таких как экология, генетика, вредные привычки, занятия спортом и общая
степень физической подготовки, образ жизни в целом и многое другое.
Графическая визуализация
Для наглядности сделаем в R-studio графики распределения всех переменных.
Гистограмма распределения случайной величины позволяет сделать вывод о характере
распределения, симметричности, нормальности.
Экспортируем данные рассматриваемых выборок из Excel в пакет R. После построены
гистограммы распределения и «ящики с усами» для наглядности.
#гистограмма
hist(Book$Y, xlab = "Уровень здоровья отличный", ylab = "Частота", main = "Гистограмма
распределения переменной отличного уровня здоровья", col = "lightblue")
hist(Book$X1, xlab = "Уровень общего дохода", ylab = "Частота", main = "Гистограмма
распределения переменной общего дохода", col = "coral")
hist(Book$X2, xlab = "Уровень доходов от трудовой деятельности", ylab = "Частота", main
= "Гистограмма распределения переменной дохода от трудовой деятельности", col =
"khaki")
hist(Book$X3, xlab = "Уровень дохода от собственности", ylab = "Частота", main =
"Гистограмма распределения переменной дохода от собственности", col = "lightpink")
hist(Book$X4, xlab = "Уровень социальных выплат", ylab = "Частота", main =
"Гистограмма распределения переменной индекса социальных выплат", col = "lightgreen")
hist(Book$X5, xlab = "Уровень доходов от иных выплат от частных лиц и организаций",
ylab = "Частота", main = "Гистограмма распределения переменной доходов от иных
частных лиц и организаций", col = "purple")
# Загрузим и установим графический пакет "ggplot2"
install.packages("ggplot2")
library("ggplot2")
ggplot(data = Book, aes(x = Y)) + geom_boxplot(fill = "cyan3", color = "black")
ggplot(data = Book, aes(x = X1)) + geom_boxplot(fill = "lightblue", color = "blue")
ggplot(data = Book, aes(x = X2)) + geom_boxplot(fill = "khaki1", color = "black")
ggplot(data = Book, aes(x = X3)) + geom_boxplot(fill = "midnightblue", color = "black")
ggplot(data = Book, aes(x = X4)) + geom_boxplot(fill = "indianred2", color = "black")
ggplot(data = Book, aes(x = X5)) + geom_boxplot(fill = "violetred3", color = "black")
По горизонтальной оси представлены интервалы значений переменной Y – Уровень
«отличного» здоровья. Высота столбцов показывает количество субъектов, которые имеют
значения уровня отличного здоровья из соответствующего интервала.
Как мы можем наблюдать, часть субъектов (более 30) находятся в диапазоне от 0 до 10. По
гистограмме можно сделать вывод, что имеет место распределение, отличное от
нормального. Присутствует левосторонняя асимметрия.
Видим, что имеют место выбросы. В целом из диаграммы можно сделать вывод, что данные
неоднородны.
По горизонтальной оси представлены интервалы значений переменной Х1 – Общий доход.
Высота столбцов показывает количество субъектов, которые имеют значения уровня
общего дохода из соответствующего интервала.
Как мы можем наблюдать, часть субъектов (около 30) находятся в диапазоне от 60000 до
80000. По гистограмме можно сделать вывод, что имеет место распределение, отличное от
нормального. Присутствует левосторонняя асимметрия.
Видим, что имеют место выбросы. В целом из диаграммы можно сделать вывод, что данные
неоднородны.
По горизонтальной оси представлены интервалы значений переменной Х2 – дохода от
трудовой деятельности. Высота столбцов показывает количество субъектов, которые
имеют значения уровня отличного здоровья из соответствующего интервала.
Как мы можем наблюдать, часть субъектов (более 50) находятся в диапазоне от 40000 до
60000. По гистограмме можно сделать вывод, что имеет место распределение, отличное от
нормального. Присутствует левосторонняя асимметрия.
Видим, что имеют место выбросы. В целом из диаграммы можно сделать вывод, что данные
неоднородны.
По горизонтальной оси представлены интервалы значений переменной Х3 – дохода от
собственности. Высота столбцов показывает количество субъектов, которые имеют
значения уровня отличного здоровья из соответствующего интервала.
Как мы можем наблюдать, часть субъектов (более 50) находятся в диапазоне от 0 до 500.
По гистограмме можно сделать вывод, что имеет место распределение, отличное от
нормального. Присутствует левосторонняя асимметрия.
Видим, что имеют место выбросы. В целом из диаграммы можно сделать вывод, что данные
неоднородны.
По горизонтальной оси представлены интервалы значений переменной Х4 – Уровень
социальных выплат. Высота столбцов показывает количество субъектов, которые имеют
значения уровня отличного здоровья из соответствующего интервала.
Как мы можем наблюдать, часть субъектов (более 30) находятся в диапазоне от 14000 до
18000. По гистограмме можно сделать вывод, что имеет место распределение, отличное от
нормального. Присутствует левосторонняя асимметрия.
Видим, что имеют место выбросы. В целом из диаграммы можно сделать вывод, что данные
неоднородны.
По горизонтальной оси представлены интервалы значений переменной Х5 – Уровень
доходов от иных выплат от частных лиц и организаций. Высота столбцов показывает
количество субъектов, которые имеют значения уровня отличного здоровья из
соответствующего интервала.
Как мы можем наблюдать, часть субъектов (более 60) находятся в диапазоне от 500 до
1500. По гистограмме можно сделать вывод, что имеет место распределение, отличное от
нормального. Присутствует левосторонняя асимметрия.
Видим, что имеют место выбросы. В целом из диаграммы можно сделать вывод, что данные
неоднородны.
В подтверждение полученных данных в предыдущей главе построим попарные графики
разброса зависимой переменной со всеми независимыми переменными:
R-studio:
plot(Book$X1,Book$Y, xlab = "Уровень общего дохода", ylab = "Уровень здоровья отличный", main =
"График разброса уровеня здоровья от общего дохода", abline(lm(Book$Y ~ Book$X1), col = 'red'))
plot(Book$X2,Book$Y, xlab = "Уровень дохода от трудовой деятельности", ylab = "Уровень здоровья
отличный", main = "График разброса уровеня здоровья от дохода от трудовой деятельности",
abline(lm(Book$Y ~ Book$X1), col = 'red'))
plot(Book$X3,Book$Y, xlab = "Уровень одохода от собственности", ylab = "Уровень здоровья отличный",
main = "График разброса уровеня здоровья от дохода от собственности", abline(lm(Book$Y ~ Book$X1), col =
'red'))
plot(Book$X4,Book$Y, xlab = "Уровень социальных выплат", ylab = "Уровень здоровья отличный", main =
"График разброса уровеня здоровья от социальных выпалат", abline(lm(Book$Y ~ Book$X1), col = 'red'))
plot(Book$X5,Book$Y, xlab = "Уровень дохода от иных частных лиц и организаций", ylab = "Уровень
здоровья отличный", main = "График разброса уровеня здоровья от дохода от иных частных лиц и
организаций", abline(lm(Book$Y ~ Book$X1), col = 'red'))
Y c переменной X1
250000,00
200000,00
150000,00
100000,00
50000,00
0,00
0,00
5,00
10,00
15,00
20,00
25,00
30,00
35,00
40,00
45,00
50,00
Зависимость между у и х1 визуально установить затруднительно
Y c переменной X2
200000,00
180000,00
160000,00
140000,00
120000,00
100000,00
80000,00
60000,00
40000,00
20000,00
0,00
0,00
5,00
10,00
15,00
20,00
25,00
30,00
35,00
Зависимость между у и х2 визуально установить затруднительно
40,00
45,00
50,00
Y c переменной X3
3500,00
3000,00
2500,00
2000,00
1500,00
1000,00
500,00
0,00
0,00
5,00
10,00
15,00
20,00
25,00
30,00
35,00
40,00
45,00
50,00
Зависимость между у и х3 визуально установить затруднительно
Y c переменной X4
30000,00
25000,00
20000,00
15000,00
10000,00
5000,00
0,00
0,00
5,00
10,00
15,00
20,00
25,00
30,00
35,00
40,00
45,00
50,00
40,00
45,00
50,00
Зависимость между у и х4 визуально установить затруднительно
Y c переменной X5
3500,00
3000,00
2500,00
2000,00
1500,00
1000,00
500,00
0,00
0,00
5,00
10,00
15,00
20,00
25,00
30,00
35,00
Зависимость между у и х5 визуально установить затруднительно
На мой взгляд, все графики практически не напоминают линейную зависимость. Возможно,
это связано с тем, что брать данные сразу по всем 84 субъектам в одну выборку не слишком
правильно, поэтому и распределены они не лучшим образом. Степень зависимости –
слабая.
Показатели источников денежных доходов слабо зависят от отличного уровня здоровья.
Так как имеется ряд других важных факторов, влияющих на переменную У.
Глава 3. Построение эконометрических моделей
3.1Модели парной регрессии
Парная линейная регрессия — это зависимость между одной переменной и
средним значением другой переменной. Чаще всего модель записывается как
y=b0+b1х+e, где x - факторная переменная, y - результативная (зависимая), e случайная компонента (остаток, отклонение).
B1 показывает на сколько увеличится Y при изменении х на 1 единицу.
А b0 показывает значение зависимой переменной при х=0.
Для исследования возьмем У – уровень здоровья «отличный» по субъектам
(%) и независимую переменную Х4 – уровень социальных выплат, так как
корреляция по модулю Х4 больше всех остальных переменных = 0,4.
Из первой главы возьмем описательную статистику -среднее для У = 5,7.
Используем модель линейной регрессии y=b0+b1х для произвольных b0=2 и
b1=5.
Найдем У прогнозируемое подставив произвольные b0 и b1 для каждого Х4.
Найдем остатки в виде разности между переменной У и У прогнозируемой.
Теперь вычислим TSS, ESS, RSS и R^2 для нашей модели.
RSS – сумма квадратов остатков (сумма квадратов регрессионных остатков)
TSS – общая сумма квадратов отклонения (общая сумма квадратов
отклонений)
ESS – объясняет с помощью регрессии отклонение (объясненная сумма
квадратов)
R^2 – на сколько точна модель
Согласно расчетам:
RSS=1914,29
TSS=(y− y¯)2 = 2288,11
ESS=(у^- y¯)2 = 373,82
Проверим выполнение TSS=RSS+ESS=1914,29+373,82=2288,11
Коэффициент детерминации — это доля дисперсии зависимой переменной,
объясняемая рассматриваемой моделью:
R^2=1-RSS/TSS=0,163419843
Следовательно, в рассматриваемой модели выбранный регрессор объясняет
изменение переменной У более чем на 16%.
R^2
TSS
RSS
ESS
0,163419843
2288,11
1914,29
373,82
В результате получим, что минимальное значение суммы квадратов равное 1914,29
достигается при значениях коэффициентов b0=-7,7571382, b1=0,000767566.
Согласно расчётам, функция, при которой сумма квадратов остатков будет минимальна,
выглядит так:
Y=-7,7571382+0,000767566*X
Найденные коэффициенты регрессии можно проинтерпретировать так: при увеличении X
на 1 Y уменьшится на 0,000767566 единицы. В случае, если X будет равен нулю,
Y=-7,7571382
Все коэффициенты, построенные при выполнении задания вручную, были вычислены еще
раз с помощью надстройки «Анализ данных» в Excel. Все значения совпали.
Остатки модели
40,0
35,0
30,0
25,0
20,0
15,0
10,0
5,0
0,0
- 5,0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85
- 10,0
- 15,0
Среднее значение остатков модели равно нулю.
Моделирование – один из методов научного познания и представляет собой
исследование свойств и поведения настоящего объекта с помощью изучения
свойств и поведения его образа — модели. Необходимость в моделировании
появляется тогда, когда прямое изучение самого объекта либо невозможно,
либо затруднительно, недешево или потребует крупных расходов времени.
Модель должна иметь сходные с оригиналом особенности, которые важны
для данного исследования: сходство физических характеристик, сходство
функций, тождество математического описания «поведения» оригинала и
модели и т.п. Функции модели способна выполнять как специально
созданная экспериментальная установка, так и другое наблюдаемое явление,
или символическое описание оригинала: текстовое, математическое,
графическое и др.
Эконометрическое моделирование широко используется в различных сферах
современной жизни, как в технических, так и социально-экономических.
Сочетая в себе приемы экономической теории, экономической и
математической статистик, а также различные инструменты математики и
информационных технологий, специалисты овладели уникальным
инструментом при оценке технико–экономических процессов, построении
прогнозной и точностной характеристик всех этапов производства с целью
установления и повышения качества и надежности изделий; использовании
методов экспертных оценок в случаях принятия
Следует отметить, что эконометрическое моделирование основано на 6
этапах:
1) Постановка целей и задач исследования, определение основных
результативных и факторных переменных с учетом отсутствия эффекта
мультиколлинеарности (переменные не должны быть высоко
коррелированными между собой);
2) Построение экономической задачи или априорный этап, в ходе которого
следует проанализировать теоретически сущность исследуемого явления и
выдвинуть соответствующие гипотезы и некоторые допущения [6];
3) Моделирование (этап параметризации) предназначен для окончательного
определения вида модели, формы связи. При этом следует отметить, что
моделирование может быть статистическим и динамическим. Статистическое
подразумевает моделирование взаимосвязи между статистически
однородными данными. Например, это может быть выборка предприятий
одной отрасли по размеру прибыли, объему выпускаемой продукции, уровню
производительности труда или фондоотдачи т .д. Динамическое в свою
очередь связывает значения результирующего признака в определенные
моменты времени с соответствующими для этих периодов факторными
(независимыми) переменными. Например, объем ВВП страны или объем
импорта/экспорта товаров за десятилетие может зависеть от нескольких
факторов: уровня инфляции, курса доллара и т. д [5].
В ходе выполнения расчетной части моделирования подбирают
соответствующую функцию, которая может быть линейной или нелинейной.
В настоящее время существует множество программных продуктов, которые
облегчают выполнение трудоемких расчетов на этапе моделирования. Так,
например, широко используется Microsoft Excel. Благодаря наличию
соответствующего инструментария в интерфейсе программы, можно при
однофакторном моделировании добавлять линию тренда с соответствующим
представлением модели и коэффициента детерминации, либо проводить
анализ множественной регрессии с помощью функции «Регрессия» и т.д [4].
4) Идентификация модели, в ходе которого происходит оценка неизвестных
параметром процесса.
5) Оценка качества модели, в ходе которой проверяется успешность решения
задач идентификации с помощью оценки на достоверность и адекватность.
Чаще всего это происходит с помощью коэффициента детерминации,
средней ошибки аппроксимации, по критерию F–Фишера и т.д.
6) Интерпретация результатов моделирования
Данные этапы носят условный характер, так как они могут пересекаться,
взаимно дополнять друг друга.
Таким образом, эконометрическое моделирование охватывает весь цикл
решения экономической задачи – от ее постановки до содержательной
интерпретации итогов статистического анализа и прогнозирования.
Практическая значимость эконометрического моделирования велика.
Правильно проведенный эконометрический анализ с соблюдением всех
правил и последовательностей является неотъемлемой частью
прогнозирования и управления экономическими, техническими и
социальными процессами как на уровне предприятий, так и на уровне
субъектов РФ и страны в целом.
3.2 Модели множественной регрессии
На любой экономический показатель чаще всего оказывает влияние не один, а
несколько факторов. Например, спрос на некоторое благо определяется не
только ценой данного блага, но и ценами на замещающие и дополняющие
блага, доходом потребителей и многими другими факторами. В этом случае
вместо парной регрессии рассматривается множественная регрессия
yˆ  f x1 , x2 ,..., x p 
Множественная регрессия широко используется в решении проблем
спроса, доходности акций, при изучении функции издержек производства, в
макроэкономических расчетах и в ряде других вопросов экономики. В
настоящее время множественная регрессия – один из наиболее
распространенных методов в эконометрике. Основной целью множественной
регрессии является построение модели с большим числом факторов, а также
определение влияния каждого фактора в отдельности и совокупного их
воздействия на моделируемый показатель.
Модель
множественной
линейной
регрессии
—
это практичная статистическая модель для оценки связей между непрерывной
зависимой переменной и переменными-предикторами.
Сама модель является линейной, так как она состоит из аддитивных членов,
каждый из которых представляет собой предиктор, умноженный на оценку
коэффициента. Как правило, в модель добавляется также константа
(свободный член).
Множественной называют линейную регрессию, в модели которой
число независимых переменных две или более.
Уравнение множественной линейной регрессии имеет вид:
Y=b0+b1x1+b2x2+⋯+bnxn,
Для модели множественной регрессии исследовать статистическую
значимость оценок коэффициентов с помощью t-статистики, а также
значимость всего уравнения в целом с помощью F-статистики.
Построим модель множественной регрессии для наших данных в R-studio и
проведем исследование.
Call:
lm(formula = Y ~ X1 + X2 + X3 + X4 + X5, data = Book)
Residuals:
Min
1Q Median
3Q Max
-9.461 -2.271 -0.026 1.658 31.832
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -7.297
3.435 -2.124 0.0368 *
X1
8.956
8.439 1.061 0.2918
X2
-8.956
8.439 -1.061 0.2918
X3
-8.953
8.439 -1.061 0.2920
X4
-8.955
8.439 -1.061 0.2919
X5
-8.957
8.439 -1.061 0.2917
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 4.752 on 79 degrees of freedom
Multiple R-squared: 0.2205,
Adjusted R-squared: 0.1711
F-statistic: 4.469 on 5 and 79 DF, p-value: 0.001229
3.3 Анализ различных спецификаций
Построение эконометрической модели начинается со спецификации
модели, заключающейся в получении ответа на два вопроса: 1) какие
экономические
показатели (признаки) должны быть включены в модель; 2) какой вид
имеет
аналитическая зависимость между отобранными признаками.
Символически эконометрическую модель, описывающую взаимосвязи
между явлениями или закономерности их развития, можно представить
с помощью соотношения:
y = f(α, x) + ε, (1.5)
где f(α, x) – функционал, выражающий вид и структуру взаимосвязей.
Здесь
величина y выражает уровень исследуемого явления и называется
зависимой (объясняемой) переменной или результативным признаком;
величина
x = (x1, x2,…, xp) представляет собой вектор независимых
(объясняющих) переменных xi или факторных признаков (факторов);
через α = (α0, α1, α2,…, αs) обозначен вектор некоторых произвольных
констант, называемых параметрами
модели; величина ε представляет собой погрешность (ошибку) модели.
Например, зависимость урожайности Y от количества внесенных
удобрений V выражается с помощью соотношения
Y = α0 + α1·V + α2·V2 + ε.
Ошибка модели ε характеризует отличие наблюдаемого (фактического)
значения переменной у от расчетного (модельного) значения,
вычисленного согласно соотношению (1.5) в конкретных условиях (при
определенных значениях факторов xi), и рассматривается как случайная
величина.
Заметим, что каждый конкретный функционал f(α, x) в (1.5) по причине
наличия произвольных констант определяет не одну, а целый класс
моделей.
Придание параметрам α = (α0, α1, α2,…, αs) определенных численных
значений
выделяет из этого класса конкретную модель Построение модели
линейной регрессии, как, впрочем, и всякой другой модели, начинается
с этапа сбора данных и процедуры спецификации, т.е. определения ее
структуры. Эта процедура во многом зависит от того, к какому типу
относятся переменные, включенные в нашу модель. Кратко
остановимся на процедуре сбора данных. Подробно эти вопросы
рассматриваются в курсе экономической статистики, которая является
одной из трех основных дисциплин, лежащих в основе эконометрики.
Измерение - это присвоение чисел или других символов
характеристикам объекта по заранее определенным правилам.
Очевидными примерами является измерение длины или веса. Более
сложным измерением является оценка доходности актива и уже совсем
нетривиальным является, например, измерение уровня подготовки
сотрудника. Во-первых, при измерении необходимо обеспечить взаимно
однозначное соответствие между степенью выраженности измеряемой
характеристики и множеством присваиваемых символов.
Необходимо добиться того, чтобы одинаковым символам
соответствовали одинаковые степени выраженности этих
характеристик. Во многих случаях, особенно когда роль человека в
процессе измерения очень велика, это достаточно сложно сделать. Вовторых, правило присвоения не должно зависеть от объекта измерения,
времени, места и других возможных обстоятельств, сопровождающих
наше измерение. Нельзя допускать возникновения ситуации, когда,
например, в понедельник расстояние измеряется в метрах, а во вторник
уже в футах, или количество одинаковой
продукции на разных предприятиях измеряется где - то в килограммах,
а где –
то в фунтах.
Формализацией процедуры измерения является шкалирование. Шкала это знаковая система, для которой задано гомоморфное отображение,
ставящее в соответствие реальным объектам тот или иной элемент
шкалы. Современная классификация шкал была предложена в 1946 году
Стэнли Смитом Стивенсом, и мы рассмотрим ту ее часть, которая
наиболее актуальна для эконометрики.
Прежде чем перейти к рассмотрению конкретных шкал, отметим, что
наличие "гомоморфного отображения" в определении понятия "шкала"
говорит о том, что операции, определенные для изучаемых объектов,
должны отображаться на операции в соответствующей знаковой
системе. Например, длина двух соединенных последовательно
длинномерных объектов (операция над объектами) равна сумме их длин
(операция для элементов шкалы). Если мы измеряем интенсивность
окраски объектов, то для менее окрашенного объекта (операция над
объектами – сравнение по интенсивности окраски) соответствующий
элемент шкалы должен быть меньше ее элемента для более
окрашенного объекта (операция сравнения для элементов шкалы). В
этом случае шкала не обязательно должна быть числовой, но на ней
должно быть определено отношение порядка. Шкалирование - это
отображение множества изучаемых объектов на шкалы. Например,
когда мы проводим измерение длины с помощью линейки, мы
отображаем такую характеристику, как длина.
Коэффициент детерминации модели свидетельствует о том, что
ВВП на душу населения на 74% объясняется факторами,
входящими в модель (Числом интернет-пользователей X(1),
индексом развития демократии X(2), общими расходами на
здравоохранение X(3), уровнем безработицы X(4), ожидаемой
продолжительностью жизнью X(5).). Значимое влияние (на 1%
уровне значимости) на ВВП на душу населения оказывают
следующие факторы: число интернет- пользователей X(1), индекс
развития демократии X(2), уровень безработицы X(4) (Согласно pзначению t-статистики оценок коэффициентов); на 10% уровне
значимости оказывают влияние – X(3) (общие расходы на
здравоохранение), X(5) – ожидаемая продолжительность жизни.
Адекватность построенной модели регрессии в целом показывает
F-статистика Фишера. P-value F- статистики меньше 0,05 говорит
от том, что регрессионная модель в целом значима, ей можно
доверять.
3.4 Модели с фиктивной переменной (бинарного выбора)
В теме фиктивные переменные рассматриваются модели, в которых какиелибо независимые переменные принимают дискретные значения. Например,
0 и 1, выражая некоторые качественные признаки относительно зависимой
переменной. Явно или неявно предполагалось, что она выражает
количественный признак, принимая непрерывное множество значений, но
довольно часто интересующая нас величина по своей природе является
дискретной.
Рассмотрим несколько типичных ситуаций.
1 блок. Выбор из двух или нескольких альтернатив (голосование ,например ,
решение работать или не работать, покупать или не покупать, выбор
профессии, способ попадания из дома на работу).
x t= 1
0
Когда есть две возможности, т.е. бинарный выбор и результат наблюдаемый
можно описать с помощью 1 и 0, то переменную называют бинарной.
Если есть выбор из k альтернатив (нескольких), то переменную
называют номинальной, если альтернативы нельзя естественным образом
упорядочить. Последние и предпоследние примеры – номинальные
переменные.
2 блок. Ранжированный выбор.
Есть несколько альтернатив, но они некоторым образом упорядочены.
Например, доходы семьи (высокие, низкие, средние), уровень образования
(высшее, среднее), состояние здоровья (плохое, удовлетворительное,
нормальное).
Т акие переменные называются порядковыми (ранговыми).
1
x t= 2
…
k
3 блок. Количественная целочисленная характеристика.
Например, количество прибыльных предприятий, количество
зарегистрированных патентов в течение года.
Для моделей с дискретными зависимыми переменными МНК применить
достаточно сложно.
Для рассмотрения первого типа ситуаций(для бинарных переменных) можно
применить модели бинарного выбора.
Модели с несколькими альтернативами можно свести к моделям бинарного
выбора или исследовать аналогичные методы.
Другой класс моделей, рассматриваемый для качественных переменных,
связан с цензурированными или урезанными выборками.
Пусть имеется общая модель линейной регрессии:
yt=x1/β+ε
yt=1
0
M(εt)=0
P(yt=1)=xt/β - линейная модель вероятности
Если в качестве уравнения выбрать функцию
P(yt=1)*F(xt/*β), где F – некоторая функция, область значений которой лежит
в отрезке от 0 до 1.
Предположим, что существует некая количественная переменная yt*,
связанная с независимыми переменными xt в обычном регресионном
уравнении. Например, yt*=xt/*β+ε
Решение соответствующих значений yt=1 принимается тогда, когда yt*
превосходит некоторые пороговые значения:
yt=1, если yt*=у пороговое;
yt=0, если yt= у пороговое
Если в качестве F используется функцию стандартизированного нормального
распределения, то соответствующую модель называют probit-моделью.
Если в качестве F используется функцию логистического распределения, то
соответствующую модель называют logit-моделью.
Зависимость между теми или иными факторами в эконометрике не всегда
можно описать с помощью линейной функции. В этом случае применяют
нелинейную регрессию. Общий вид:
yрасч=f(x1) – для однофакторной регрессии
y расч=f(x1,x2,…,xp) – для многофакторной регрессии
a>1
a<1
Для перехода к линейному виду, уравнение логарифмируют по
основанию a:
logay=logaabx+ε=bx+ ε
logay=bx+ ε
Заменим зависимую переменную logay на z:
z= bx+ ε
Частный случай экспоненциальной зависимости – логистическая кривая:
3.5 Сравнительный анализ построенных моделей (при сравнении
моделей использовать основные критерии качества модели, обязательно
проверить остатки моделей, сделать вывод об эффективности оценок
моделей)
Изучение уже разработанных систем, сравнение их друг с другом, выявление
преимуществ и недостатков каждой из них – один из апробированных методов
совершенствования системы показателей.Сложность этого вида исследования
состоит в том, что подобрать достаточное количество однотипных систем с
одинаковым содержанием, структурой и целенаправленностью практически
невозможно. Обычно приходится иметь дело со сложным информационным
массивом сравнений (компаративным массивом), состоящим из разнотипных
систем. Процедуры сравнения в подобных случаях значительно затрудняются,
т.к. появляется опасность случайных, субъективных произвольных выводов.
В информатике, статистике и компаративистике имеется достаточно много
методик сравнительного анализа рассматриваемого объекта. Здесь же
целесообразно остановиться на проблеме методологии формирования
компаративного массива, компаративных процедур и получения выводов из
проведенного сравнения.
• Формирование компаративного массива.Опыт показывает, что минимальное
количество различных показателей, с которым можно вести сравнительное
исследование – не более нескольких десятков единиц. Иначе потребуются
годы работы большого исследовательского коллектива при значительных
затратах времени и средств. Кроме того, наращивание информационного
массива сверхдостаточного репрезентативного минимума существенно
снижает эффективность выходных данных.
Имеются два метода отбора репрезентативного минимума: концентрического
сужения потенциального массива информации по заранее заданным
критериям; последовательного расширения какого-либо элемента указанного
массива, принятого за исходный.
Сужение потенциального массива информации ведут несколькими этапами с
удалением на каждом из них тех частей, которые признаются выходящими за
рамки исследования или не имеют к нему непосредственно отношения. В
итоге определяются узкие рамки окончательного отбора системы социальных
показателей изучаемого объекта в целом, изложенные в специальных
изданиях в определенном временном промежутке. Такому жесткому критерию
обычно удовлетворяет лишь несколько названий работ в советской и
зарубежной социологической литературе. Для обеспечения минимума
достаточной репрезентативности требуется некоторое его расширение по
другому ряду критериев.
Однако этот список необходимо дополнить работами, в названиях которых не
фигурирует сам термин, обозначающий исследуемые явления, но которые по
своему содержанию посвящены социальным показателям именно этого
явления. Это относится в первую очередь к зарубежным работам, затем – к
социальной статистике, охватывающей проблематику изучаемого объекта в
целом, далее – к литературе по тем или иным социальным проблемам, где в
центре внимания автора оказалась фактически интересующая нас
проблематика.
Последний критерий наиболее сложен: тщательное изучение каждого издания
и вынесение решения о включении или исключении его на основании
индивидуальной экспертной оценки связано с повышением риска ошибки,
особенно в тех случаях, когда содержание, структура и направленность
издания не могут быть определены однозначно. Здесь возможен наибольший
процент ошибочного выбора.
Перечисленные
процедуры
касаются
содержательной
стороны
информационного массива. Аналогичную работу следует проделать и по
критериям формальной стороны. Часто число изданий, опубликованных в
виде монографий строго по данной проблематике по указанным критериям,
насчитывает всего несколько единиц. Поэтому есть смысл добавить к ним
статьи этого же характера из специальной научной периодики, издания по
социальной статистике, полностью отвечающие установленным критериям, а
также ротапринтные или ксерокопированные доклады. Эта последняя группа
не уступает по своей содержательности монографиям и статьям, а по степени
оперативности информации может их и превосходить.
В схематическом виде компаративный массив может быть представлен как
совокупность блоков показателей (или отдельных агрегированных
показателей) исследуемого объекта.
В целом сформированный таким образом информационный массив
достаточно репрезентативен, чтобы вести сравнительное исследование,
выводы которого могли бы иметь значение для всей совокупности систем и
показателей исследуемого объекта в отечественной и зарубежной литературе.
• Компаративные процедуры:блоки показателей. Сравнительное исследование
делится на два этапа: сравнение блоков показателей; исследовательские
процедуры, той части компаративного массива, которая содержит сведения о
конкретных показателях. Собственно процедуры таковы:
а) сравнение числа блоков показателей (или отдельных агрегированных
показателей) в различных системах;
б) сравнительный анализ структуры блоков изучаемых систем. Процедура
количественно-качественного характера, где на первом плане стоят вопросы
соотношения различных блоков;
в) сравнительный анализ внутренней структуры каждого блока обозреваемых
систем, для чего необходим частичный выход за рамки простой номенклатуры
сопоставительной таблицы и изучение особенностей названий отдельных
блоков. Здесь наиболее приемлем способ членения основных блоков типичной
компактной системы, в котором выделяют три главных подхода:
• Разделение основных блоков на подблоки,выступающие в качестве
самостоятельных наряду с основными.
• Разделение блока на несколько подгрупп показателей,образующих
относительно самостоятельные подблоки. Это деление близко к первому, но
отличается от него гораздо большей степенью детализации, причем каждый
блок обычно выступает как совокупность нескольких подблоков под одной
рубрикой.
• Сведение нескольких подблоков в один сложный блок,выступающий как
совокупность подблоков под одной рубрикой. Достигается примерно тот же
результат, что и в предыдущем случае, но уже не дифференциацией
(декомпозицией) блока на подблоки, а, напротив, интеграцией (композицией)
подблоков в блок, значительно более агрегированный и более сложный по
своей структуре, чем обычные. По характеру – это качественноколичественная процедура;
г) сравнительный анализ внутреннего содержания систем, для чего необходим
полный выход за рамки номенклатуры сопоставительной таблицы и изучение
внутренней структуры каждого блока. Процедура сугубо качественного
характера.
• Компаративные процедуры:отдельные показатели. Для того, чтобы
выработать рекомендации по дальнейшему совершенствованию отдельных
показателей, необходимо путем сравнительного анализа выявить наиболее
эффективные частные типы показателей. С этой целью проводятся еще три
процедуры исследования:
д) сравнение систем, состоящих не из блоков, а из отдельных агрегированных
показателей;
е) сравнение блоков остальных систем компаративного массива, содержащих
не только блоки, но и конкретные показатели;
ж) сравнительно-качественный
показателей.
анализ
выявленных
частных
типов
Приведенный перечень не исчерпывает все существующие и потенциально
возможные частные типы показателей. Требуется специальное исследование,
чтобы свести эти типы в систему, сопряженную с системами классификации
показателей.
В существующих системах социальных показателей в основном используются
простейшие частные типы показателей, по которым сравнительно легко
индицировать информацию, но которые дают невысокий уровень материалов
для обобщений и выводов, необходимых в теоретической или практической
работе с показателями.Наиболее распространенный тип – процентная доля.
При правильной постановке дела этот показатель сообщает исследователю
или практическому работнику гораздо больше, чем простое абсолютное число,
но все же гораздо меньше, чем более сложные и более трудоемкие показатели.
Вместе с тем следует иметь в виду, что социальные показатели – это не вся
социальная статистика, а только та количественно небольшая ее часть, которая
позволяет измерять важнейшие социальные изменения, строить динамические
ряды для сравнений во времени и пространстве. Такой подход
непосредственно связывает любую систему социальных показателей с той или
иной стороной исследуемого объекта или со всем объектом в целом, но в то
же время предъявляет жесткие требования к каждому отдельному показателю.
ЗАКЛЮЧЕНИЕ
С использованием описанной методологии могут рассматриваться различные
варианты трансформации рабочей силы. Как было отмечено в работе
«перераспределение доходов может выполнять не только важную социальную
функцию (за счет выравнивания доходов и решения проблем бедности), но
и функцию оптимизации структуры доходов и расходов населения с точки
зрения
формирования условий для экономического роста». В этой связи в качестве
критериев эффективности такого перераспределения могут выступать
сокращение в экономике низкооплачиваемых рабочих мест, снижение
дифференциации по оплате
труда, рост объемов потребления, максимизация темпов экономического роста
или
сокращение разрывов между квалификационной структурой занятости со
странами,
имеющими более высокий уровень экономического развития.
Список литературы
1.
Магнус
Я.
Р., Катышев П.
К., Пересецкий
А.
А.
Эконометрика. Начальный курс. - Дело, 2005. – 503с.
2.
Поляков К. Л. Введение в эконометрику. Эконометрика и
математическая статистика. - МИЭМ, 2003. – 87с.
3.
Левин Дэвид М. и др. Статистика для менеджеров. Четвертое издание. Вильямс, 2005. – 1310с.
4.
Сигел Эндрю Ф. Практическая бизнес-статистика. Четвертое издание. Вильямс, 2002. – 1051с.
5.
Ивченко Г.И., Медведев Ю.И. - Математическая статистика, 1992. –
246с.
6.
Айвазян С.
А., Мхитарян В.С. Прикладная
статистика и
основы эконометрики. - ЮНИТИ, 1998. – 1022с.
7.
Себер Дж. Линейный регрессионный анализ. – М.: Мир, 1980. – 456с.
8.
Хьюбер П. Робастность в статистике- М.: Мир, 1984. – 303с.
9.
Дрейпер Н., Смит Г. Прикладной регрессионный анализ - М.:
Статистика, 1973. – 262с.
10. Дэвид А. Марка, Клемент МакГоуэн. Методология структурного
анализа и проектирования SADT. - М., 1993.
11. William H. Greene, Econometric analysis, 5-th edition, Prentice Hall, 2002,
802c.
12. К. Л. Поляков, Введение в эконометрику. Часть 1 Эконометрика и
математическая статистика. Учебное пособие. МИЭМ 2003
Download