Статистические программы и обработка данных Статистическая сводка и группировка ...................................................................................................... 2 Группировки ................................................................................................................................................ 2 Статистическая группировка ................................................................................................................. 3 Принцип построения статистических группировок ............................................................................ 4 Интервалы ................................................................................................................................................ 5 Правила округления шага интервал ...................................................................................................... 5 Статистические таблицы ........................................................................................................................ 6 Статистическая сводка и группировка Сводка – комплекс последовательных операций по обобщению конкретных единичных фактов для выявления типичных черт и закономерностей, присущих явлению в целом. Виды сводки: 1) Глубине и точности обработки a. Простая – операция подсчёта общих итогов по совокупности единиц наблюдения b. Сложная – комплекс операций, включающих группировку единиц наблюдения, подсчёт итого в каждой группе и по всему объекту и представление результатов в виде статистических таблиц. 2) Форма обработки a. Централизованная – весь материал поступает в одну организацию, подвергается в ней обработке от начала и до конца. b. Децентрализованная – отчёты предприятий сводятся статистическими органами субъектов РФ, а полученные итоги поступают в Федеральную служу государственной статистики. 3) По технике выполнения a. Механизированная b. Ручная Группировки Группировка – расчленение единиц изучаемой совокупности на однородные группы по определённым существенны для них признакам. Задачи, решаемые методом группировки: 1) Выделение социально-экономических типов явлений. 2) Изучение структуры явления и структурных сдвигов, происходящих в нём. 3) Выявление связи и зависимости между явлениями. Виды группировок: 1) Типологическая – расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений. 2) Структурная – группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку. 3) Аналитическая – группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками. Статистическая группировка Простая группировка – группировка, в которой группы образованы по одному признаку. Комбинаторная группировка – группировка, в которой расчленение на группы производится по двум и более признакам, взятым в сочетании (комбинации). При построении комбинационной группировки сначала группы формируются по одному признаку, затем делятся на подгруппы по другому признаку и т. д. При этом рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия. Виды признаков: 1) Факторные – признаки, под действием которых изменяются другие признаки 2) Результативные – признаки, изменяемые под действием факторов. Принцип построения статистических группировок Группировочный признак – признак, по которому проводится разбиение единиц совокупности на отдельные группы. Группировочный признак: 1) Атрибутивный 2) Количественный При группировке по атрибутивному признаку число групп определяется количеством соответствующих наименований, если их число невелико Если атрибутивный признак имеет большое число разновидностей, то при группировке ряд наименований объединяют в одну группу. Для обоснованного объединения их в группы разрабатываются классификации. При группировке по количественному признаку число групп определятся в зависимости от характера изменения признака и задач исследования Если количественный признак меняются дискретно, то число групп должно соответствовать количеству значений признака. При непрерывном изменении признака число групп может быть рассчитано по формуле Стерджесса: 𝑛 = [3.322 ∗ 𝑙𝑔𝑁] + 1, где n – число групп; N – число единиц совокупности Применение формулы Стерджесса дает хорошие результаты, если совокупность состоит из большого числа единиц и имеет распределение близкое к нормальному. Интервалы Интервал – разница между максимальным и минимальным значениями признака в каждой группе. Величина равного интервала: ℎ= 𝑅 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 или ℎ = , где 𝑛 𝑛 xmax, xmin – максимальное и минимальное значение признаку в совокупности; n – число групп; R – размах выборки. Неравные интервалы часто применяются в аналитических группировках. Неравные интервалы могут быть прогрессивно возрастающими или убывающими в арифметической или геометрической прогрессии. Величина интервала определяется следующим образом: Специализированные интервалы используются в типологических группировках; границы устанавливаются там, где намечается переход от одного качества к другому. Наметить точки перехода можно только на основе теоретического анализа, используя для выделения типов не отдельные, изолированные признаки, а совокупность признаков, характеризующих различные стороны изучаемого явления. Правила округления шага интервал 1) Если величина h имеет один знак до запятой, то её округляют до десятых. 2) Если величина h имеет два знака до запятой, то её округляют до целого числа. 3) Если величина h имеет три знака до запятой, то её округляют до числа, кратного 50 или 100, и тд. Статистические таблицы Результаты группировки и сводки оформляются в виде статистических таблиц В статистической таблице выделяются два элемента: 1) Подлежащее – перечень единиц или групп, на которые подразделена вся масса единиц наблюдения. 2) Сказуемое – числовые значения, при помощи которых характеризуются выделенные в подлежащем единицы или группы. Групповой таблицей называется таблица, подлежащее которой образовано в результате группировки единиц по одному признаку. Комбинационная таблица – таблица, подлежащее которой образовано в результате группировки единиц совокупности по двум и более признакам. В сказуемом групповых и комбинационных таблиц на основе абсолютных величин вычисляют средние и относительные величины, позволяющие раскрыть особенности и закономерности развития изучаемого явления. Ряд распределения Ряд распределения – совокупность значений признака (вариант) И СООТВЕТСТВУЮЩИХ ИМ частот, представленная в виде таблицы. Атрибутивный ряд – ряд распределения, построенный по качественным признакам (не имеющим числового выражения). Вариационный ряд – ряд распределения, построенный по количественном признаку. Варианта – отдельное значение признака, которое он принимает в вариационном ряду. Частота – численность отдельной варианты или каждой группы вариационного ряда. Дискретный вариационный ряд – ряд, который характеризует распределение единиц совокупности по дискретному признаку. Интервальный вариационный ряд – ряд, который характеризует распределение единиц совокупности по непрерывному признаку. Графическое изображение ряда распределения Графическое изображение ряда распределения осуществляется и помощью полигона, гистограммы, огивы и кумуляты. Кумулята (кривая сумм) изображает ряд накопленных частот. Накопленная частота определяется путём последовательного суммирования частот по группам. Накопленная частота показывает, сколько единиц совокупности имеют значения признаку не больше, чем рассматриваемое значение. Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то получится огива. Разделение группировок: 1) Типологическое 2) Структурное 3) Аналитическое Ряды распределений Данные сводки и группировки представляются в виде распределения оформляются в виде статистических таблиц. Ряд распределения – упорядоченное распределение единиц изучаемой совокупности на группы по определённому варьирующему признаку. Ряды распределения: 1) Атрибутивный – построение по качественному признаку. 2) Вариационные – построение в порядке возрастания или убывания количественного признака. Построить ряд распределения – значит упорядочить распределение единиц совокупности по значениям признака, а затем подсчитать их число (построить групповую таблицу). Три формы вариационного ряда: 1) Ранжированный – распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. 2) Дискретный – вариационный ряд в основу построения которого положен признак с прерывным изменением (количество детей в семье, число работников и тд.). 3) Интервальный – вариационный ряд, в основу построения которого положен признак, который в определённых границах может принимать любые значения (размер доходов, стаж работы, стоимость и тд). Вариационный ряд состоит из двух столбцов: В первом столбце приводятся количественный значения варьирущиегося признака – Варианты. Варианты выражаются дискретным число и находятся в интервале отрезка. Во втором столбце содержится количество конкретных вариантов, они определяются по Частоте – число, показывающее столько раз в совокупности, встречается данные значения признака. Частости – частота, выраженная в процентах к итогу, сумма всех частостей равна 100%. Графическое изображение рядов распределения: 1) Полигон (данные микропереписи населения России) 2) Гистограмма – используется для изображения интервальных вариационных рядов. На Оси x – граница интервала. Y – частоты или частости. 3) Кумулята – используется для изображения вариационного ряда по накопленным частотам (частостям). На оси х – значения признака или границ интервала. Y – накопленную частоту или «скопленную частость» 4) Огива – строится аналогично Кумуляте, но накопленные частоты помещаются на оси х, а значения признака на X. Функции Excel Показатели описательные статистики: 1) Показатели положения a. Средняя b. Мода c. Медиана 2) Показатели разброса a. Дисперсия b. Стандарт c. R 3) Показатели асимметрии a. Положение медианы относительно среднего 4) Показатели распределения a. Полигон b. Кумулята c. Гистограмма d. Эксцесс Функции, используемые при расчёте показателей положения: 1) MИН 2) MAX 3) НАИМЕНЬШИЙ – наименьшее значение в множестве данных. 4) МАКС 5) НАИБОЛЬШИЙ 6) Квартиль – рассчитывает квартиль дискретного вариационного ряда. a. Если k=0, мин значение b. Если 1, первую квартиль c. Если 2, значение медианы d. Если 3, третью квартиль e. Если 4, максимальное значение 7) СРЗНАЧ 8) СРГАМ – рассчитывает среднее гармоническое множества данных. 9) СРГЕОМ – рассчитывает среднюю геометрическую. 10) Мода – отображает наиболее встречающиеся значения. 11) МЕДИАНА – рассчитывает медиану вариационнного ряда. 12) Дисп – отсеивает генеральную дисперсию по выборке. 13) СТАНДОТКЛОН – оценивает генеральное стандартное отклонение по выборке. 14) СРОТКЛ – вычисляет среднее невзвешенное отклонение множества данных. 15) СКОС – оценивает коэффициент асимметрии по выборке. 16) ЭКСЦИСС – оценивает коэффициент по выборки. Показатели вариации и анализ её частотных распределений: 1) Абсолютные 2) Относительные Размах вариации – важный показатель колеблемости признака, но не исчерпывающий его характеристику. Дисперсия 1) Простая 2) Взвешенная Относительные показатели вариации: 1) Коэффициент осцилляции 2) Линейный коэффициент вариации 3) Коэффициент вариации