Статистическая сводка и группировка данных 1 Сводка – это особая стадия статистического исследования, в ходе которой систематизируются первичные материалы статистического наблюдения. Сводка – это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. По глубине обработки материала • Простой сводкой – называется операция по подсчету общих итогов по совокупности единиц наблюдения. • Сложная сводка – представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц. По форме обработки материала сводка бывает: Централизованная - когда весь первичный материал поступает в одну организацию, подвергается в ней обработке от начала до конца; Децентрализованная - когда отчеты предприятий сводятся статистическими органами субъектов РФ, а полученные итоги поступают в Федеральную службу статистики РФ и там определяются итоговые показатели в целом по народному хозяйству страны. Метод группировки Группировкой называется разделение множества единиц изучаемой совокупности на группы по определенным существенным для них признакам. Статистические группировки по целям исследования: 1. Типологическая группировка – это разделение исследуемой совокупности на классы, социальноэкономические типы, однородные группы единиц в соответствии с правилами научной группировки. Состав населения Российской Федерации в 2010 г. Категория населения Численность населения, тыс. чел. Городское 103 705 Сельское 38 209 Всего 141 914 Рассматривая данные этой таблицы можно определить, что 73,1% населения России составляют горожане. Статистические группировки по целям исследования: 2. Структурными называют группировки, в которых происходит разделение однородной совокупности на группы, характеризующие ее структуру по какомулибо варьирующему признаку. Пример: Структурная группировка Распределение населения по величине среднедушевых денежных доходов, за 2009 г. Размер среднедушевого денежного дохода, руб. в месяц Численность населения, % До 2000 1,0 2000-4000 6,5 4000-6000 10,3 6000-8000 11,1 8000-10000 10,4 10000-15000 20,4 15000-25000 21,8 Свыше 25000 18,5 ИТОГО 100 Статистические группировки по целям исследования: 3. Аналитическая (факторная) группировка выявляет взаимосвязи между изучаемыми признаками. Выделяют факторный и результативный признак. Факторными называются признаки, оказывающие влияние на изменение результативных признаков. Результативными называются признаки, изменяющиеся под влиянием факторных. Пример: Аналитическая группировка Группировка зависимости суммы кредитов, выданных коммерческими банками, от размера процентной ставки Группы банков по величине процентной ставки, % Число банков 11-15 Сумма выданных кредитов, млн. руб. Всего В среднем на один банк 7 168,1 24,0 15-19 13 200,5 15,4 19-23 7 54,4 7,8 23-27 3 6,8 2,3 ИТОГО 30 429,8 14,3 Этапы построения статистической группировки: 1. Определение группировочного признака. 2. Определение числа групп, на которые нужно разбить исследуемую совокупность. 3. Расчет ширины (величины) интервала группировки. 4. Представление результатов группировки в табличной форме. Определение группировочного признака Группировочным признаком называется признак, по которому проводится разбиение единиц n 1 3,322 lg N Его часто совокупности на отдельные группы. называют основанием группировки. В основание группировки могут быть положены как количественные, так и атрибутивные (качественные) признаки. Определение числа групп • Если группировка строится по атрибутивному признаку, то число групп, как правило, будет столько, сколько имеется градаций, видов состояний у этого признака. • Если группировка проводится по количественному признаку, то число групп можно определить математически путем использования формулы Стерджесса: n 1 3,322 lg N • где n – число групп N – число единиц совокупности Определение величины интервала Интервал – это значение варьирующего признака, лежащее в определенных пределах. • Нижней границей интервала называется наименьшее значение признака в интервале. • Верхней границей интервала называется наибольшее значение признака в интервале. • Величина интервала представляет собой разность между верхней и нижней границами интервала. • Интервал, имеющий и верхнюю и нижнюю границу является закрытым интервалом. • Если у интервала имеется только одна граница: верхняя – у первого и нижняя – у последнего, то интервал называется открытым. Определение величины интервала • Величина равного интервала: h X max X min n • h – величина интервала; • X max , X min - максимальное и минимальное значение признака в совокупности; • n – число групп • Величина неравного интервала изменяющегося в арифметической прогрессии hi 1 hi a изменяющегося в геометрической прогрессии hi 1 hi q a – константа, имеющая для прогрессивно-возрастающих интервалов знак «+», а для прогрессивно-убывающих интервалов знак «-». q – константа, имеющая для прогрессивно-убывающих интервалов q<1, для прогрессивно-возрастающих интервалов q>1. Пример группировки с закрытыми интервалами Группы банков по величине процентной ставки, % Число банков 11-15 Сумма выданных кредитов, млн. руб. Всего В среднем на один банк 7 168,1 24,0 15-19 13 200,5 15,4 19-23 7 54,4 7,8 23-27 3 6,8 2,3 ИТОГО 30 429,8 14,3 Пример группировки с открытыми интервалами Ряд распределения Ряд распределения – это простейшая группировка, в которой каждая группа характеризуется только частотой. Различают атрибутивные и вариационные ряды распределения АТРИБУТИВНЫЕ (построенные по качественному признаку) ВАРИАЦИОННЫЕ (построенные по количественному признаку) интервальные дискретные Пример атрибутивного ряда распределения Состав населения Российской Федерации в 2010 г. Категория населения Численность населения, тыс. чел. Удельный вес во всей численности, % к итогу Городское 103 705 73,1 Сельское 38 209 26,9 Всего 141 914 100 Вариационный ряда распределения Вариационный ряд состоит из двух элементов: вариантов и частот. • Вариантами называются отдельные значения признака. • Варианты признака обозначаются через хi. • Частоты показывают, как часто встречаются те или иные значения признака в изучаемой совокупности и обозначаются через fi . • Сумма всех частот определяет численность совокупности, ее объем. • Частостями называются частоты выражены в долях единиц или в процентах к итогу, тогда соответственно сумма частостей будет равна 1 или 100%. Дискретный вариационный ряд Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые числа. Пример дискретного вариационного ряда Распределение студентов в соответствии с оценкой, полученной в сессию Балл (оценка), Число студентов, fi Удельный вес в общей численности студентов, % 5 34 29,8 4 37 32,5 3 33 28,9 2 10 8,8 ИТОГО 114 100 хi Интервальный вариационный ряд Интервальный вариационный ряд – это ряд распределения, в котором группировочный признак задан интервальными значениями. Пример интервального вариационного ряда Распределение коммерческих банков по величине процентной ставке Группы банков по процентной ставке, % Количество банков, шт. 11-15 6 15-19 4 19-23 3 23-27 2 ИТОГО 15 fi Интервальный вариационный ряд Интервальный вариационный ряд – это ряд распределения, в котором группировочный признак задан интервальными значениями. Пример интервального вариационного ряда Распределение коммерческих банков по величине процентной ставке Группы банков по процентной ставке, % Количество банков, шт. fi Удельный вес, % к итогу 11-15 6 40 15-19 4 27 19-23 3 20 23-27 2 13 ИТОГО 15 100 Интервальный вариационный ряд Интервальный вариационный ряд – это ряд распределения, в котором группировочный признак задан интервальными значениями. Пример интервального вариационного ряда Распределение коммерческих банков по величине процентной ставке !!!! хi Группы банков по процентной ставке, % Количество банков, шт. fi Удельный вес, % к итогу 11-15 6 40 15-19 4 27 19-23 3 20 23-27 2 13 ИТОГО 15 100 хi - в интервальном вариационном ряду - это середина интервала Интервальный вариационный ряд Интервальный вариационный ряд – это ряд распределения, в котором группировочный признак задан интервальными значениями. Пример интервального вариационного ряда Распределение коммерческих банков по величине процентной ставке !!!! хi Группы банков по процентной ставке, % Количество банков, шт. хi fi Удельный вес, % к итогу 11-15 6 40 13 15-19 4 27 17 19-23 3 20 21 23-27 2 13 25 ИТОГО 15 100 - - в интервальном вариационном ряду - это середина интервала Средние величины 28 Средняя величина - это обобщающая количественная характеристика совокупности по изучаемому признаку в конкретных условиях места и времени. ИСХОДНОЕ СООТНОШЕНИЕ СРЕДНЕЙ (ЛОГИЧЕСКАЯ ФОРМУЛА СРЕДНЕЙ): ИСС X Суммарное значение или объем осредняемого признака Число единиц или объем совокупности Пример: Расчет средней заработной платы работников предприятия. Что будет в числителе и знаменателе ИСС? Виды средних Средняя арифметическая простая x x i n Средняя арифметическая взвешенная (рассчитывается по сгруппированным данным) xf x f i i i Пример: Производительность труда каждого из 5-и рабочих составляет: 50, 46, 58, 42, 44 изделий за смену. Определить среднюю производительность труда одного рабочего. Пример: Производительность труда каждого из 5-и рабочих составляет: 50, 46, 58, 42, 44 изделий за смену. Определить среднюю производительность труда одного рабочего. В этом случае решение имеет следующий вид: x 50 46 58 42 44 x 48 n 5 Пример: Распределение сотрудников предприятия по возрасту Возраст, лет Число сотрудников, чел. хi xi f i До 25 6 20 120 25-35 15 30 450 35-45 58 40 2320 45-55 12 50 600 55-65 7 60 420 Более 65 2 70 140 ИТОГО 100 - 4050 fi Средний возраст сотрудников на данном предприятии составляет 40,5 лет x f x f i i i 4050 40,5 100 Средняя величина по способу моментов (от условного нуля) xi A ( h ) fi x h A fi индивидуальные значения признака в совокупности; f i - частота; h - величина интервала; А - середина интервала, обладающего наибольшей частотой xi - Пример: Распределение сотрудников предприятия по возрасту Возраст, лет Число сотрудник ов, чел. хi До 25 6 20 -2 -12 25-35 15 30 -1 -15 35-45 58 40 0 0 45-55 12 50 1 12 55-65 7 60 2 14 Более 65 2 70 3 6 ИТОГО 100 - - 5 ( fi А =40; h =10 xi A ) h ( xi A ) fi h xi A ( h ) fi 5 x h A 10 40 40,5 100 fi СПАСИБО ЗА ВНИМАНИЕ 37