ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВЫЙ ЭКОНОМИЧЕСКИЙ ИНСТИТУТ КАФЕДРА СТАТИСТИКИ Курсовая работа по дисциплине «Статистика» На тему «Непараметрические средние, их виды и применение в анализе общественных явлений» Исполнитель: Специальность: БУАиА Группа: № зачетной книжки: Руководитель: В.М. Симчера Москва ВВЕДЕНИЕ 3 I. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 4 1. Средние величины в экономическом анализе 4 2. Виды средних величин 6 2.1. Средняя арифметическая 8 2.2. Средняя гармоническая 10 2.3. Средняя геометрическая 13 2.4. Средняя квадратическая и средняя кубическая 14 2.5. Структурные средние 15 II. РАСЧЕТНАЯ ЧАСТЬ 19 III. АНАЛИТИЧЕСКАЯ ЧАСТЬ 28 ЗАКЛЮЧЕНИЕ 37 СПИСОК ЛИТЕРАТУРЫ 38 ПРИЛОЖЕНИЯ 39 2 Введение В данной работе рассмотрим такое понятие, как средние величины. Большое распространение в статистике коммерческой деятельности имеют средние величины. В средних величинах отображаются важнейшие показатели товарооборота, товарных запасов, цен. Средними величинами характеризуются качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др. Правильное понимания сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития. В теоретической части рассмотрим виды средних величин, а именно: средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая, средняя кубическая и структурные средние - в экономическом анализе, а также условия их применения. В расчетной части представлены задачи на нахождение средних величин. На примере этих задач покажем способы нахождения средних величин, и использование их в экономическом анализе. В аналитической части проведем анализ данных по объему продукции (работ, услуг), произведенной (произведенных) на малых предприятиях некоторых отраслей экономики. При проведении статистического анализа данных для текущей работы были использованы следующие программные средства: Microsoft Word и Microsoft Excel. 3 Теоретическая часть Средние величины в экономическом анализе Статистика, как известно, изучает массовые социально- экономические явления. Каждое из этих явлений может иметь различное количественное выражение одного и того же признака. Например, заработная плата одной и той же профессии рабочих или цены на рынке на один и тот же товар и т.д. Для изучения какой-либо совокупности (количественно изменяющимся) по варьирующим признакам статистика использует средние величины. Средняя характеристика величина это - совокупности обобщающая однотипных количественная явлений по одному варьирующему признаку. В экономической практике используется широкий круг показателей, вычисленных в виде средних величин. Например, средняя продолжительность рабочего дня, средний тарифный разряд рабочих, средний уровень производительности труда и т.д. Средние величины позволяют сравнивать показатели, относящиеся к совокупностям с различной численностью единиц. Важнейшим условием научного использования средних величин в статистическом анализе общественных явлений является однородность совокупности, для которой исчисляется средняя. В современных условиях развития рыночных отношений в экономике средние закономерностей экономическом служат инструментом изучения социально-экономических явлений. анализе нельзя ограничиваться объективных лишь Однако в средними показателями, так как за общими благоприятными средними могут скрываться и крупные серьезные недостатки в деятельности отдельных хозяйствующих субъектов, и ростки нового, прогрессивного. Так, например, распределение населения по доходу позволяет выявлять формирование новых социальных групп. Поэтому наряду со средними 4 статистическими данными необходимо учитывать особенности отдельных единиц совокупности. Средняя величина является равнодействующей всех факторов, оказывающих влияние на изучаемое явление. То есть, при расчете средних величин взаимопогашается влияние случайных факторов и, таким образом, возможно определение закономерности, присущей исследуемому явлению. Средние в общественных явлениях обладают относительным постоянством, т.е. в течение какого-то определенного промежутка времени однотипные явления характеризуются примерно одинаковыми средними. 5 Виды средних величин В статистике применяются различные виды средних: средняя арифметическая, средняя гармоническая, средняя квадратичная, средняя геометрическая и структурные средние – мода, медиана. Средние величины различаются в зависимости от учета признаков, влияющих на осредняемую величину: если средняя величина рассчитывается для признака, без учета влияния на него каких-либо других признаков, то такая средняя величина называется простой средней; если имеются сведения о влиянии на осредняемый признак некоторого признака или нескольких признаков, которые необходимо учесть при расчете для корректного расчета средней величины, то рассчитывается средняя взвешенная. По форме расчета выделяют несколько видов средних величин, которые образованы из единой степенной средней величины. Степенная средняя величина имеет форму: n x m x i 1 n m i , где x - среднее значение исследуемого явления; m – показатель степени средней; x – текущее значение (вариант) осредняемого признака; n – число признаков. При разных показателях степени m различают следующие виды средних величин (Таблица 1): Таблица 1 Степень средней величины (m) -1 0 1 2 3 Название средней средняя гармоническая средняя геометрическая средняя арифметическая средняя квадратическая средняя кубическая 6 В каждом отдельном случае вид средней выбирается путем конкретного анализа изучаемой совокупности. В статистической практике кроме степенных средних используются средние структурные. 7 Средняя арифметическая Средняя арифметическая может быть представлена в форме простой средней и взвешенной средней. Средняя арифметическая простая равна сумме отдельных значений осредняемого признака, деленной на число этих значений. Отдельные значения признака называют вариантами и обозначают через х ( x1, x2 ,..., xn ); число единиц совокупности обозначают через n, среднее значение признака – через х . Следовательно, средняя арифметическая простая равна: x x ... xn x x 1 2 . n n Например, имеются следующие данные о производстве рабочими продукции А за смену: № раб. Выпущено изделий за смену 1 2 3 4 5 6 7 8 9 10 16 17 18 17 16 17 18 20 21 18 В данном примере варьирующий признак - выпуск продукции за смену. Численные значения признака (16, 17 и т. д.) называют вариантами. Определим среднюю выработку продукции рабочими данной группы: x 16 17 18...18 178 17,8 10 10 Средняя арифметическая простая применяется в случаях, когда имеются отдельные значения признака, т.е. данные не сгруппированы. Если данные представлены в виде дискретных или интервальных рядов распределения, то средняя арифметическая исчисляется иначе. Средняя арифметическая взвешенная вычисляется по формуле x xf , где f - частота повторения вариантов признака, называемая весом. f Таким образом, средняя арифметическая взвешенная равна сумме 8 взвешенных x вариантов признака, деленная на сумму весов: x1 f1 x2 f 2 ... xn f n . f1 f 2 ... f n Статистический материал в результате обработки может быть представлен не только в виде дискретных рядов распределения, но и в виде интервальных вариационных рядов с закрытыми или открытыми интервалами. При расчете средней по интервальному вариационному ряду необходимо сначала найти середину интервалов. Это и будут значения x, а количество единиц совокупности в каждой группе - f (таблица 2). Таблица 2 Возраст рабочего, лет 20-30 30-40 40-50 50-60 60 и более Итого Средний x Число рабочих, чел (f) 7 13 48 32 6 106 возраст Середина возрастного интервала, лет (x) 25 35 45 55 65 Х рабочих цеха будет равен 25 * 7 35 * 13 45 * 48 55 * 32 65 * 6 47 лет. 106 В практике экономической статистики иногда приходится исчислять среднюю по групповым средним или по средним отдельных частей совокупности (частным средним). В таких случаях за варианты (х) принимаются групповые или частные средние, на основании которых исчисляется общая средняя как обычная средняя арифметическая взвешенная. 9 Средняя гармоническая Наряду со средней арифметической, в статистике применяется средняя гармоническая величина. Как и средняя арифметическая, она может быть простой и взвешенной. Применяется она тогда, когда необходимые веса (f) в исходных данных не заданы непосредственно, а входят сомножителем в одни из имеющихся показателей. Средняя гармоническая простая рассчитывается по формуле x n , т.е. это обратная величина средней арифметической простой из 1 x обратных значений признака. Например, бригада токарей была занята обточкой одинаковых деталей в течение 8-часового рабочего дня. Первый токарь затратил на одну деталь 12 мин, второй - 15 мин., третий - 11, четвертый - 16 и пятый 14 мин. Определите среднее время, необходимое на изготовление одной детали. На первый взгляд кажется, что задача легко решается по формуле средней арифметической простой: x x 12 15 11 16 14 13,6 n 5 Полученная средняя была бы правильной, если бы каждый рабочий сделал только по одной детали. Но в течение дня отдельными рабочими было изготовлено различное число деталей. определения числа деталей, изготовленных Для каждым рабочим, воспользуемся следующим соотношением: все затраченное время Среднее время, затраченное = -------------------------------------на одну деталь число деталей Число деталей, изготовленных каждым рабочим, определяется отношением всего времени работы к среднему времени, затраченному на 10 одну деталь. Тогда среднее время, необходимое для изготовления одной детали, равно: 8 * 60 8 * 60 8 * 60 8 * 60 8 * 60 8 * 60 8 * 60 8 * 60 8 * 60 8 * 60 12 15 11 16 14 2400 13,3 40 32 43,6 30 34,2 x Это же решение можно представить иначе: x 8 * 60 * 5 5 13,3 1 1 1 1 0,3747 1 * 8 * 60 12 15 11 16 14 Таким образом, формула для расчета средней гармонической простой будет иметь вид: x n 1 1 1 ... x1 x2 xn n 1 x Средняя гармоническая взвешенная: x M , где M=xf 1 М x (произведения частот на значения признака, если весами являются не частоты f). Например, необходимо определить среднюю урожайность всех технических культур на основании следующих данных (таблица 3): Таблица 3 Валовой сбор и урожайность технических культур по одному из районов во всех категориях хозяйств. Культуры Хлопчатник Сахарная свекла Подсолнечник Льноволокно Итого Валовой сбор, ц (Mi) 97,2 601,2 46,3 2,6 743,3 Урожайность, ц/га (xi) 30,4 467,0 11,0 2,9 Х В исходной информации веса (площадь под культурами) не заданы, но входят сомножителем в валовой 11 сбор, равный урожайности, умноженной на площадь M=xf, поэтому f будет равна x M ,а x средняя урожайность M 747.3 747.3ц 62,9ц / га . 1 97.2 601.2 46.3 2.6 11,9 га M 30.4 167.0 11.0 2.9 x 12 Средняя геометрическая Средняя геометрическая применяется в тех случаях, когда индивидуальные значения признака представляют собой относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики, т.е. характеризует средний коэффициент роста. Средняя геометрическая исчисляется извлечением корня степени n из произведений отдельных значений — вариантов признака х по формуле: x n x1 x2 ... xn n x , где n — число вариантов; П — знак произведения. Наиболее широкое применение средняя геометрическая получила для определения средних темпов изменения в рядах динамики, а также в рядах распределения. 13 Средняя квадратическая и средняя кубическая В ряде случаев в экономической практике возникает потребность расчета среднего размера признака, выраженного в квадратных или кубических единицах измерения. Тогда применяется средняя квадратическая (например, для вычисления средней величины стороны и квадратных участков, средних диаметров труб, стволов и т.п.) и средняя кубическая (например, при определении средней длины стороны и кубов). Средняя квадратическая простая является квадратным корнем из частного от деления суммы квадратов отдельных значений признака на их число: x12 x22 ... xn2 n x x n 2 , где x1,x2,…xn- значения признака, n- их число. Средняя квадратическая взвешенная: x f f 2 x , где f-веса. Средняя кубическая простая является кубическим корнем из частного от деления суммы кубов отдельных значений признака на их число: x 3 x 3 , где x1,x2,…xn- значения признака, n- их число. n Средняя кубическая взвешенная: x f f 3 x3 , где f-веса. 14 Структурные средние Для изучения распределения внутреннего значений строения признака и применяются структуры так рядов называемые структурные средние. Наиболее часто используются в экономической практике мода и медиана. Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В дискретных рядах мода определяется по варианту с наибольшей частотой. Предположим товар А реализуют в городе 9 фирм по цене в рублях: 44; 43; 44; 45; 43; 46; 42; 46; 43. Так как чаще всего встречается цена 43 рубля, то она и будет модальной. В интервальных вариационных рядах моду определяют по формуле: Mo x Mo iMo f Mo f Mo f Mo1 , где f Mo1 f Mo f Mo1 x Mo - нижняя граница модального интервала; i Mo - модальный интервал; f Mo - частота модального интервала; f Mo1 - частота интервала, предшествующего модальному; f Mo1 - частота интервала, следующего за модальным. Место нахождения модального интервала определяют по наибольшей частоте (таблица 4). Распределение предприятий по численности промышленно - производственного персонала характеризуется следующими данными: Таблица 4 Группы предприятий по числу работающих, чел Число предприятий 100 — 200 200 — 300 300 — 400 400 — 500 500 — 600 600 — 700 1 3 7 30 19 15 15 700 — 800 ИТОГО В 5 80 этой задаче наибольшее число предприятий (30) имеет численность работающих от 400 до 500 человек. Следовательно, этот интервал является модальным интервалом ряда распределения. Введем следующие обозначения: x Mo =400, i Mo =100, f Mo =30, f Mo1 =7, f Mo1 =19 Подставим эти значения в формулу моды и произведем вычисления: Mo x Mo iMo 400 100 f Mo f Mo f Mo1 f Mo1 f Mo f Mo1 30 7 467,6 чел. 30 7 30 19 Мода применяется для решения некоторых практических задач. Так, например, при изучении товарооборота рынка берется модальная цена, для изучения спроса на обувь, одежду используют модальные размеры обуви и одежды и др. Медиана - это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные части – со значениями признака меньше и больше медианы. В дискретных вариационных рядах с нечетным числом единиц совокупности - это конкретное численное значение в середине ряда. Так в группе студентов из 27 человек медианным будет рост у 14-го, если они выстроятся по росту. Если число единиц совокупности четное, то медианой будет средняя арифметическая из значений признака у двух средних членов ряда. Так, если в группе 26 человек, то медианным будет рост средний 13-го и 14-го студентов. В интервальных вариационных рядах медиана определяется по формуле: f Me x Me i Me 2 S Me1 f Me , где x Mе - нижняя граница медианного интервала; 16 iMе - медианный интервал; f 2 - половина от общего числа наблюдений; sMе1 - сумма наблюдений, накопленная до начала медианного интервала; f Mе – число наблюдений в медианном интервале. Распределение предприятий по численности промышленно - производственного персонала характеризуется следующими данными: Таблица 5 Группы предприятий по числу рабочих, чел. Число предприятий Сумма накопленных частот 100 — 200 200 — 300 300 — 400 400 — 500 500 — 600 600 — 700 700 — 800 ИТОГО 1 3 7 30 19 15 5 80 1 4 (1+3) 11 (4+7) 41 (11+30) — — — Определим прежде всего медианный интервал. В данной задаче сумма накопленных частот, превышающая половину всех значений (41), соответствует интервалу 400 - 500. Это и есть медианный интервал, в котором находится медиана. Определим ее значение по приведенной выше формуле. Известно, что: xMe 400, iMe 100, f 80, S Me1 11, f Me 30. Следовательно, Me 400 100 0,5 * 80 11 400 96,66 496,66 чел. . 30 Приближенно моду и медиану можно определить графически по гистограмме и кумуляте соответственно. Мода и медиана в отличие от степенных средних являются конкретными характеристиками, их значение имеет какой-либо конкретный вариант в вариационном ряду. Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного распределения частот вариационного ряда ( x =Ме=Мо). Поэтому соотношение моды, медианы и 17 средней арифметической позволяет оценить ассиметрию ряда распределения. Если x >Ме>Мо - имеет место правосторонняя асимметрия, т.е. большая часть единиц совокупности имеет значения признака выше модального. Если же x <Me<Mо – имеет место левосторонняя асимметрия, т.е. большая часть единиц совокупности имеет значения признака ниже модального. Мода и медиана, как правило, являются дополнительными к средней характеристиками совокупности и используются в математической статистике для анализа формы рядов распределения. Для характеристики структуры вариационного ряда дополнительно исчисляют: квартили, которые делят ряд по сумме частот на четыре равные части; квинтили - на пять равных частей; децили - на десять равных частей; перцентили - на сто равных частей. 18 Расчетная часть Для изучения капитальных вложений в производство из собственных средств предприятий в регионе проведена 5%-я механическая выборка, в результате которой получены следующие данные: Таблица 6 Первичные данные № п/п Нераспределенная прибыль, млн. руб. Инвестиции в основные фонды, млн. руб. А 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 2,2 2,0 4,3 5,0 6,0 2,3 3,6 4,2 5,8 4,7 2,5 3,8 4,5 4,8 4,4 5,4 5,2 4,1 3,3 5,6 3,9 4,8 4,5 4,7 3,4 2 0,06 0,04 0,44 0,60 0,90 0,12 0,20 0,36 0,80 0,60 0,18 0,40 0,53 0,65 0,42 0,70 0,50 0,35 0,20 0,70 0,40 0,73 0,62 0,70 0,30 Определите по первичным данным: 1. а) моду и б) медиану нераспределенной прибыли. 19 2. Постройте ряд распределения предприятий региона по объему нераспределенной прибыли, образовав четыре группы предприятий с равными интервалами и определите: а) среднюю величину нераспределенной прибыли; б) моду; в) медиану; г) квартили. Постройте графики ряда распределения и покажите на них исчисленные показатели. 3. Вычислите коэффициент асимметрии. Решение: 1. Определяем моду и медиану нераспределенной прибыли по первичным данным. Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В дискретных рядах мода определяется по варианту с наибольшей частотой. В результате анализа первичных данных приходим к выводу, что чаще всего встречаются величины нераспределенной прибыли равные 4,5 млн. руб., 4,7 млн. руб., 4,8 млн. руб. Они и будут модальными. Медиана - это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные части – со значениями признака меньше и больше медианы. В дискретных вариационных рядах с нечетным числом единиц совокупности - это конкретное численное значение в середине ряда. В результате анализа первичных данных приходим к выводу, что в группе из 25 предприятий медианной будет величина нераспределенной прибыли у 13-го предприятия равная 4,5 млн. руб. 20 2. Построим ряд распределения предприятий региона по объему нераспределенной прибыли, образовав четыре группы предприятий с равными интервалами. Ранжируем ряд предприятий региона по объему нераспределенной прибыли. Запишем первичные данные с самого малого до самого крупного. Таблица 7 Ранжированный ряд предприятий региона по объему нераспределенной прибыли № п/п 1 2 3 4 5 6 7 8 9 10 11 Млн. руб. 2,0 2,2 2,3 2,5 3,3 3,4 3,6 3,8 3,9 4,1 4,2 12 13 14 15 16 17 18 19 20 21 22 23 24 25 4,3 4,4 4,5 4,5 4,7 4,7 4,8 4,8 5,0 5,2 5,4 5,6 5,8 6,0 Исчислим величину интервала по формуле: i xmax xmin 6,0 2,0 1,0 млн. руб. n 4 Образуем группы предприятий по объему нераспределенной прибыли, используя величину интервала. I группа 2,0 - 3,0 III группа 4,0 – 5,0 II группа 3,0 - 4,0 IV группа 5,0 – 6,0 Оформим ряд распределения. Таблица 8 Распределение предприятий региона по объему нераспределенной прибыли № Группы предприятий по Число Удельный вес, группы объему нераспределенной предприятий число предприятий, % прибыли, млн. руб. (х) (f) I 2-3 4 16 (4/25*100) II 3-4 5 20 (5/25*100) III 4-5 10 40 (10/25*100) IV 5-6 6 24 (6/25*100) - Итого 25 (Σf) 100 21 2.а) Определим среднюю величину нераспределенной прибыли по формуле средней арифметической взвешенной x xf f При расчете средней по интервальному вариационному ряду необходимо сначала найти середину интервалов. Это и будут значения x, а количество единиц совокупности в каждой группе - f (таблица 9). Таблица 9 Объем нераспределенной прибыли 2-3 3-4 4-5 5-6 Итого Средняя x величина Число предприятий, (f) 4 5 10 6 25 (Σf) нераспределенной Середина интервала, (x) 2,5 ((2+3)/2) 3,5 ((3+4)/2) 4,5 ((4+5)/2) 5,5 ((5+6)/2) - прибыли будет равна 2,5 * 4 3,5 * 5 4,5 * 10 5,5 * 6 105,5 млн. руб. 25 2.б) Рассчитаем моду. Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В интервальных вариационных рядах моду определяют по формуле: Mo x Mo iMo f Mo f Mo f Mo1 , где f Mo1 f Mo f Mo1 x Mo - нижняя граница модального интервала; i Mo - модальный интервал; f Mo - частота модального интервала; f Mo1 - частота интервала, предшествующего модальному; f Mo1 - частота интервала, следующего за модальным. Место нахождения модального интервала определяют по наибольшей частоте (таблица 10). Распределение предприятий региона по объему нераспределенной прибыли характеризуется следующими данными: 22 Таблица 10 Группы предприятий по объему нераспределенной прибыли, млн. руб. Число предприятий 2-3 3-4 4-5 5-6 Итого 4 5 10 6 25 Наибольшее число предприятий (10) принадлежит группе предприятий с объемом нераспределенной прибыли от 4 до 5 млн. руб. Следовательно, этот интервал является модальным интервалом ряда распределения. Введем следующие обозначения: x Mo =4, i Mo =1, f Mo =10, f Mo1 =5, f Mo1 =6 Подставим эти значения в формулу моды и произведем вычисления: Mo x Mo iMo Из f Mo f Mo f Mo1 10 5 4 1 4,56 млн. руб. 10 5 10 6 f Mo1 f Mo f Mo1 расчета видно, что модальным значением объема нераспределенной прибыли предприятий является величина равная 4,56 млн. руб. 2.в) Рассчитаем медиану. Медиана - это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные части – со значениями признака меньше и больше медианы. В интервальных вариационных рядах медиана определяется по формуле: f Me x Me i Me 2 S Me1 f Me , где x Mе - нижняя граница медианного интервала; iMе - медианный интервал; 23 f 2 - половина от общего числа наблюдений; sMе1 - сумма наблюдений, накопленная до начала медианного интервала; f Mе – число наблюдений в медианном интервале. Распределение предприятий региона по объему нераспределенной прибыли характеризуется следующими данными: Таблица 11 Группы предприятий по объему нераспределенной прибыли, млн.руб. 2-3 3-4 4-5 5-6 Итого Число предприятий Сумма накопленных частот 4 5 10 6 25 4 9 (4+5) 19 (9+10) 25 (19+6) - Определим прежде всего медианный интервал. Сумма накопленных частот, превышающая половину всех значений (19), соответствует интервалу от 4 до 5 млн. руб. Это и есть медианный интервал, в котором находится медиана. Введем следующие обозначения: x Me 4, iMe 1, f 25, S Me1 9, f Me 10. Подставим эти значения в формулу медианы и произведем вычисления: f Me x Me iMe 2 S Me1 f Me 25 9 4 1 2 4,35 млн. руб. 10 Из расчета видно, что у одной половины предприятий объем нераспределенной прибыли равен величине до 4,35 млн. руб., а у другой половины – выше этой величины. 2.в) Рассчитаем квартили. Для характеристики структуры вариационного ряда дополнительно исчисляют: 24 квартили, которые делят ряд по сумме частот на четыре равные части. Для расчета квартили ряд распределения делим на четыре равные части и для каждой части определяем среднюю (квартиль). Квартили рассчитывают по формулам: 3 2 1 f SQ2 1 f SQ1 1 f SQ3 1 4 4 4 Q1 xo i Q2 xo i Q3 xo i , где f Q1 f Q2 f Q3 x o - нижние границы квартильных интервалов; i - интервал ряда распределения; f - общее число наблюдений; sQ11 , sQ2 1, s Q 31 - сумма наблюдений, накопленная до начала квартильных интервалов; f Q1, f Q 2, f Q 3 – число наблюдений в квартильных интервалах. Распределение предприятий региона по объему нераспределенной прибыли характеризуется следующими данными: Таблица 12 Группы предприятий по объему нераспределенной прибыли, млн.руб. 2-3 3-4 4-5 5-6 Итого Число предприятий Сумма накопленных частот 4 5 10 6 25 4 4+5=9 9+10=19 19+6=25 - Введем следующие обозначения: xo 3, i 1, f 25, SQ11 4, f Q1 5 xo 4, i 1, f 25, SQ 2 1 9, f Q 2 10 xo 5, i 1, f 25, SQ 31 19, f Q 3 6 Подставим эти значения в формулы квартили и произведем вычисления: 25 1 1 f SQ1 1 25 4 4 4 Q1 xo i 31 3,45 млн. руб. f Q1 5 2 2 f SQ2 1 25 9 4 4 Q2 xo i 4 1 4,35 млн. руб. f Q2 10 3 3 f SQ3 1 25 19 4 4 Q3 xo i 5 1 4,96 млн. руб. f Q3 6 Построим графики ряда распределения и покажем на них исчисленные показатели. 3. Вычислим коэффициент асимметрии. Коэффициент асимметрии является безмерным, что позволяет использовать его для различных распределений. При левосторонней асимметрии M o M e x , при правосторонней асимметрии M o M e x . Коэффициент асимметрии можно определить по следующим показателям: K a x M o x M e ; K a , где - среднее квадратическое отклонение. При левосторонней асимметрии эти показатели отрицательные, при правосторонней – положительные. Рассчитаем среднее квадратическое отклонение для вариационного ряда по формуле: (x x) f 2 f . Для получения необходимых данных составим рабочую таблицу 13. Таблица 13 Рабочая таблица 26 Середина интервала Число предприятий прибыли, млн.руб. объему нераспределенной Группы предприятий по f x xf (x x) ( x x )2 ( x x )2 f 2-3 4 2,5 10 -1,72 2,96 11,84 3-4 5 3,5 17,5 -0,72 0,52 2,6 4-5 10 4,5 45 0,28 0,08 0,8 5-6 6 5,5 33 1,28 1,64 9,84 Итого 25 - 105,5 - - 25,08 Подставим полученные данные в формулу среднего квадратического отклонения и произведем вычисления: (x x) f 2 f 25,08 1,0016 25 Введем следующие обозначения: x 105,5 4,22; M o 4,56; M e 4,35; 1,0016 25 Подставим эти значения в формулу коэффициента асимметрии и произведем вычисления: K a x M o 4,22 4,56 x M e 4,22 4,35 0,3395 ; K a 0,1298 1,0016 1,0016 В рассматриваемом нами ряде распределения имеет место левосторонняя асимметрия, т.к. в результате вычисления получены отрицательные показатели (-0,3395; -0,1298), т.е. большая часть единиц совокупности имеет значения признака ниже модального. 27 Аналитическая часть Для расчета аналитической части работы воспользуемся данными краткого статистического сборника «Россия в цифрах, 2005». Имеются данные о объеме продукции (работ, услуг), произведенной (произведенных) на малых предприятиях по некоторым отраслям экономики в 2004 году. Таблица 14 Первичные данные № п/п Отрасли экономики Объем произведенной продукции (работ, услуг), млрд.руб. 1 Сельское хозяйство 25,8 2 Связь Информационно-вычислительное обслуживание Операции с недвижимым имуществом 16,3 15,6 7 Жилищно-коммунальное хозяйство Непроизводственные виды бытового обслуживания населения Здравоохранение, физическая культура и социальное обеспечение 8 Образование 1,6 9 Культура и искусство 13,4 10 Наука и научное обслуживание Финансы, кредит, страхование и пенсионное обеспечение 41,4 3 4 5 6 11 15,0 39,5 6,2 24,1 1,6 Определите по первичным данным: 1. а) моду и б) медиану произведенной продукции (работ, услуг). 2. Постройте ряд распределения отраслей экономики по объему произведенной продукции (работ, услуг), образовав четыре группы отраслей экономики с равными интервалами и определите: а) среднюю величину произведенной продукции (работ, услуг); 28 б) моду; в) медиану; г) квартили. Постройте графики ряда распределения и покажите на них исчисленные показатели. 3. Вычислите коэффициент асимметрии. Решение: 1. Определяем моду и медиану произведенной продукции (работ, услуг) по первичным данным. Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В дискретных рядах мода определяется по варианту с наибольшей частотой. В результате анализа первичных данных приходим к выводу, что чаще всего встречается величина произведенной продукции (работ, услуг) равная 1,6 млрд. руб. Она и будет модальной. Медиана - это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные части – со значениями признака меньше и больше медианы. В дискретных вариационных рядах с нечетным числом единиц совокупности - это конкретное численное значение в середине ряда. В результате анализа первичных данных приходим к выводу, что в группе из 11 отраслей медианной будет величина произведенной продукции (работ, услуг) у 6-ой отрасли равная 6,2 млрд. руб. 2. Построим ряд распределения отраслей экономики по объему произведенной продукции (работ, услуг), образовав четыре группы отраслей экономики с равными интервалами. Ранжируем ряд отраслей экономики по объему произведенной продукции (работ, услуг). Запишем первичные данные с самого малого до самого крупного. Таблица 15 29 Ранжированный ряд отраслей экономики по объему произведенной продукции № п/п 1 2 3 4 5 6 7 8 9 10 11 Млрд.руб. 1,6 1,6 6,2 13,4 15,0 15,6 16,3 24,1 25,8 39,5 41,4 Исчислим величину интервала по формуле: i xmax xmin 41,4 1,6 9,95 млрд. руб. n 4 Образуем группы отраслей экономики по объему произведенной продукции (работ, услуг), используя величину интервала. I группа 1,6 – 11,55 III группа 21,50 – 31,45 II группа 11,55 – 21,50 IV группа 31,45 – 41,4 Оформим ряд распределения. Таблица 16 Распределение субъектов округа по объему произведенной продукции (работ, услуг) № Группы отраслей по объему Число Удельный вес, группы произведенной продукции отраслей число отраслей (работ, услуг), млрд. руб. (х) экономики (f) экономики, % I 1,6 – 11,55 3 27,28 (3/11*100) II 11,55 – 21,50 4 36,36 (4/11*100) III 21,50 – 31,45 2 18,18 (2/11*100) IV 31,45 – 41,4 2 18,18 (2/11*100) - Итого 11 (Σf) 100 2.а) Определим среднюю величину произведенной продукции (работ, услуг) по формуле средней арифметической взвешенной x xf . f При расчете средней по интервальному вариационному ряду необходимо сначала найти середину интервалов. Это и будут значения x, а количество единиц совокупности в каждой группе - f (таблица 17). Таблица 17 Объем произведенной продукции Число отраслей 30 Середина интервала, (x) (работ, услуг) 1,6 – 11,55 экономики, (f) 3 11,55 – 21,50 4 21,50 – 31,45 2 31,45 – 41,4 2 Итого 11 (Σf) 6,58 ((1,6+11,55)/2) 16,53 ((11,55+21,50)/2) 26,48 ((21,50+31,45)/2) 36,43 ((31,45+41,4)/2) - Средняя величина произведенной продукции (работ, услуг) будет равна x 6,58 * 3 16,53 * 4 26,48 * 2 36,43 * 2 19,24 млрд. руб. 11 2.б) Рассчитаем моду. Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В интервальных вариационных рядах моду определяют по формуле: Mo x Mo iMo f Mo f Mo1 f Mo f Mo1 f Mo f Mo1 , где x Mo - нижняя граница модального интервала; i Mo - модальный интервал; f Mo - частота модального интервала; f Mo1 - частота интервала, предшествующего модальному; f Mo1 - частота интервала, следующего за модальным. Место нахождения модального интервала определяют по наибольшей частоте (таблица 18). Распределение отраслей экономики по объему произведенной продукции (работ, услуг) характеризуется следующими данными: Таблица 18 Группы отраслей экономики по объему произведенной продукции (работ, услуг), млрд. руб. 1,6 – 11,55 Число отраслей экономики 11,55 – 21,50 4 31 3 21,50 – 31,45 2 31,45 – 41,4 2 Итого 11 Наибольшее число отраслей экономики (4) принадлежит группе отраслей экономики с объемом произведенной продукции (работ, услуг) от 11,55 до 21,50 млрд. руб. Следовательно, этот интервал является модальным интервалом ряда распределения. Введем следующие обозначения: x Mo =11,55; i Mo =9,95; f Mo =4, f Mo1 =3, f Mo1 =2 Подставим эти значения в формулу моды и произведем вычисления: Mo x Mo iMo f Mo f Mo f Mo1 43 11,55 9,95 14,87 млрд. руб. 4 3 4 2 f Mo1 f Mo f Mo1 Из расчета видно, что модальным значением объема произведенной продукции (работ, услуг) отраслей экономики является величина равная 14,87 млрд. руб. 2.в) Рассчитаем медиану. Медиана - это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные части – со значениями признака меньше и больше медианы. В интервальных вариационных рядах медиана определяется по формуле: f Me x Me i Me 2 S Me1 f Me , где x Mе - нижняя граница медианного интервала; iMе - медианный интервал; f 2 - половина от общего числа наблюдений; 32 sMе1 - сумма наблюдений, накопленная до начала медианного интервала; f Mе – число наблюдений в медианном интервале. Распределение отраслей экономики по объему произведенной продукции (работ, услуг) характеризуется следующими данными: Таблица 19 Группы отраслей экономики по объему произведенной продукции (работ, услуг), млрд. руб. 1,6 – 11,55 Число отраслей экономики Сумма накопленных частот 3 3 11,55 – 21,50 4 7 (3+4) 21,50 – 31,45 2 9 (7+2) 31,45 – 41,4 2 11 (9+2) Итого 11 - Определим прежде всего медианный интервал. Сумма накопленных частот, превышающая половину всех значений (7), соответствует интервалу от 11,55 до 21,50 млрд. руб. Это и есть медианный интервал, в котором находится медиана. Введем следующие обозначения: x Me 11,55; iMe 9,95; f 11; S Me1 3, f Me 4. Подставим эти значения в формулу медианы и произведем вычисления: f Me x Me iMe 2 S Me1 f Me 11 3 11,55 9,95 2 17,77 млрд. руб. 4 Из расчета видно, что у одной половины отраслей экономики объем произведенной продукции (работ, услуг) равен величине до 17,77 млрд. руб., а у другой половины – выше этой величины. 2.в) Рассчитаем квартили. Для характеристики структуры вариационного ряда дополнительно исчисляют: 33 квартили, которые делят ряд по сумме частот на четыре равные части. Для расчета квартили ряд распределения делим на четыре равные части и для каждой части определяем среднюю (квартиль). Квартили рассчитывают по формулам: 3 2 1 f SQ2 1 f SQ1 1 f SQ3 1 4 4 4 Q1 xo i Q2 xo i Q3 xo i , где f Q1 f Q2 f Q3 x o - нижние границы квартильных интервалов; i - интервал ряда распределения; f - общее число наблюдений; sQ11 , sQ2 1, s Q 31 - сумма наблюдений, накопленная до начала квартильных интервалов; f Q1, f Q 2, f Q 3 – число наблюдений в квартильных интервалах. Распределение отраслей экономики по объему произведенной продукции (работ, услуг) характеризуется следующими данными: Таблица 20 Группы отраслей экономики по объему произведенной продукции (работ, услуг), млрд. руб. 1,6 – 11,55 Число отраслей экономики Сумма накопленных частот 3 3 11,55 – 21,50 4 7 (3+4) 21,50 – 31,45 2 9 (7+2) 31,45 – 41,4 2 11 (9+2) Итого 11 - Введем следующие обозначения: xo 1,6; i 9,95; f 11; SQ11 0; f Q1 3 xo 11,55; i 9,95; f 11; SQ 2 1 3; f Q 2 4 xo 21,50; i 9,95; f 11; SQ 31 7; f Q 3 2 34 Подставим эти значения в формулы квартили и произведем вычисления: 1 1 f SQ1 1 11 0 4 4 Q1 xo i 1,6 9,95 10,72 млрд. руб. f Q1 3 2 2 f SQ2 1 11 3 4 4 Q2 xo i 11,55 9,95 17,77 млрд. руб. f Q2 4 3 3 f SQ3 1 11 7 4 4 Q3 xo i 21,50 9,95 27,72 млрд. руб. f Q3 2 Построим графики ряда распределения и покажем на них исчисленные показатели. 3. Вычислим коэффициент асимметрии. Коэффициент асимметрии является безмерным, что позволяет использовать его для различных распределений. При левосторонней асимметрии M o M e x , при правосторонней асимметрии M o M e x . Коэффициент асимметрии можно определить по следующим показателям: K a x M o x M e ; K a , где - среднее квадратическое отклонение. При левосторонней асимметрии эти показатели отрицательные, при правосторонней – положительные. Рассчитаем среднее квадратическое отклонение для вариационного ряда по формуле: (x x) f 2 f . Для получения необходимых данных составим рабочую таблицу 21. Таблица 21 35 f Середина интервала Число отраслей экономики млрд. руб. продукции (работ, услуг), по объему произведенной Группы отраслей экономики Рабочая таблица x xf (x x) ( x x )2 ( x x )2 f 1,6 – 11,55 3 6,58 19,74 -12,66 160,28 480,84 11,55 – 21,50 4 16,53 66,12 -2,71 7,34 29,36 21,50 – 31,45 2 26,48 52,96 7,24 52,42 104,84 31,45 – 41,4 2 36,43 72,86 17,19 295,50 591,00 Итого 11 - 211,68 - - 1206,04 Подставим полученные данные в формулу среднего квадратического отклонения и произведем вычисления: (x x) f 2 f 1206,04 10,4709 11 Введем следующие обозначения: x 211,68 19,24; M o 14,87; M e 17,77; 10,4709 11 Подставим эти значения в формулу коэффициента асимметрии и произведем вычисления: K a x M o 19,24 14,87 x M e 19,24 17,77 0,4173 ; K a 0,1404 10,4709 10,4709 В рассматриваемом нами ряде распределения имеет место правосторонняя асимметрия, т.к. в результате вычисления получены положительные показатели (0,4173; 0,1404), т.е. большая часть единиц совокупности имеет значения признака выше модального. 36 ЗАКЛЮЧЕНИЕ Возрастающий интерес к статистике вызван современным этапом развития экономики в стране, формирования рыночных отношений. Это требует глубоких экономических знаний в области сбора, обработки и анализа экономической информации. Организация единой централизованной системы хозяйственноправовой статистики в Российской Федерации дала бы возможность выявить наиболее уязвимые места в правовом регулировании, экономическом обороте и экономике страны в целом. Статистическая грамотность является неотъемлемой составной частью профессиональной подготовки каждого экономиста, финансиста, социолога, политолога, а также любого специалиста, имеющего дело с анализом массовых явлений, будь то социально-общественные, экономические, технические, научные и другие явления. 37 Список используемой литературы 1. Практикум по статистике: Учебное пособие для вузов / Под ред. В.М. Симчеры / ВЗФЭИ. – М.: ЗАО «Финстатинформ», 1999 – 259 с. 2. Российский статистический ежегодник 2002: Статистический сборник / Госкомстат России. – М.: 2002г. – 690 с. 3. Социально-экономическая статистика / Под ред. Г.Л. Громыко. – М.: Издательство МГУ, 1989. – 398 с. 4. Теория статистики: Учебное пособие для вузов. – М.: Аудит, ЮНИТИ, 1998. – 247 с. 5. Сайты в Интернете: http://www.gks.ru и http://www.infostat.ru 38 Приложение 1 Шаблоны выходных таблиц расчетной части с формулами расчета. 39