Статистика как наука. Предмет, метод и задачи статистики Актуальность В жизни сталкиваемся с результатами статистических исследований: рейтинги; переписи населения; прогнозы (экономический, метеорологический, политический, социальный и др.); индексы динамики различных показателей. Органы статистики: Госкомстат (управления по статистике); органы ЗАГС. Статистика – самостоятельная, имеющая свой предмет и метод исследования наука. Возникла она из практических потребностей общественной жизни. Уже в древнем мире появилась потребность подсчитывать численность жителей государства, учитывать людей, пригодных к военному делу, определять количество скота, размеры земельных угодий и другого имущества. Информация такого рода была необходима для сбора налогов, ведения войн и т.п. В дальнейшем, по мере развития общественной жизни, круг учитываемых явлений постепенно расширяется. Особенно возрастает объем собираемой информации с развитием капитализма и мирохозяйственных связей. Потребности этого периода вынуждали органы государственного управления и капиталистические предприятия собирать для практических нужд обширную и разнообразную информацию о рынках труда и сбыта товаров, сырьевых ресурсах. В середине 17-го века в Англии возникло научное направление, получившее название "политической арифметики". Начало этому направлению положили Вильям Петти (16231687 гг.) и Джон Граунт (1620-1674 гг.). "Политические арифметики" на основе изучения информации о массовых общественных явлениях стремились открыть закономерности общественной жизни и, таким образом, ответить на вопросы, возникавшие в связи с развитием капитализма. Наряду со школой "политических арифметиков" в Англии, в Германии развивалась школа описательной статистики или "государствоведения". Возникновение этой науки относится к 1660 г. Развитие политической арифметики и государствоведения привело к появлению науки статистики. Понятие "статистика" происходит от латинского слова "status", которое в переводе означает – положение, состояние, порядок явлений. В научный оборот термин "статистика" ввел профессор Геттингенского университета Готфрид Ахенваль (1719-1772 гг.) в середине 18 века. Статистика как наука исследует не отдельные факты, а массовые явления и процессы, выступающие как множество отдельных факторов, обладающих как индивидуальными, так и общими признаками. Предмет статистики Статистика, вернее ее методы исследования, широко применимы в различных областях человеческих знаний. Однако, как любая наука, она требует определения предмета исследования. Предмет (объект) статистического исследования в статистике называют статистической совокупностью. Статистическая совокупность – это множество единиц, обладающих массовостью, однородностью, определенной целостностью, взаимозависимостью состояния отдельных единиц и наличием вариации. Каждый отдельный элемент данного множества называется единицей статистической совокупности. В зависимости от объекта (предмета) изучения статистика как наука подразделяется на социальную, демографическую, экономическую, промышленную, торговую, банковскую, финансовую, медицинскую и т.д. Общие свойства статистических данных, независимо от их природы, и методы их анализа рассматриваются математической статистикой и общей теорией статистики. В нашем курсе речь будет идти о так называемой прикладной статистике т.е. только о сущности специальных методов сбора, обработки и анализа информации и, кроме того, о практических приемах выполнения связанных с этим расчетов. Статистика как наука имеет дело прежде всего с количественной стороной явлений и процессов в конкретных условиях места и времени. Одной из характерных особенностей статистики является то, что при изучении количественной стороны явлений и процессов она всегда отображает качественные особенности исследуемых явлений, т.е. изучает количество в неразрывной связи, единстве с качеством. Статистическая методология Важнейшими составными элементами статистической методологии являются: 1) массовое статистическое наблюдение (сбор первичных данных); 2) статистическая сводка (группировка) первичных данных, получение обобщающих (сводных) характеристик; 2 3) получение обобщающих статистических параметров, обнаружение закономерностей в изучаемых явлениях; 4) оценка достоверности (значимости) обнаруженных закономерностей. Содержание перечисленных выше пунктов определяют этапы проведения любого статистического исследования: 1. Чтобы охарактеризовать с количественной стороны любое массовое явление, необходимо сначала собрать информацию о составляющих его элементах. Это и достигается при помощи массового наблюдения, осуществляемого на основе выработанных статистической наукой правил и способов. 2. Собранные в процессе статистического наблюдения сведения подвергаются в дальнейшем сводке (первичной научной обработке), в процессе которой из всей совокупности обследованных единиц выделяются характерные части (группы). Выделение групп единиц из всего обследуемого множества называется в статистике группировкой. Группировка в статистике является основой обработки и анализа собранной информации. Осуществляется она на основе определенных принципов и правил. 3. В процессе обработки статистической информации совокупность обследованных единиц и выделенные ее части на основе применения метода группировок характеризуются системой цифровых показателей: абсолютных и средних величин, относительных величин, показателей динамики и т.д. 4. Современная статистика добилась больших успехов в разработке объективных методов проверки значимости результатов. Основной задачей многих статистических исследований является отделение действительных эффектов от случайных. Задача статистики Основной задачей статистики является сбор, учет, обработка и хранение данных (информации) из области человеческой деятельности и природных явлений. Основные понятия и категории статистики Человек воспринимает окружающую среду как непрерывную последовательность событий. Он анализирует поступающую информацию и (хотя и не всем это удается) делает выводы из такого анализа и учитывает их в своей сознательной деятельности. Поэтому можно смело утверждать, что во все времена люди занимались и занимаются статистическими “исследованиями”, даже не зная иногда такого слова “статистика”. Случайное событие – событие, которое при заданном комплексе факторов может произойти, а может не произойти. 3 Не задерживаясь на раскрытии философской сущности термина “случайность” (вполне достаточно обычное, житейское представление), обратимся к чрезвычайно важному понятию вероятность. Этот термин обычно используют по отношению к событию и определяют числом (от 0 до 1), выражающим степень нашей уверенности в том, что данное событие произойдет. Вероятность – числовая характеристика степени возможности наступления какого-либо определенного события в тех или иных определенных условиях, могущих повторяться неограниченное число раз. Вероятность (Р) равна отношению числа благоприятных для данного события исходов (m) к общему числу равновозможных исходов (n). P m . n Достоверное событие – событие, которое при заданном комплексе факторов обязательно произойдет (хотя это уже – неслучайное, детерминированное события). Р (А) = 1. Невозможное событие – событие, которое не может осуществиться при заданном комплексе факторов. Р (В) = 0. Независимые события – события, для которых появление или отсутствие одного из них никак не сказывается на вероятности появления другого. Будем толковать случайное событие А как попадание точки в некоторую область (А) квадрата (рис. 1, а). Рис. 1. Сумма (объединение) событий А,+ А2 +…+ Аn – событие, которое имеет вид: наступает или А1, или А2, …, или Аn ( т.е. хотя бы одно из событий Аi ). Тогда рис. 1, б иллюстрирует понятие суммы С = А + В (попадание в область, являющуюся объединением областей А и В). Р (С) = Р (А+В) = Р ( A B ) = Р (А) + Р (В). Произведение (совмещение) событий А1, А2, …, Аn – событие, которое имеет вид: наступает и А1, и А2, …, и Аn. На рисунке совмещение событий можно толковать как попадание 4 точки в общую часть областей А и В (на рис. 1, б эта общая часть помечена серым цветом). Р (АВ ) = Р ( A B ) = Р (А) Р (В) , если А и В - независимы. Несовместные события – события, одновременное осуществление которых невозможно (см. рис. 1, в – области А и В не имеют общих точек, поэтому никакая точка не может попасть одновременно в обе эти области). Р (АВ) = 0. Противоположные события А и A – события, для которых одно из них проявляется тогда и только тогда, когда другое отсутствует (на рис. 1, г область противоположного события A помечена серым цветом). P( A) P( A ) = 1. Если Р(А) = р, то P ( A ) = q = 1-р. Иногда в прикладной статистике приходится иметь дело с так называемыми редкими маловероятными событиями. К ним принято относить события, значение вероятности которых не превышает определенного уровня, чаще всего – 0.05 или 5 %. Наблюдаемые нами значения показателей, характеризующих присущие случайным событиям свойства, называются в статистике признаками. По форме выражения признаки делятся на атрибутивные (описательные, качественные) и количественные. Признаки Атрибутивные Количественные Дискретные Непрерывные Атрибутивные (качественные) признаки не поддаются количественному (числовому) выражению. Количественные признаки выражают через числа, которые являются случайными величинами (далее везде – СВ).Случайные величины делят на две разновидности: Случайные величины Дискретные Непрерывные Дискретные СВ могут принимать только конкретные, заранее оговоренные значения (например, значения чисел на верхней грани брошенной игральной кости или порядковые значения текущего месяца). Дискретная случайная величина – это СВ, для которой совокупность возможных значений конечна или поддается счислению. Непрерывные СВ (чаще всего значения некоторых физических величин: веса, расстояния, температуры и т.п.) могут принимать любые значения, хотя бы и в некотором интервале. Непрерывная случайная величина – это СВ, совокупность возможных значений которых бесконечна или не поддается счислению. 5 Случайная величина – это некоторая переменная величина, принимающая в зависимости от случая те или иные значения Хi (X1, X2, …, Xn) с определенными вероятностями Pi (P1, P2, …, Pn). Случайные величины могут также называться данными. n Pi 1 . i 1 Ранее уже говорилось, что предметом статистического исследования является статистическая совокупность случайных величин Хi.. Генеральная совокупность – это множество всех возможных значений случайных величин Хi. На практике мы имеем дело с некоторыми выборками (рядами распределения, рядами данных, выборочными совокупностями) из генеральной совокупности. Выборка – это отобранная для исследования часть генеральной совокупности, т.е. выборочная совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30-35. Элементы выборки – это отдельные элементы проверяемой совокупности, выбранные с целью формирования мнения о совокупности в целом. Объем выборки n (число данных, длина ряда) – это число случайных величин в исследуемой выборке. Единицы совокупности обусловливающими наряду качественную с общими определенность для всех единиц совокупности, также признаками, обладают индивидуальными особенностями и различиями, отличающими их друг от друга, т.е. существует вариация признаков. Именно наличие вариации предопределяет необходимость статистики. 6