Математико-статистические модели в социологии

реклама
Министерство экономического развития и торговли
Российской Федерации
Государственный университет –
Высшая школа экономики
Факультет социологии
Программа дисциплины:
Математико-статистические модели в социологии
Для направления 040200.62 "Социология"
(подготовки бакалавра)
Автор программы – профессор Толстова Ю.Н.
Рекомендована секцией УМС
______________________________
Председатель
______________________________
«_____» __________________ 200 г.
Одобрена на заседании кафедры
Методов сбора и анализа социологической
информации
Зав. кафедрой
д.с.н., проф. Толстова Ю.Н.
«_____» __________________ 200 г.
Утверждена УС
факультета Социологии
Ученый секретарь
______________________________
«_____» __________________ 200 г.
Москва
I.Пояснительная записка
Основная цель курса, адресат
Курс рассчитан на студентов-социологов и посвящен изложению основ теории
вероятностей и математической статистики. Как известно, подобные курсы традиционно
читаются студентам самых разных специальностей. Объясняется это тем, что изучение
статистических закономерностей требуется практически в любой отрасли человеческого
знания. Отечественная литература в соответствующем отношении очень богата, имеется
множество учебников (в том числе переводных) и методических пособий самого разного
плана: с разной широтой охвата проблематики, рассчитанных на читателей с различной
подготовкой и т.д. Казалось бы, преподавание теории вероятностей и математической
статистики для студентов - прикладников стало рутинным делом. Тем не менее,
предлагаемая программа имеет ряд особенностей, позволяющих считать ее в некоторых
отношениях оригинальной. Особенности эти вызваны желанием автора сделать курс
хорошо воспринимаемым именно социологами. Ситуация, обусловившая потребность в
соответствующих разработках, состоит в следующем.
Проблемы преподавания математических дисциплин студентам-социологам
Опыт показывает, что студенты-социологи часто бывают настроены на
“гуманитарный” лад, и либо вообще отрицают необходимость серьезного рассмотрение
каких бы то ни было математических методов, либо делают это формально, в глубине
души считая соответствующие знания для себя лишними. В результате - либо
отсутствие знаний, либо освоение материала на “абстрактном” уровне, без всякого
сопряжения с практикой проведения социологических исследований. Во всяком случае,
автору неоднократно приходилось наблюдать, что даже добросовестные студенты плохо
представляют себе, как использовать знания, полученные им в курсе теории
вероятностей и математической статистики,
в практической работе социолога.
Преодолеть соответствующую проблему, на наш взгляд, можно путем определенной
“привязки” курса к социологическим проблемам.
Особенности курса
Основной чертой предлагаемой программы (точнее, курса, отраженного в
программе), отличающей ее от других программ такого рода, является то, что все
вводимые теоретические положения сопровождаются примерами их использования в
социологических исследованиях. В качестве примеров случайных событий служат
события, каждое их которых состоит в том, что какой -либо респондент обладает
определенным сочетанием значений рассматриваемых признаков. Сами признаки
служат примерами случайных величин. При этом вместо вероятностей в примерах
фигурируют относительные частоты.
Еще одна особенность работы состоит в том, что в ней большое внимание
уделяется проблеме измерения исходных данных. Дело в том, что в социологии выбор
как способа получения данных, так и способа их анализа (в том числе и с помощью
методов математической статистики) являются проблемами. И эти проблемы не могут
решаться отдельно, поскольку отражают две стороны одного и того же процесса. В
предлагаемом курсе это проявляется прежде всего в двух отношениях - во-первых,
говоря о параметрах распределений, мы соотносим их с типами шкал, использованных
при получении исходных данных и, во-вторых, связываем совокупность событий,
близких к достоверным, с аксиомами, определяющими интересующую социолога
эмпирическую систему (это дает возможность при анализе данных пользоваться
современными достижениями в области теории измерений).
Определенное внимание в курсе уделяется описанию роли статистического
подхода в социологии, анализу ситуаций, при которых он не адекватен: указывается,
что социолог теряет, опираясь лишь на статистическую парадигму; обсуждается вопрос
о возможности обеспечения того комплекса условий, реализация которого приводит к
появлению интересующих социолога случайных событий; в частности, подробно
рассматривается, каким образом социолог может обеспечить равновероятное попадание
в выборку любого члена интересующей его генеральной совокупности.
Рассматривается ряд часто встречающихся в социологии ситуаций, в которых не
выполняются условия реализации известных математико-статистических подходов. Это
касается, например, методов планирования эксперимента и регрессионного анализа.
Контроль за работой студентов
Предполагается, что, помимо слушания лекций и работы на семинарских
занятиях, студентами будут выполняться следующие работы:
1) написано два реферата (эссе) - по одному в каждый семестр;
2) выполнены домашние задания, по одному заданию в неделю;
написано 8 контрольных работ (по 4 работы в семестр). Ориентировочные
темы. Примерный список задач для каждой темы
Специфика представления библиографии в программе
В отечественной литературе имеется очень много работ (в том числе
переводных), прекрасно описывающих основные положения теории вероятностей и
математической статистики. Список этих работ приведен в конце программы. В них
можно найти материал почти по все темам. После некоторых разделов (тем) приведены
списки книг, содержание которых более узко - касается только соответствующего
раздела (темы). К обязательной литературе мы отнесли работы, либо выпущенные в
последние два года, либо ориентированные на социологов или по способу изложения,
3)
или по специфике рассматриваемых аспектов (к сожалению, эти работы зачастую
опубликованы довольно давно). Эти списки называются добавочными.
II.Тематический расчёт часов
N
Пп
Наименование разделов, тем
Раздел 1. Природа статистического
анализа и его роль в социологии
Принципы статистического мышления.
Статистическая парадигма в
социологии
Случайные события и случайные
величины в социологии. Практическое
определение вероятности
Поле случайных событий. Строгое
определение вероятности
Случайная величина: функция
распределения, плотность вероятности
Раздел 3. Элементы математической
статистики
Уточнение основных задач
математической статистики
Основные параметры одномерных
распределений. Их точечное
оценивание
Виды одномерных распределений. Их
основные параметры
Интервальное оценивание основных
параметров одномерных распределений
Основные параметры двумерного
распределения. Их точечное и
интервальное оценивание
Проверка статистических гипотез
Раздел 4. Основные методы
многомерного статистического анализа
Регрессионный анализ
Дисперсионный анализ
Принципы проведения эксперимента в
социологии
Раздел 5. Построение выборочной
совокупности в социологии
Проблемы построения выборки
Виды случайных выборок
Территориальная выборка
Раздел 6. Непараметрические методы
статистики
Общее представление о
непараметрическом подходе
Ранговые методы
Непараметрические подходы в
многомерном статистическом анализе
Раздел 7. Математическая статистика и
анализ данных
Математическая статистика - основа
анализа данных
Линия размежевания
Лекции
Семинары
Самост.
работа
Всего
часов
4
4
10
18
6
8
16
30
4
4
10
18
2
4
10
16
2
4
8
14
2
5
7
4
6
10
4
2
8
14
2
4
8
14
2
4
2
4
6
10
10
18
4
2
10
16
5
2
10
17
4
2
8
14
49
42
125
216
III. Содержание программы
3-й модуль
Раздел 1. Природа статистического анализа и его роль в социологии
Тема 1. Принципы статистического мышления. Статистическая парадигма
в социологии
Интуитивное представление о теории вероятностей и математической статистике
и их роли в социологии. Главная задача курса. Общее представление о стохастических
(статистических, закономерностей “в среднем”).
Основные методологические принципы использования в социологии
математических методов
Статистические закономерности как основные закономерности, выявляемые в
процессе социологических исследований (исторический экскурс). От чего отказывается
социолог,
ограничиваясь
поиском
лишь
статистических
закономерностей:
моделирование социальных процессов, монографический метод.
Литература
Основная
1. История теоретической социологии. Т.1. М. Наука, 1995. С. 173-189 (Предыстория
эмпирической социологии)
2. Култыгин В.П. Ранняя немецкая классическая социология. М., 1991. С.77-82
(Эмпирические социальные исследования в Германии)
3. Култыгин В.П. Французская классическая социология. М.,1991. С.8-10 (Кетле)
4. Ноэль Э. Массовые опросы. Введение в методику демоскопии. М., 1993. С.17 - 34
Социология в России М., 1996. С. 37-82 (Методология и методы)
Дополнительная
1. Социология в России XIX - начала XX веков. Тексты (вып.1,2). М.: МУБиУ, 1997
2. Справочное пособие по истории немарксистской западной социологии. М.: Наука,
1986
3. Шведовский В.А. Детерминизм и статистичность в динамических моделях //
Социс,1985, 1, 128-134
Тема 2. Случайные события и случайные величины в социологии. Практическое
определение вероятности
Понятие признака. Роль “мышления признаками” в социологии. Типы шкал.
Случайные величины в выборочном социологическом исследовании. Проблемы
построения полигонов и гистограмм. Пропущенные данные. Роль визуализации
информации. Иллюстрация на примерах работы с социологическими признаками теорем
сложения и умножения вероятностей.
Литература
Основная
1. Клигер С.А., Косолапов М.С.,Толстова Ю.Н. Шкалирование при сборе и анализе
социологической информации. М.: Наука, 1978 (глава.1)
2. Клюшина Н.А. Причины, вызывающие отказ от ответа // Социс, 1, 1990. С. 98-105
3.Плотинский Ю.М. Визуализация информации. М.: изд-во МГУ, 1994
Дополнительная
1. Лакутин О.В. Учёт пропущенных данных // Применение математических методов и
ЭВМ в социологических исследованиях. М.: ИСИ АН СССР, 1982. С.86-90
2. Толстова Ю.Н. Социология и математика: М.: ИСАН СССР, 1990
3. Литтл Р.Дж., Рубин Д.Б. Статистический анализ данных с пропусками. М.: Финансы и
статистика, 1991
Раздел 2. Элементы теории теории вероятностей.
Тема 3. Поле случайных событий. Строгое определение вероятности.
Определение
теоретико-множественных
и
логических
операций.Опыт
(испытание), условия его проведения, определение случайного события. Виды событий
Операции над событиями и их геометрическая интерпретация. Поле событий.
Классическое определение вероятности. Статистическая вероятность. Формулировка
теоремы Бернулли. Примеры ее практической проверки. Аксиоматическое задание
вероятности
Литература
Основная
1. Ноэль Э. Массовые опросы. Введение в методику демоскопии. М., 1993. С.17 – 34.
Тема 4. Условная вероятность
Определение условных и независимых событий. Общий вид двумерной
частотной таблицы и расчет на ее основе выборочных оценок условных и безусловных
вероятностей. Теорема о полной вероятности. Теорема Байеса. Общее представление о
латентно-структурном анализе (использование в процессе его реализации формул
полной вероятности и Байеса).
Тема 5. Случайная величина: функция распределения, плотность
вероятности
Строгое определение случайной величины и ее функции распределения.
Плотность распределения вероятностей. Дискретные и непрерывные случайные
величины.
Раздел 3. Основы математической статистики
Тема 6 . Уточнение основных задач математической статистики
Общее представление о параметрах распределений. Главная
задача
математической статистики - изучение случайных величин путем выборочных оценок
параметров их распределений и переноса результатов с выборки на генеральную
совокупность. Два мощных направления, в рамках которых осуществляется перенос:
оценивание параметров (введение терминов - параметры и статистики) и проверка
статистических гипотез. Два вида оценивания: точечное и интервальное. Общая
характеристика всех названных подходов.
Тема 7. Основные параметры одномерных распределений. Их точечное
оценивание
Свойства точечных оценок (несмещенность, эффективность, состоятельность).
Их содержательный смысл.Представление о мерах средней тенденции. Их
содержательный смысл. Необходимость учитывать не только среднее, но и величину
разброса значений признака.
Меры средней тенденции и их точечные оценки (математическое ожидание,
квантили, мода).. Меры разброса и их точечные оценки (дисперсия, среднее
квадратичное отклонение, среднее абсолютное отклонение, квантильный размах,
коэффициент качественной вариации, энтропия). Возможность расчета тех и других для
признаков, измеренных по разным шкалам.
Тема 8. Виды одномерных распределений, их основные параметры
Равномерное распределение. Нормальное распределение. Асимметрия и эксцесс.
Примеры использования нормального распределения в известных математических
моделях человеческих мнений: распределение установки в латентно-структурном
анализе (ЛЛА) (Лазарсфельд) и моделях подражательного поведения (Рашевский);
выражение плюрализма мнения одного человека об одном объекте в моделях парных
сравнений (Терстоун).
Распределения, основанные на нормальном (Хи-квадрат, Стьюдента, Фишера).
Их роль в социологии. Представление о таблицах распределения.
Литература
Основная
1. Моделирование социальных процессов. М.: РЭА им.Плеханова, 1993, раздел1, гл3
2. Толстова Ю.Н. Измерение в социологии. М.:Инфра-М, 1998
Тема 9 . Интервальное оценивание основных параметров одномерных
распределений
Принципы построения интервальных оценок. Понятие средней ошибки выборки.
Центральная предельная теорема. Оценки для математического ожидания, дисперсии,
доли. Оценка доли как частный случай оценки математического ожидания для
специальным образом организованных дихотомических переменных. Обобщение
подхода на другие способы многомерного статистического анализа.
Тема 10 . Основные параметры двумерного распределения, их точечное и
интервальное оценивание
Коэффициент корреляции. Его свойства и оценивание.Коэффициенты связи,
основанные на моделях прогноза. Их точечное оценивание. Использование в процессе
расчета выборочного значения понятия моды и формулы полной вероятности.
Тема 11. Проверка статистических гипотез
Логика проверки статистической гипотезы. Использование принципа
невозможности реализации маловероятных событий. Правило трех сигм, уровень
значимости и их использование. Ошибки первого и второго рода. Разъяснение сути
подхода на примерах: проверка гипотезы о нормальности генерального распределения с
помощью критерия Хи-квадрат; оценка связи на основе того же критерия; проверка
гипотез о равенстве двух средних и двух долей.
4-й модуль
Раздел 4. Основные методы многомерного статистического анализа
Тема 12 . Регрессионный анализ
Основная модель. Линейный регрессионный анализ. Метод наименьших квадратов. Расчет
коэффициентов. Оценка качества уравнения.
Тема 13. Дисперсионный анализ
Основная модель. Сравнение с моделью регрессионного анализа. Связь с
проверкой статистической гипотезы о равенстве средних. Множественные сравнения.
Тема 14. Принципы проведения эксперимента в социологии
Цели
эксперимента.
Логика
проведения
эксперимента.Классификации
экспериментов. 4 метода доказательства причинных связей по Миллю. Модель
планируемого эксперимента.
Специфика проведения эксперимента в социологии: неэкспериментальный
характер социологических данных, эксперимент по Конту, факторы, затрудняющие
эмпирическое выявление и доказательство причинных зависимостей. Использование
математической статистики при планировании эксперимента. Методический
эксперимент в социологии
Литература к разделу 4
Основная
1. Батыгин Г.С. Лекции по методологии социологических исследований. М.: Аспект
Пресс, 1995. С. 190-227
2. Методы сбора информации в социологических исследованиях.М.: Наука, 1990.Т.2. С.
190-214
3. Основы прикладной социологии. М.: Интерпракс, 1996. С.68-72
4. Ядов В.А.Социологическое исследование: методология, программа, методы. Самара:
“Самарский ун-т”,1995. С.220-231
Дополнительная
1. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. М.:
Прогресс, 1976. С. 437-458
2. Куприян А.П. Проблема эксперимента в системе общественной практики. М.:Наука,
1981
3. Кемпбелл Д. Модели экспериментов в социальной психологии и прикладных
исследованиях. М.: Прогресс, 1980
4. Рабочая книга социолога. М.: Наука, 1983. С. 411-432
5. Статистические методы анализа информации в социологических исследований. М.:
Наука, 1979. С.178-194
6. Хагуров А.А. Социальный эксперимент: логико-методологические и социальные
проблемы.Ростов-на-Дону,1989
Раздел 5. Построение выборочной совокупности в социологическом исследовании
Тема 15. Проблемы построения выборки.
Преимущества и недостатки выборочного и сплошного исследования. Простая
случайная выборка. Цели и проблемы ее построения. Проблемы формирования
представлений о генеральной совокупности.
Не вероятностные выборки в социологии. Проблемы недостижимых единиц.
Ремонт выборки.
Тема 16. Виды случайных выборок.
Случайно-повторная, случайно-бесповторная, механическая (систематическая),
серийная (гнездовая) выборки. Стратифицированная выборка
Тема 17. Территориальная выборка.
Модель выборки (многоступенчатая стратифицированная территориальная
вероятностная), единицы наблюдения. Первая ступень: выбор первичной единицы
отбора, стратификация, её критерии (равные размеры страт, заданное количество
страт, однородность по контролируемым параметрам), исключённые территории,
выбор первичной единицы
с
вероятностью,
пропорциональной размеру
кластера.Вторая ступень: возможные единицы отбора (переписные участки, выборные
участки, почтовые участки, ЖЭКи, сельские поселения, сельсоветы). Возможности
стратификации на второй ступени. Большие и маленькие кластеры: деление и слияние
поселений. Третья ступень: составление и поддержание списка жилищ, отбор жилищ,
способы вероятностного отбора респондента в семье. Искусственное моделирование
случайности. Методика Киша. Карточка выборки.
Литература к разделу 5
Основная
1. Батыгин Г.С. Лекции по методологии социологических исследований. М.: Аспект
Пресс, 1995 С. 145-189
2. Ноэль Э. Массовые опросы. Введение в методику демоскопии. М.: Ава-Эстра, 1993. С.
85-134
3. Основы прикладной социологии. М.: Интерпракс, 1996.С.31-38
4. Рабочая книга социолога. М.: Наука, 1983. С. 200-236
5. Рукавишников В.О., Паниотто В.И., Чурилов Н.Н. Опросы населения. М.: Финансы и
статистика, 1984. С. 7-81.
6. Статистические методы анализа информации в социологических исследованиях. М.:
Наука, 1979. С. 69-91.
7. Территориальная выборка в социологических исследованиях. М.: Наука, 1980
8. Чурилов Н.И. Проектирование выборочного социологического исследования. Киев:
Наукова думка, 1986
9. Ядов В.А.Социологическое исследование: методология, программа, методы. Самара:
“Самарский ун-т”,1995. С.69-76
Дополнительная
1. Божков О.Б. Эта неуловимая генеральная совокупность //Социс, 1987,3
2. Сотникова Г.Н. Методы контроля и компенсации смещений от недоступных единиц в
выборочном социологическом исследовании // Применение математических методов и
ЭВМ в социологических исследованиях. М.: ИСИ АН СССР, 1982. С.102-117
3. Шляпентох В.Э.Проблемы репрезентативности социологической информации
(случайная и неслучайная выборки в социологии). М.: Статистика, 1976
4. Kish L. Survey sampling. N.-Y.: Wiley and sons inc., 1965
Раздел 6. Непараметрические методы статистики
Тема 18 . Общее представление о непараметрическом подходе.
Смысл и роль параметрической статистики (итог ряда предыдущих тем).
Недостатки параметрического подхода Суть непараметрического подхода. Изучение
неизвестных непрерывных распределений.
Тема 19. Ранговые методы
Замена
численных
наблюдений
рангами.
Связанные
ранги.
Ранговые
коэффициенты корреляции.
Тема 20. Непараметрические подходы в многомерном статистическом
анализе.
Непараметрический дисперсионный и регрессионный анализ. Непараметрические
методы в экспертных оценках
Литература к разделу 6
Обязательная
1. Кендэл М. Ранговые корреляции. М.: Статистика, 1995
2. Математические методы анализа и интерпретация социологических данных. М.:
Наука, 1989 (раздел 3)
3. Тюрин Ю.Н. Непараметрические методы статистики. М.: Знание, 1978
Дополнительная
1. Ван дер Варден Б.Л. Математическая статистика. М.: ИЛ, 1960 (посл.две главы)
2. Гаек Я., Шидак З. Теория ранговых критериев. М.: Наука, 1971
3. Тарасенко Ф.П. Непараметрическая статистика. Томск: изд-во томского ун-та, 1976
4. Хеттсманпергер Т. Статистические выводы, основанные на рангах. М.: Финансы и
статистика, 1987
5. Холлендер М., Вулф Д. Непараметрические методы статистики. М.: Финансы и
статистика, 1983
6. Юл Дж., Кендалл М. Теория статистики. М.: Статистика, 1960
Раздел 7. Математическая статистика и анализ данных
Тема 31. Математическая статистика - основа анализа данных
Цели анализа данных. Родство задач анализа данных и математической статистики
Тема 32. Линия размежевания
Причины, мешающие использовать математическую статистику в реальных
социологических исследованиях. Подходы анализа данных, позволяющие избежать
соответствующих
ЛИТЕРАТУРА
Основная
1. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа,
1998
2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и
математической статистике. М.: Высшая школа, 1998
3. Колемаев В.А., Калинина В.Н. Теория вероятностей и математическая статистика, М.:
Инфра-М,1997
4. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере. М.:
ИНФРА-М, 1998
5. Шведов А.С. Теория вероятностей и математическая статистика. М.: ВШЭ, 1995
Дополнительная
1. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. М.:
Прогресс, 1976
2. Интерпретация и анализ данных в социологических исследованиях. М.: Наука, 1987
3. Калинина В.Н., Панкин В.Ф. Математическая статистика. М.: Высшая школа, 1998
4. Паниотто В.И. Количественные методы в социологических исследованиях. Киев:
Наукова думка, 1982
5. Рабочая книга социолога. М.: Наука, 1983
6. Статистические методы анализа социологической информации. М.: Наука, 1989
7. Татарова Г.Г. Методология анализа данных в социологии. М., 1998
8. Толстова Ю.Н. Измерение в социологии. М.: ИНФРА-М, 1998
СПРАВОЧНИКИ
1. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М., 1983
2. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров.
М., 1978
3. Поллард Дж. Справочник по вычислительным методам статистики. М.: Финансы и
статистика, 1982
4. Прохоров Ю.В., Розанов Ю.А. Теория вероятностей основные понятия. Предельные
теоремы. Случайные процессы (справочник). М., 1967
5. Рунион Р. Справочник по непараметрической статистике. Современный подход. М.:
Финансы и статистика, 1982
6. Справочник по прикладной статистике. В 2-х томах.М.: Финансы и статистика, 1989,
1990
7. Справочник по теории вероятностей и математической статистике. Киев, 1978
8. Хастингс Н., Пикок Дж. Справочник по статистическим распределениям. М.:
Статистика, 1980
9. Энциклопедический социологический словарь. М., 1996
Автор программы: _____________________________/ Толстова Ю.Н./
Скачать