МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Санкт-Петербургский государственный университет Филологический факультет Рассмотрено и рекомендовано на заседании кафедры ________________________ протокол от ________№___ Заведующий кафедрой ________________________ «УТВЕРЖДАЮ» Декан филологического факультета профессор С.И. Богданов «___»_________________200 г. (подпись) ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ «СТАТИСТИКА В ЛИНГВИСТИЧЕКИХ ИССЛЕДОВАНИЯХ» Программа дисциплины составлена в соответствии с государственным образовательным стандартом высшего профессионального образования по направлению 520500 – Лингвистика Санкт-Петербург 2005 I. ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЙ РАЗДЕЛ 1. Целью курса является ознакомление студентов с основными приемами вычислений важнейших статистических показателей, необходимых для первичной обработки и анализа материалов исследований и экспериментов. Курс иллюстрируется задачами из разных областей лингвистики. Акцентируется специфика лингвистического материала. 2. Задача курса: научить студентов пользоваться основными параметрическими и непараметрическими критериями при обработке психолингвистического и лингвистического материала, представлять результаты экспериментов графически и в таблицах. 3. Место курса в профессиональной подготовке выпускника: курс ориентирован преимущественно на студентов филологического факультета, специализирующихся в области лингвистики и психолингвистики. 4. Требования к уровню освоения содержания курса: слушатели должны хорошо ориентироваться в экспериментальном материале и уметь проводить первичную статистическую обработку результатов. II. СОДЕРЖАНИЕ КУРСА 1. Разделы курса: 1. Признак. Генеральная и выборочная совокупности. 2. Показатели центральной тенденции. 3. Показатели меры варьирования (рассеивания). 4. Параметрические критерии различия. 5. Непараметрические критерии различия. 6. Корреляционная связь. 2. Темы и краткое содержание 2.1. Признак. Генеральная и выборочная совокупности. 2.1.1. Признак и его градации. Качественные и количественные (дискретные и непрерывные) признаки. 2.1.2. Выборка и генеральная совокупность. Количественная и качественная представительность выборки. Таблицы случайных чисел. Объем выборки. 2.1.3. Ранжирование и табулирование выборок. Статистическое распределение. Графический вид распределения (полигон частот и гистограмма). Язык описания распределений. 2.2. Показатели центральной тенденции. 2.2.1. Средняя арифметическая. 2.2.2. Мода. 2.2.3. Медиана. 2.2.4. Другие виды средних. 2.3. Показатели меры варьирования. 2.3.1. Лимиты. Вариационный размах. 2.3.2. Линейное отклонение. Дисперсия и среднее квадратическое отклонение. 2.3.3. Коэффициент вариации. 2.3.4. Ошибка средней. Показатель точности опыта. 2.3.5. Гипотеза о средней арифметической. 2.4. Параметрические критерии различия. 2.4.1. t-критерий Стьюдента для сравнения генеральной и выборочной средних, для сравнения двух выборочных средних. 2.4.2. Графический способ сопоставления средних. 2.4.3. Дисперсия, среднее квадратическое отклонение, ошибка доли. 2.4.4. Определение необходимого объема выборки. 2.4.5. Оценка вероятности с помощью доверительного интервала. t-критерий для сравнения теоретической вероятности и частоты, для сравнения двух частот. 2.4.6. F-критерий Фишера. 2.4.7. 2 Пирсона. Сравнение теоретических и эмпирических рядов частот. Другие виды 2 . 2.5. Непараметрические критерии различия. 2.5.1. Критерий Уайта. 2.5.2. Критерий λ (лямбда) Колмогорова-Смирнова. 2.5.3. Критерий Уилкоксона. 2.5.4. Критерий знаков. 2.5.5. Критерий Манна-Уитни. 2.6. Корреляционная связь. 2.6.1. Коэффициент нормальной корреляции. 2.6.2. Коэффициент ранговой корреляции. 2.6.3. Энтропия. 3. Перечень контрольных заданий для самостоятельной работы Что такое варианта? Случайная переменная? Каковы принципы группировки данных при качественной изменчивости? При количественной дискретной? При количественной непрерывной изменчивости? В чем разница между гистограммой и полигоном распределения? Каковы возможные причины многовершинности вариационных кривых? Что такое вариационный размах и лимиты? Какие две группы показателей позволяют характеризовать вариационные ряды? Свойства средней арифметической. Степени свободы. Что такое доверительные интервалы? Отличаются ли друг от друга по закономерностям случайной вариации выборочная и генеральная совокупности? В какой степени средняя арифметическая выборочной совокупности характеризует среднюю арифметическую генеральной совокупности? Объясните, в чем заключается закон больших чисел. Кратко охарактеризуйте основные предпосылки выборочного метода. Объясните сущность нулевой гипотезы и дайте примеры. Проиллюстрируйте вычисление энтропии на примере какого-либо ассоциативного поля. Что такое корреляция? Какая разница между корреляционной и функциональной зависимостью? Какая разница между положительной и отрицательной корреляциями? Какие значения коэффициента корреляции следует считать высокими, средними, низкими и почему? Является ли наличие корреляции доказательством причинной зависимости между изучаемыми варьирующими признаками? 4. Перечень тем для курсовых работ и рефератов Вероятность и ее исчисление. Теоремы сложения и умножения вероятностей. Биномиальное распределение и распределение Пуассона. Нормальное распределение и его характеристика с помощью нормированного отклонения. Доверительные вероятности. Вероятностные или стохастические процессы. Проблема достоверности в статистике. Закономерности случайной вариации. Оценка достоверности статистических показателей. Регрессия и корреляция. Фактические данные и научная гипотеза. Дисперсионный анализ. Факторный анализ. 5. Перечень вопросов к экзамену по всему курсу Признак и его градации. Качественные и количественные (дискретные и непрерывные) признаки. Выборка и генеральная совокупность. Количественная и качественная представительность выборки. Показатели центральной тенденции: средняя арифметическая, мода, медиана. Показатели меры варьирования: лимиты, вариационный размах. Дисперсия и среднее квадратическое отклонение. Коэффициент вариации. Ошибка средней. Показатель точности опыта. Параметрические критерии различия. t-критерий Стьюдента. Графический способ сопоставления средних. Дисперсия, среднее квадратическое отклонение, ошибка доли. F-критерий Фишера. 2 Пирсона. Сравнение теоретических и эмпирических рядов частот. Критерий Уайта. Критерий λ (лямбда) Колмогорова-Смирнова. Критерий Уилкоксона. Критерий знаков. Коэффициент нормальной корреляции. Коэффициент ранговой корреляции. Энтропия. III. РАСПРЕДЕЛЕНИЕ ЧАСОВ КУРСА ПО ТЕМАМ И ВИДАМ РАБОТЫ № 1 2 Наименование тем и разделов Признак. Генеральная и выборочная совокупности Показатели центральной Всего (час.) 12 18 Лекции Самостоятельная работа 4 8 6 12 3 4 5 6 тенденции Показатели меры варьирования (рассеивания) Параметрические критерии различия Непараметрические критерии различия Корреляционная связь ИТОГО: 18 6 12 24 8 16 24 8 16 12 108 4 36 8 72 IV. ФОРМА ИТОГОВОГО КОНТРОЛЯ: ЗАЧЕТ V. УЧЕБНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ КУРСА Рекомендуемая литература 1. Вольф В.Г. Статистическая обработка опытных данных. М., 1966. 2. Гублер Е.В., Генкин А.А. Применение непараметрических критериев статистики в медикобиологических исследованиях. Л., 1973. 3. Ивантер Э.В., Коросов А.В. Основы биометрии. Петрозаводск, 1992. 4. Носенко. Начала статистики для лингвистов. М., 1984. 5. Плохинский Н.А. Биометрия. М., 1970. 6. Поллард Дж. Справочник по вычислительным методам статистики. М., 1982. 7. Рокицкий П.Ф. Биологическая статистика. Минск, 1973. 8. Сидоренко Е. В. Методы математической обработки в психологии. СПб, 2000. 9. Терентьев П.В., Ростова Н.С. Практикум по биометрии. Л., 1977. 10. Фишер Р. Статистические методы для исследователей. М., 1985. Автор программы: Е.В.Глазанова, кандидат филологических наук, старший преподаватель.