SPSS для магистратуры БИ

реклама
Правительство Российской Федерации
Государственное образовательное бюджетное учреждение
Высшего профессионального образования
Государственный университетВысшая школа экономики
Факультет бизнес-информатики
Программа дисциплины
«Системы статистического
анализа данных»
для направления 080700.68 – «Бизнес-информатика»
подготовки магистра
Авторы: Т.К. Богданова, О.М. Уварова
Рекомендовано секцией УМС
Секция «Бизнес-информатика»
Председатель
_____________ Ю.В.Таратухина
“___” ________________ 2009 г.
Одобрена на заседании
кафедры бизнес-аналитики
Зав. кафедрой
________________Т.К.Кравченко
“___” _________________ 2009 г.
Утверждено УС факультета
Бизнес-информатики
Ученый секретарь
_________________В.А. Фомичев
“___” _______________2009 г.
Москва – 2009
1.
№ п/п
Тематический план учебной дисциплины
Наименования тем
Аудиторные часы
Всего
часов
Лекции
Тема 1. Особенности
подготовки данных для
статистического анализа.
Тема 2. Описательная
статистика для
номинальных, порядковых и
количественных шкал.
Тема 3. Поиск связей между
номинальными,
порядковыми и
количественными
переменными.
12
2
2
4
8
22
4
4
8
14
40
8
8
16
24
4.
Тема 4. Аппроксимация
кривыми. Нелинейная и
взвешенная регрессия.
24
4
4
8
16
5.
Тема 5. Метод
множественной дихотомии и
категориальный метод.
Тема 6. Логистическая
регрессия.
32
4
8
12
20
44
8
6
14
30
7.
Тема 7. Деревья решений.
36
6
6
12
24
8.
Тема 8. Дискриминантный
анализ, другие методы
классификации и анализа
структуры данных.
40
8
8
16
24
9.
Тема 9. Программирование в
SPSS.
40
6
4
10
30
34
6
4
10
24
324
56
54
110
214
1.
2.
3.
6.
10. Тема 10. Временные ряды.
Итого часов
I.
Внеауди
торные
Практи
Всего
часы
ческие аудиторных
занятия
часов
Формы рубежного контроля и структура итоговой оценки
Итоговая оценка по учебной дисциплине выставляется в четвертом модуле. Она
складывается из оценок за:
 работу на практических занятиях.
 1 контрольную работу.
 3 домашних задания.
 ответы на 2-х зачетах.
 ответ на экзамене
2
Итоговая оценка во 2-ом модуле О2 формируется следующим образом:
О2 = 0,1  О1 + 0,2  О2 + 0,3  О3+ 0,4  О4
где:
О1 – оценка за работу на практических занятиях;
О2 – оценка за контрольную работу;
О3 – оценка за 1-ое домашнее задание;
О4 – оценка за ответ на зачете;
Итоговая оценка во 3-м модуле О3 формируется следующим образом:
О3 = 0,1  О1 + 0,4  О2 + 0,5  О3
где:
О1 – оценка за работу на практических занятиях;
О2 – оценка за 2-ое домашнее задание;
О3 – оценка за ответ на зачете;
Итоговая оценка по этой дисциплине «О» формируется следующим образом:
О = 0,1  О1 + 0,2  О2 + 0,2  О2 + 0,2  О3+ 0,3  О3
где:
О1 – оценка за работу на практических занятиях;
О2 – оценка за 3-е домашнее задание;
О3 – оценка за ответ на экзамене;
О2 – оценка за второй модуль;
О3 – оценка за третий модуль.
II. Базовый учебник
1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002.
III. Содержание дисциплины
Тема 1. Особенности подготовки данных для статистического анализа.
Предмет и содержание курса, связь с другими дисциплинами. Классификация основных
методов статистического анализа данных, разработанных в рамках теории
математической статистики.
Шкалы измерения. Переменные и наблюдения, значение переменной в конкретном
наблюдении. Имя переменной, тип переменной, метка переменной и метки
значений. Редактирование, удаление, добавление переменных. Ввод новых
наблюдений. Пропущенные значения.
3
Модификация и отбор данных: условный отбор данных и случайная выборка, сортировка и
группировка данных, перекодирование переменных, вычисление новых
переменных.
Поиск ошибок и логических противоречий в данных
Объединение файлов, создание объединенной выборки по переменным и наблюдениям.
Основная
1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002, с. 1419, с. 26-43, с. 51 –53, с. 74 – 79, с. 116-117, с. 131-138.
Дополнительная
2. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. –
СПб.: Питер, 2005. – 192 с.: ил.
3. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
Системы и Сервис. 1996.
4. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT
Press, 2004.
Тема 2. Описательная статистика для номинальных, порядковых и
количественных шкал.
Процедура расчета частотных таблиц. Элементы частотных таблиц и их интерпретация.
Назначение таблиц сопряженности. Структура и содержание элементов таблицы, ее
итоговых показателей.
Графическая интерпретация частотных таблиц и таблиц сопряженности.
Получение статистических характеристик распределения вероятностей заданных значений
переменных. Проверка распределения на нормальность, однородность дисперсии в
группах. Нормализующие преобразования.
Стандартизация значений.
Графический анализ данных: построение гистограмм, ящичковых диаграмм - BoxPlot,
диаграмм Stem & Leaf - "ствол-листья" графика Q-Q Normal Probability Plot "нормальная вероятностная бумага", графика с удаленным трендом Detrended
Normal Plot). Характеристики различных типов графика.
Основная
1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002,. , с. 82104, с. 117-129, с. 143, с. 164-206, с. 220-255..
2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука,
1997.
Дополнительная
3. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. –
СПб.: Питер, 2005. – 192 с.: ил.
4. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
Системы и Сервис. 1996.
4
5. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT
Press, 2004.
Тема 3. Поиск связей между номинальными, порядковыми и
количественными переменными.
Особенности измерения связи для номинальных и порядковых шкал переменных. Проверка
статистических гипотез. Статистическая значимость. Критерий Хи-квадрат и
ограничения на его использование. Точные тесты (Exact-тест, метод Монте-Карло).
Другие критерии проверки на независимость (коэффициент риска и т.д.)
Построение и анализ диаграмм рассеяния. Коэффициенты корреляции Пирсона. Ранговые
коэффициенты корреляции. Частные корреляции. Значимость связи.
Основная
1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002,
с. 170-206, с. 220-255.
2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука,
1997.
Дополнительная
3. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. –
СПб.: Питер, 2005. – 192 с.: ил.
4. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
Системы и Сервис. 1996.
5. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT
Press, 2004.
Тема 4. Аппроксимация кривыми. Нелинейная и взвешенная регрессия.
Аппроксимация зависимостей с помощью кривых.
Последовательность действий для получения уравнения нелинейной регрессии. Выбор
зависимой и независимой переменной и формы их зависимости. Процедура
получения параметров, доверительных интервалов.
Основная
1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002,
с. 256-279.
2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука,
1997.
Дополнительная
3. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. –
СПб.: Питер, 2005. – 192 с.: ил.
4. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
Системы и Сервис. 1996.
5. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT
Press, 2004.
5
Тема 5. Метод множественной дихотомии и категориальный метод.
Метод множественной дихотомии и категориальный метод. Особенности кодирования и
анализа множественных ответов.
Определение наборов, работа с наборами. Частотные таблицы для дихотомических и
категориальных
наборов,
Custom
Tables. Таблицы сопряженности
с
дихотомическими и категориальными наборами. Сравнение дихотомного и
категориального методов.
Основная
6. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002,
с. 256-279.
7. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука,
1997.
Дополнительная
8. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. –
СПб.: Питер, 2005. – 192 с.: ил.
9. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
Системы и Сервис. 1996.
10. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT
Press, 2004.
Тема 6. Логистическая регрессия.
Методы классификации. Модель логистической регрессии. Оценка качества модели.
Категориальные предикторы, отбор предикторов. Методы диагностики.
Мультиномиальная логистические регрессия. Порядковая регрессия.
Основная
1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002,
с. 346-382.
2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука,
1997.
Дополнительная
3. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. –
СПб.: Питер, 2005. – 192 с.: ил.
4. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
Системы и Сервис. 1996.
5. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT
Press, 2004.
Тема 7. Деревья решений.
Деревья решений как метод классификации. Основные термины и понятия.
Методы построения дерева решений. Анализ с помощью дерева решений. Обычные задачи
анализа с помощью дерева решений. Области приложения анализа с помощью
дерева решений. Анализ с помощью CHAID. Метод Quest. Регрессионные деревья.
6
Проверка адекватности модели.
Сравнение методов построения дерева решений.
Основная
1. Кравченко Т.К., Перминов Г.И. Информационные
экономических решений. –М.: ГУ-ВШЭ. Тасис, 2006.
технологии
принятия
Дополнительная
2. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
Системы и Сервис. 1996.
Тема 8. Дискриминантный анализ, другие методы классификации и
анализа структуры данных.
Дискриминантный анализ. Формулировка задачи. Основная модель. Предположения,
лежащие в основе дискриминантного анализа. Рекомендации по применению.
Сравнение дискриминантного анализа и логистической регрессии.
Кластерный анализ как метод классификации. Иерархические и неиерархические методы
кластерного анализа. Меры расстояния и нормировка. Профили средних значений
кластеров. Кластеризация при помощи метода Варда. Метод k-средних.
Факторный анализ. Принципы факторного анализа. Метод главных компонент. График
«осыпь». Методы вращения.
Основная
1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002,
с. 384-409.
2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука,
1997.
Дополнительная
3. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. –
СПб.: Питер, 2005. – 192 с.: ил.
4. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
Системы и Сервис. 1996.
5. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT
Press, 2004.
Тема 9. Программирование в SPSS.
Введение в синтаксис SPSS. Основные синтаксические правила. Подготовка к выполнению
команд синтаксиса. Кнопка Paste. Выполнение готовой программы для SPSS.
Преобразование переменных с использованием синтаксиса. Построение циклов.
Работа с файлами: открытие, сохранение, отбор наблюдений. Объединение
синтаксиса и диалогового режима. Программы операций над матрицами. Создание
сценария и его применение.
Основная
1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002,
7
с. 368-384.
2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука,
1997.
Дополнительная
3. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. –
СПб.: Питер, 2005. – 192 с.: ил.
4. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
Системы и Сервис. 1996.
5. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT
Press, 2004.
Тема 10. Временные ряды.
Анализ и прогнозирование временных рядов. Основные понятия. Инструментальные
средства работы с временными рядами: сглаживание, выделение тренда, сезонной и
циклической составляющей. Определение периодичности временного ряда.
Требования к данным для построения моделей временных рядов. Регрессионные
модели временного ряда. Модели экспоненциального сглаживания.
Основная
1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002,
с. 368-384.
2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука,
1997.
Дополнительная
3. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. –
СПб.: Питер, 2005. – 192 с.: ил.
4. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
Системы и Сервис. 1996.
5. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT
Press, 2004.
IV. Литература:
Основная
1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей.
Торгово-издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002.
2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука,
1997.
3. Кравченко Т.К., Перминов Г.И. Информационные технологии принятия
экономических решений. –М.: ГУ-ВШЭ. Тасис, 2006.
Дополнительная
4. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. –
СПб.: Питер, 2005. – 192 с.: ил.
5. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT
Press, 2004.
6. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические
8
Системы и Сервис. 1996.
7. SPSS statistical algorithms. 2nd ed. Chicago. SPSS Inc. 1991.
8. SPSS Base 9.0 Руководство по применению
9. SPSS Base 9.0 Руководство пользователя
V. Тематика заданий по различным формам текущего контроля
Тематика домашних работ
1. Построение модели для оценка кредитоспособности предприятия
2. Выбор коммерческого банка
3. Оценка конкурентоспособности продукции
4. Выбор поставщика продукции
5. Анализ макроэкономических показателей
6. Прогноз экономических показателей
7. Построение портрета покупателя на основе анализа опросных листов
VI.
Контрольные вопросы
Основные методы статистического анализа данных.
Шкалы измерений.
Особенности подготовки данных для статистического анализа в системе SPSS.
Описательная статистика для номинальных и порядковых шкал в системе SPSS.
Частотные таблицы: валидный и кумулятивный процент. Реализация в системе SPSS.
Таблицы сопряженности в системе SPSS.
Описательная статистика для количественных переменных. Реализация в системе
SPSS.
8. Корреляционный анализ. Частные и парные корреляции.
9. Простая и множественная линейная регрессия. Реализация в системе SPSS.
10. Бинарная и мультиномиальная логистические регрессии. Реализация в системе SPSS.
11. Дискриминантный анализ. Реализация в системе SPSS.
12. Кластерный анализ: основные принципы и методы. Реализация в системе SPSS.
13. Иерархический кластерный анализ. Реализация в системе SPSS.
14. Факторный анализ и анализ главных компонент. Реализация в системе SPSS.
15. Деревья решений: метод CHAID. Реализация в системе SPSS.
1.
2.
3.
4.
5.
6.
7.
VII. Методические материалы преподавателю
Практические занятия и самостоятельная работа студентов по освоению
статистических методов анализа данных проводятся с использованием статистического
комплекса SPSS. На практических занятиях для проверки качества освоения материала
используются электронные мини тесты.
VIII. Рекомендации по использованию информационных технологий
Для освоения курса «Системы статистического анализа данных» рекомендуется
изучить статистический комплекс SPSS компании SPSS U.S.
Авторы программы:
_____________________________ (Т.К. Богданова)
_____________________________ (О.М. Уварова)
9
Скачать