Правительство Российской Федерации Государственный университет – Высшая школа экономики Факультет БИЗНЕС-ИНФОРМАТИКИ Программа дисциплины Прикладной экономический анализ на основе пакетов программ SPSS, STATA (1-я часть-SPSS) для направления 080100.62 "Экономика" подготовки бакалавра экономики Автор программы к.т.н. доцент Бессонова И.А. [email protected] Рекомендована секцией УМС по бизнес-информатике Председатель Ю.В. Таратухина ______________________________ «_____» _________________ 2009 г. Утверждена Ученым Советом факультета Бизнес-информатики Ученый секретарь В.А. Фомичев ________________________ «_____» ________________ 2009 г. Одобрена на заседании кафедры Архитектуры программных систем Зав. кафедрой С.В. Назаров _________________________________ «____»_____________________ 2009 г. Москва 2009 I. Пояснительная записка Автор программы: к.т.н., доцент Бессонова И.А. Общие сведения об учебном курсе: дисциплина читается студентам факультета экономики ГУ-ВШЭ. Она входит в блок факультативных дисциплин, определяющих бакалаврскую программу, и читается во втором модуле четвертого года обучения. Продолжительность курса составляет 16 аудиторных учебных часов практических занятий и 38 часов самостоятельной работы. Рубежный контроль –контрольная работа в виде практического задания на компьютере. Аннотация Курс ориентирован на овладение приемами анализа статистических данных с помощью пакета SPSS для решения задач прикладного экономического анализа. Требования к студентам Приступая к изучению дисциплины, студент должен быть знаком: с основами математической статистики и теории вероятностей. Данный курс не заменяет стандартного курса статистики; иметь базовые знания пакета Excel. Цель изучения дисциплины: 1) познакомить студентов с основными понятиями и областью применения системы SPSS; 2) дать целостное представление о возможностях анализа данных в системе SPSS; 3) научить основам работы с различными типами исходной информации, исследованию взаимосвязей между данными и проведению анализа данных. Учебная задача дисциплины В результате изучения дисциплины слушатель должен 1) иметь представление о возможностях пакета SPSS в части решения задач с использованием различных методов статистического анализа; 2) знать способы анализа статистических данных с помощью регрессионного, кластерного и факторного анализа данных; 3) уметь самостоятельно проводить обработку информации для дальнейшей работы с ней в SPSS и анализировать скрытые закономерности в данных; 4) обладать навыками работы в SPSS для решения проблем, возникающих при проведении анализа информации. 2 II. Тематический план учебной дисциплины Номера и наименования тем Всего часов Тема 1. Характеристика SPSS. Подготовка данных к анализу. Редактирование данных. Импорт данных в SPSS из других программ. Описательные статистики. 12 Аудиторные занятия Всего Практическ. Лекции учебных занятия часов 4 4 Тема 2. Исследование взаимосвязей между данными. Проверка гипотез. 12 4 4 8 Тема 3. Регрессионный анализ данных. 16 4 4 12 Тема 4. Факторный анализ данных. Кластерный анализ данных Итого часов 14 4 4 10 54 16 16 38 III. Самост. работа 8 Базовый учебник (и) основная литература Базовой учебник 1. SPSS: искусство обработки информации. Анализ статичстических данных и восстановление скрытых закономерностей: Пер. с нем./ Ахим Бююль, Петер Цефель – СПб.: ООО «ДиаСофтЮП», 2002. Основная литература 1. Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS - М.: Изд.дом ГУ ВШЭ, 2006. 2. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. –М.: NT Press, 2004. 3. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере 3-е изд., перераб. и доп. - М.:"Инфра-М", 2003. IV. Формы контроля Текущий контроль - Работа на практических занятиях (выполнение заданий на компьютере) 3 Промежуточный контроль - контрольная работа в виде практического заданияна 2 акад часа Структура итоговой оценки по учебной дисциплине: Формы работы Вклад в итоговую оценку 1-ой части (%) Работа на практических занятиях 20 Контрольная работа 20 V. Содержание программы Тема 1. Характеристика SPSS. Подготовка данных к анализу. Редактирование данных. Импорт данных в SPSS из других программ. Описательные статистики.. ♦ Содержание темы: Назначение и оболочка SPSS. Состав пакета, учебник, система помощи. Содержание и разделы главного меню. Окна вывода, окно редактирования данных. Панели инструментов. Характеристика диалоговых окон. Набор статистических методов, типы графиков. Сбор данных. Выборка. Влияние объемов выборки на точность оценки. Подготовка данных к обработке: кодирование и кодировочные таблицы, создание матриц данных. Типы переменных. Загрузка данных в систему. Ввод данных, экспорт данных их других систем. Обнаружение ошибок ввода. Проверка данных на состоятельность. Модификация данных: вычисление переменных, аггрегирование данных, ранговые преобразования. Исследование данных и их свойств: мода, медиана, математическое ожидание, дисперсия и стандартное отклонение, вариации и формы распределения. Тема 2. Исследование взаимосвязей между данными. Проверка гипотез. ♦ Содержание темы: Разведочный анализ. Сравнение средних. Таблица сопряженности. Анализ множественных ответов. Непараметрические тесты. Измерение линейных связей, парная и частная корреляция. 4 Тема 3. Регрессионный анализ данных ♦ Содержание темы: Непараметрические тесты Простая линейная регрессия. Множественная регрессия. Результаты множественной регрессии. Остатки и выбросы. Нелинейная регрессия. Бинарная логистическая регрессия. Мультиномиальная логистическая регрессия. Тема 4. Факторный анализ данных. Кластерный анализ данных ♦ Содержание темы: Метод главных компонент. Метод главных факторов. Интерпретация факторов. Кластеризация наблюдений. Иерархические методы кластерного анализа. Партиционные методы кластерного анализа. VI. Примерное содержание заданий контрольной работы 1) Проанализировать основные характеристики распределения (мода, смещение и т.д.); 2) Определить наличие выбросов и экстремумов; 3) Оценить близость распределения к нормальному; 4) Оценить гетероскедастичность; 5) Построить таблицу сопряженности и определить наличие зависимости между переменными, тесноту и направление связи. Найти факторы наиболее полно объясняющие наблюдаемые связи между переменными. 6) Построить уравнение регрессии и оценить адекватность модели. 7) Сформировать группы наблюдений с помощью кластерного анализа. 8) Сформировать факторы для выбранных переменных. VII. Методические указания студентам: Методические указания студентам приводятся в вариантах классных заданий Автор программы: _____________________________/Бессонова И.А./ 5