Министерство экономического развития и торговли Российской Федерации Государственный университет – Высшая школа экономики Факультет МИРОВОЙ ЭКОНОМИКИ Программа дисциплины Компьютерный анализ статистических данных для специальности 080102.65 – Мировая экономика подготовки специалиста Автор Белоусова С.Н. Рекомендовано секцией УМС «Бизнес-информатика» Одобрена на заседании кафедры основ информатики и прикладного программного обеспечения __05.09.2007 г.___________ Председатель “___”_______________ 2007 г. Зав. кафедрой “__05_” сентября 2007 г. Утверждена УС факультета Мировой экономики Ученый секретарь “___”_______________ 2007 г. Москва Назаров С.В. Тематический план учебной дисциплины № Название темы Всего часов по дисциплине Аудиторные часы Лекции 1 Назначение, область применения и характеристика пакета SPSS. 2 Представление данных в виде таблиц и диаграмм 3 Самостоятельная работа Сем. и практ. занятия 3 1 7 2 1 4 Методы описательной статистики. 10 1 1 8 4 Проверка гипотез и различные виды анализа данных. 18 3 1 14 5 Измерение линейных связей, парная и частная корреляция. 16 3 1 12 10 4 Всего 54 2 40 Базовые учебники 1. А.О. Крыштановский. Анализ социологических данных с помощью пакета SPSS. М., издательский дом ГУ-ВШЭ, 2006 2. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические Системы и Сервис. 1996. 3. SPSS Base 9.0 Руководство по применению 4. SPSS Base 9.0 Руководство пользователя Формы контроля Текущий контроль - домашняя работа (12 часов самостоятельных занятий) Итоговый контроль Тест на зачете 2 Структура итоговой оценки по учебной дисциплине: Формы работы Вклад в итоговую оценку (%) Работа на практических занятиях 20 Домашнее задание 40 Тест на зачете 40 3 Содержание программы Тема 1. Назначение, область применения и характеристика пакета. Назначение, цели и функции системы, инструментальные средства. Оболочка SPSS. Состав пакета, учебник, система помощи. Содержание и разделы главного меню. Преимущества системы по сравнению с электронными таблицами. Тема 2. Представление данных в виде таблиц и диаграмм Окна вывода, окно редактирования данных. Панели инструментов. Характеристика диалоговых окон. Набор статистических методов, типы графиков. Создание файла данных. Ввод данных через электронные таблицы. Сохранение данных. Типы файлов. Редактирование, удаление, добавление показателей. Определение переменных, меток, пропущенных значений. Ввод новых наблюдений и новых переменных. Трансформация данных. Построение диаграмм. Сохранение результатов. Тема 3. Методы описательной статистики. Процедуры формирования подгрупп наблюдений или выборочных совокупностей переменных и наблюдений. Просмотр и печать данных. Представление результатов: агрегирование, расчет результирующих показателей, использование функций, ранжирование, особенности преобразований временных рядов. Получение статистических характеристик распределения вероятностей заданных значений переменных (гистограмм), процедура расчета частотной таблицы. Элементы частотных таблиц и их интерпретация. Описательные статистики (суммарные статистики, характеристики нормального распределения). Идентификация ошибок в данных, шкалы измерения данных . Дополнительная литература 1. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука, 1997. 2. Бююль А. SPSS: Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей:Пер. с нем./ А. Бююль, П. Цефель. - М.; СПб.; Киев: ДиаСофтЮП, 2001. 3. SPSS statistical algorithms. 2nd ed. Chicago. SPSS Inc. 1991. Тема 4. Проверка гипотез и различные виды анализа данных. Разведочный анализ данных, способы представления результатов. Графический анализ данных. Характеристики различных типов графика. Способы просмотра графиков. Основные шаги редактирования графиков. Назначение таблиц сопряженности. Структура и содержание элементов таблицы, ее итоговых показателей. Особенности измерения связи для номинальных, порядковых и интервальных шкал переменных. Последовательность построения таблиц и получения статистических критериев. Дополнительная литература 1. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука, 1997. 4 2. Бююль А. SPSS: искуство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей:Пер. с нем./ А. Бююль, П. Цефель. - М.; СПб.; Киев: ДиаСофтЮП, 2001. 3. SPSS statistical algorithms. 2nd ed. Chicago. SPSS Inc. 1991. Тема 5. Измерение линейных связей, парная корреляция. Последовательность действий для получения уравнения линейной регрессии. Выбор зависимой и независимой переменной и формы их зависимости. Процедура получения параметров, проверка гипотез. Расчет доверительных интервалов, выбор параметров уравнений и анализ сопутствующих статистических показателей: коэффициент R-квадрат, скорректированный R-квадрат, анализ вариации. Оценка предсказанных значений и их стандартных ошибок. Прогноз. Варианты поиска нарушения предпосылок применения математического аппарата (остатки, взаимозависимость ошибок, нормальность). Дополнительная литература 1. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука, 1997. 2. Бююль А. SPSS: искуство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей:Пер. с нем./ А. Бююль, П. Цефель. - М.; СПб.; Киев: ДиаСофтЮП, 2001. 3. SPSS statistical algorithms. 2nd ed. Chicago. SPSS Inc. 1991. Тематика заданий по различным формам текущего контроля: Примерное содержание заданий 1) Построить диаграмму Steam and Leaf, 2) Проанализировать основные характеристики распределения (мода, смещение и т.д.); 3) Построить и проанализировать ящичковую диаграмму, определить наличие выбросов и экстремумов; 4) Оценить близость распределения к нормальному на основе графика Normal Q-Q Plot, Q-Q Plot Detrended, критерия Колмогорова-Смирнова и следующих характеристик распределения: остроты пика, смещения и соотношения их величин и ошибок; 5) Оценить однородность дисперсиии на основе графика Spread-versus-level и статистики Ливиня; 6) Построить таблицу сопряженности и определить наличие зависимости между переменными, тесноту и направление связи. 7) Сравнить средние значения в группах. Вопросы для оценки качества освоения дисциплины 5 1. Как представляются данные в окне SPSS (переменные, наблюдения)? 2. Что такое метка переменной, значение переменной, метка значения? 3. Как выравниваются значения символьных переменных и значения числовых переменных? 4. Как прочитать данные из электронных таблиц MS Excel: 5. Как определяется тип переменной при чтении электронных таблиц? 6. При помощи какой команды можно рассчитать моду, квартили, процентили ? 7. При помощи какой команды можно рассчитать среднее, медиану, стандартное отклонение можно с помощью команды: 8. В каких шкалах должны быть измерены переменные, для которых можно расcчитать описательную статистику ? 9. Для каких переменных можно построить частотную таблицу? 10. Что характеризуют показатели Std.Deviation, Range, Sum представляет собой сумму всех значений переменной 11. Назовите показатель, который характеризует высоту пика кривой частотного распределения 12. Назовите показатель, который характеризует асимметрию кривой частотного распределения 13. Если Kurtosis >0, то кривая частотного распределения имеет более крутой пик, чем кривая нормального распределения с тем же средним значением и стандартным отклонением 14. Если Skewness >0, то кривая частотного распределения имеет более длинный правый хвост, чем кривая нормального распределения с тем же средним значением и стандартным отклонением 15. Какая команда позволяет отфильтровать наблюдения? 16. Как отобрать наблюдения, имеющие ненулевые значения числовой переменной? 17. Как рассчитать описательную статистику для некоторых, заранее заданных значений переменной. 18. Можно ли проанализировать отдельно группы наблюдений и каким образом разбить на группы всю совокупность данных? 19. Как показать на экране наблюдение с максимальным или минимальным значением некоторой переменной? 20. Что такое системно-пропущенные значения и значения, пропущенные пользователем? 21. Как правильно сформировать статистическую совокупность, если необходимо исключить из рассмотрения некоторые значения переменной 22. Можно ли строковую переменную преобразовать в числовую? 23. Можно ли объединять несколько критериев отбора 24. Какая команда позволяет вычислить новую переменную? 25. Как создать переменную, которая принимает случайные целочисленные значения? 26. Какие диаграммы показывают скошенность распределения? 6 27. Как графически определить моду распределения? 28. Как найти выбросы и экстремальные значения? 29. Как графически сравнить дисперсии в разных группах? 30. Как графически сравнить средние в разных группах? 31. Как осуществить проверку гипотезы? 32. При проверке статистических гипотез нулевая гипотеза отвергается или принимается, альтернативная гипотеза отвергается или принимается? 33. Как осуществить проверку гипотезы о нормальности распределения 34. На основании каких статистик и графиков проверяется гипотеза о нормальности распределения 35. На основании каких статистик и графиков проверяется гипотеза об однородности дисперсии 36. Какие преобразования можно выбрать для стабилизации дисперсии 37. При каких обстоятельствах невозможна проверка однородности дисперсии? 38. Когда обязательно задание переменной в списке Factor List диалога Explore 39. Какая команда используется для сравнения средних значений переменных? 40. Какие статистики рассчитываются в одновыборочном тесте, в парном тесте и в тесте для независимых выборок? 41. Для чего используется тест Ливиня при сравнении средних? 42. При сравнении средних доверительные интервалы строятся для среднего значения или для разности средних значений? Методические рекомендации (материалы) преподавателю: Методические материалы оформлены в виде приложения к программе. Методические указания студентам: Методические указания студентам приводятся в вариантах домашнего задания. Автор программы: _____________________________/ Ф.И.О./ 7