Анализ данных в менеджменте (SPSS) Государственный университет - Высшая школа экономики

реклама
Министерство экономического развития и торговли
Российской Федерации
Государственный университет Высшая школа экономики
Нижегородский филиал
Факультет менеджмента
Программа дисциплины
Анализ данных в менеджменте (SPSS)
для специальности XXXXXXXX – «XXXXXXXXXXX»
подготовки специалиста
Автор: д.ф.-м.н., профессор Бобков Н.Н.
Рекомендована секцией
«Математика и информация»
Председатель:
_______________В.М.Демкин
«___»___________2009 г.
Одобрена на заседании кафедры
«Математика»
Зав. кафедрой:
________________ Громов Е.М.
«___ »___________2009 г.
Утверждена УМС
Председатель:
________________Л.Г.Макарова
«___» __________2009 г.
Нижний Новгород, 2009 год
1
I. ПОЯСНИТЕЛЬНАЯ ЗАПИСКА
ТРЕБОВАНИЯ К СТУДЕНТАМ
Исходный уровень – владение понятиями и аппаратом дисциплины «Вероятностные и статистические модели», а также общими математическими сведениями в объеме двух первых
курсов вуза.
АННОТАЦИЯ
Учебная дисциплина «Анализ данных в менеджменте (SPSS)» опирается на материал предшествующих дисциплин «Высшая математика», «Вероятностные и статистические модели»,
«Исследование операций» учебного плана факультета Менеджмента. Дисциплина является
логическим завершением изучения студентами третьего курса математической компоненты
профессионального образования. В значительной мере она представляет собой конкретизацию в профессионально-прикладном направлении курса «Вероятностные и статистические
модели», включая в себя наряду с вопросами прикладной статистики также ряд проблем количественного анализа хозяйственных операций и управленческих решений. Анализ данных
– один из рабочих инструментов маркетолога и менеджера-практика, находящий применение
в соответствующих предметных областях их профессиональной деятельности. При рассмотрении в курсе тех или иных математических методов главное внимание уделяется их использованию в конкретном социально-экономическом анализе и работе с данными, заимствованными из повседневной практики реальных организаций и фирм. Компьютерная реализация
ключевых задач курса поддерживается встроенным в него изучением универсальной среды
для статистических расчетов SPSS (PASW).
УЧЕБНАЯ ЗАДАЧА КУРСА
Основная задача данного курса состоит в формировании у студентов навыков системной
аналитики с использованием современных компьютерных технологий. Материал курса предназначен для дальнейшего использования и развития в таких областях экономической деятельности, как стратегическое управление, маркетинг, инвестиционный и финансовый менеджмент, управление ресурсами, управленческое консультирование и др. Важной практической целью дисциплины «Анализ данных в менеджменте (SPSS)» является подведение студентов к творческому профессиональному восприятию последующих специальных дисциплин, в той или иной степени связанных с подготовкой и компьютерным анализом экономической информации, принятием и реализацией решений и оцениванием их последствий.
В результате изучения курса «Анализ данных в менеджменте (SPSS)» студент должен:
1. Знать методы сбора данных, научиться сводить их в таблицы и графически отображать в
среде SPSS (PASW). Овладеть вычислением важнейших описательных статистических
показателей, уяснив необходимость их использования при оценке информации экономического характера.
2. Владеть основными методами вычисления вероятностей в случае дискретных и непрерывных распределений. Знать основные распределения вероятностей и области их применения. Уметь применять вероятностные методы анализа, например, владеть приемами построения деревьев вероятностей и деревьев решений при разборе различных хозяйствен2
ных ситуаций. Овладеть техникой проверки статистических гипотез в терминах критических значений статистики теста, ее наблюденной значимости (p-value) и путем вычисления доверительных интервалов для тестируемых параметров генеральной совокупности.
Уметь статистически интерпретировать построенные доверительные интервалы.
3. Научиться анализу зависимости между двумя переменными при помощи графических
средств SPSS (PASW). Уметь вычислять коэффициенты корреляции с целью определения
силы линейной зависимости между ними. Научиться сроить регрессионные прямые, анализировать результаты (таблицы) регрессионного анализа, полученные в среде SPSS
(PASW), проверять совместность первичных данных с допущениями модели регрессии
путем анализа ее остатков и использовать методы регрессии для получения простейших
прогнозов в разнообразных экономических ситуациях при принятии экономических решений.
4. Овладеть основными приемами множественного регрессионного анализа, включая диагностику мультиколлинеарности, методы выявления гетероскедастичности и коррелированности ошибок регрессии, способы отбора значимых предикторов, в частности, в виде
соответствующих пошаговых алгоритмов SPSS (PASW). Четко представлять себе заложенные в основу регрессионной модели вероятностно-статистические допущения и необходимость проверки соответствия этим допущениям первичного статистического материала. Научиться методам такой проверки в терминах стандартных визуальных тестов и тестов известных статистических гипотез при помощи процедур, встроенных в среду SPSS
(PASW). Научиться прогнозированию средних и индивидуальных значений отклика посредством найденного в этой среде уравнения регрессии, применять прогнозирование в
хозяйственной и коммерческой деятельности.
ФОРМЫ КОНТРОЛЯ
Текущий контроль осуществляется в виде контрольных работ на 4-й, 8-й, 12-й и 16-й
неделях изучения курса.
Итоговый контроль: экзамен на 16-й неделе. Учитываются результаты активности в
аудитории и выполнение индивидуальных домашних заданий.
II. ТЕМАТИЧЕСКИЙ ПЛАН УЧЕБНОЙ ДИСЦИПЛИНЫ.
Наименование разделов и тем
1. Элементы описательной статистики (SPSS).
2. Вероятностные методы в
задачах логистики, менеджмента и маркетинга (SPSS).
3. Анализ соотношений. Методы регрессии. Простая парная
регрессия (SPSS).
4. Элементы множественного
регрессионного анализа (SPSS).
Итого
Лекции
Практические
занятия
Всего
ауд.
часов
Самост.
работа
Всего
часов
10
30
40
19
59
14
42
56
26
82
20
60
80
38
118
16
48
64
30
94
60
180
240
113
353
3
III. ФОРМЫ РУБЕЖНОГО КОНТРОЛЯ И СТРУКТУРА ИТОГОВОЙ ОЦЕНКИ
Контроль знаний студентов включает формы текущего и итогового контроля. Текущий контроль
осуществляется в течение двух модулей. По курсу предусмотрены текущий контроль знаний и
работы студентов на практических занятиях и 4 контрольных работы (2 х 30 мин.). Контрольная
работа представляет собой защиту в компьютерном классе каждого из четырех домашних задания, выполненных с использованием статистического пакета SPSS (PASW) и тематически соответствующих изучаемому разделу курса. Каждая форма текущего контроля оценивается 10балльной оценкой, которая выставляется в рабочую ведомость преподавателя. По результатам
текущего контроля организуются индивидуальные консультации в рамках второй половины рабочего дня преподавателя. Форма итогового контроля – экзамен в конце второго модуля, который оценивается по 10-балльной шкале.
Для получения результирующей экзаменационной оценки О итогового контроля используются
следующие весовые множители:
0,2 – для оценки Опракт1, Опракт2 за работу студентов на практических занятиях,
0,4 – для оценки Оконтр1, Оконтр2 за 1-ю и 2-ю контрольные работы,
0,35 – для оценки Оконтр3 за 3-ю контрольную работу,
0,45 – для оценки Оконтр3 за 4-ю контрольную работу.
Для получения результирующей экзаменационной оценки О по 10-балльной шкале вычисляется величина
О = 0,5 х (Омод1 + Омод2), где
Омод1 = 0,2 х Опракт1 + 0,4 х Оконтр1+ 0,4 х Оконтр2,
Омод2 = 0,2 х Опракт2 + 0,35 х Оконтр3 + 0,45 х Оконтр4.
Полученный после округления этой величины до целого значения результат выставляется как
итоговая оценка по 10-балльной шкале по учебной дисциплине «Анализ данных в менеджменте
(SPSS)» в экзаменационную ведомость и зачетную книжку студента. В экзаменационную ведомость и зачетную книжку студента выставляется также и оценка по данной дисциплине по 5балльной системе, получаемая из оценки по десятибалльной шкале в соответствии со следующей
таблицей соответствия (см. Приложение № 2 к приказу Ректора ГУ-ВШЭ № 1002 от 17.06.2002)
Таблица соответствия оценок по 10-бальной и 5-бальной системам:
По 10-бальной шкале
1 – неудовлетворительно
2 – очень плохо
По 5-бальной шкале
Неудовлетворительно – 2
4
3 – плохо
4 – удовлетворительно
5 – весьма удовлетворительно
6 – хорошо
7 – очень хорошо
8 – почти отлично
9 – отлично
10 – блестяще
IV
Удовлетворительно – 3
Хорошо – 4
Отлично - 5
Содержание программы
Тема 1. Элементы описательной статистики и теории вероятностей
Методы сбора данных, их сведение в таблицы и графическое отображение (гистограммы, столбиковые диаграммы, графики и секторные диаграммы, диаграммы типа «ствол и листья», блочные диаграммы («Ящик с усами»), диаграммы Парето и др.). Средние (среднее арифметическое,
мода, медиана). Вариации (размах вариации, межквартильный размах, дисперсия и среднее квадратическое отклонение). Коэффициент вариации, персентиль (процентиль), квантиль, показатель
асимметрии. Реализация графического представления данных и вычисления их статистических
характеристик в среде SPSS (PASW).
Основная литература [1–3, 7 – 10].
Дополнительная литература [17 – 19].
Тема 2. Вероятностные методы в задачах менеджмента и маркетинга
Основы оценки вероятности. Операции со случайными событиями. Аксиомы теории вероятностей. Условные вероятности. Формула полной вероятности и формула Байеса. Случайные величины. Важные законы распределения вероятностей. Дерево вероятностей. Ожидаемые значения.
Дерево решений. Доверительные интервалы. Проверка гипотез. Реализация вычисления квантиля
по заданному квантильному рангу или квантильного ранга по заданному значению квантиля для
стандартных вероятностных распределений в среде SPSS (PASW).
Основная литература [1 –3, 5, 8, 9, 12, 14].
Дополнительная литература [17 – 21].
Тема 3. Соотношения между переменными. Элементы корреляционного анализа.
Простая парная регрессия
Графическое отображение соотношений. Диаграмма рассеяния. Линейная и нелинейная зависимости. Линеаризация. Коэффициент корреляции Пирсона. Ранговая корреляция по Спирмену и
5
Кендалу. Методы регрессии. Простая парная регрессия. Основные допущения модели о предикторе и свойствах ошибок регрессии. Матрица плана эксперимента. Информационная матрица.
Метод наименьших квадратов оценки коэффициентов в уравнении регрессии и его геометрическая интерпретация. Регрессия как ортогональное проектирование на подпространство предикторов. Линия «наилучшего соответствия» – регрессионная прямая. Сдвиг и наклон прямой регрессии и их статистическая интерпретация. Коэффициент детерминации как мера прогностической
силы модели. F-тест (тест Фишера) на общую пригодность модели. Проверка статистической
значимости отличия от нуля наклона в уравнении регрессии: t-тест. Доверительные интервалы
для коэффициентов регрессии, а также для значений отклика (среднего или индивидуального) и
их сопоставление по ширине при получении соответствующих интервальных оценок. Влияние
выбросов на регрессионные коэффициенты. Анализ остатков регрессии: визуальные тесты на
нормальность (гистограмма остатков, P-P и Q-Q диаграммы), тест Колмогорова-Смирнова, тест
Дарбина-Уотсона. Проверка гомоскедастичности ошибок регрессии при помощи диагностической диаграммы. Реализация корреляционного и регрессионного анализа статистических данных
в среде SPSS (PASW).
Основная литература [1, 3, 7 – 10, 12, 15, 16].
Дополнительная литература [17, 20, 21].
Тема 4. Элементы множественного регрессионного анализа
Элементы анализа регрессионных моделей с несколькими предикторами. Сходство и различия
этапов анализа с соответствующими этапами для простой парной регрессии. Коэффициенты
частной корреляции между откликом и одним из предикторов при исключении линейного влияния на них некоторой группы оставшихся предикторов. Диагностика мультиколинеарности в
задачах множественной регрессии при помощи: сравнения коэффициентов корреляции отклик –
предиктор нулевого уровня с соответствующими коэффициентами частной корреляции; анализа
собственных чисел информационной матрицы, инфляционного индекса; соотношения между
результатами F-теста на общую пригодность модели и результатами t-тестов значимости отдельных предикторов и др. Пошаговая процедура включения в модель значимых предикторов. Анализ остатков регрессии. Проверка гомоскедастичности и некоррелированности ошибок регрессии. Доверительные интервалы для коэффициентов регрессии и значений отклика. Реализация
множественного регрессионного анализа в среде SPSS (PASW).
Основная литература [3, 4 – 10, 14 – 16].
Дополнительная литература [19 – 21].
V.
Методические рекомендации преподавателю
См. приложение по методике 10-балльной оценки.
6
VI.
Методические рекомендации студентам
Следует обратить особое внимание на вдумчивое и творческое овладение основными приемами анализа данных в менеджменте. Цель обучения состоит в выработке умения применять
полученные знания при решении разнообразных прикладных вопросов, встречающихся в практике современного менеджера.
Библиографический список
Базовые учебники
1. Томас Р. Х. Количественный анализ хозяйственных операций и управленческих решений. –
М.: Дело и Сервис, 2003.
2. Тюрин Ю.Н., Макаров А.А.Анализ данных на компьютере. 3-е изд. под ред. В.Э. Фигурнова. –
М.: – Инфра-М, 2004.
3. Норман Р.Дрейпер, Гарри Смит. Прикладной регрессионный анализ. – М.: Издательский
дом «Вильямс», 2007.
Основная литература
4. S.Weisberg. Applied Linear Regression. – John Wiley&Sons, Inc., 2005.
5. R.Ho. Handbook of Univariate and Multivariate Data Analysis and Interpretation with SPSS.
Chapman&Hall/CRC, 2006.
6. SPSS 16.0 Base User's Guide. – 2007.
7. Эндрю Ф. Сигел. Практическая бизнес-статистика. – Москва, Санкт-Петербург, Киев: Вильямс, 2004.
8. G.Koop. Analysis of Economic Data. – John Wiley&Sons, Ltd., 2005.
9. Д.М.Левин , Д.Стефан, Т.С.Кребиль, М.Л.Беренсон. Статистика для менеджеров с использованием Microsoft Excel. – Москва, Санкт-Петербург, Киев: Вильямс, 2004.
10. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник
для вузов. В 2-х т. – М.: Юнити, 2001.
11. А.Бююль, П.Цёфель. SPSS. Искусство обработки информации, анализ статистических
данных и восстановление скрытых закономерностей. – Москва, Санкт-Петербург, Киев:
DiaSoft, 2002.
12. Плис А.И., Сливина Н.А. Практикум по прикладной статистике в среде SPSS. – М.: Финансы и статистика, 2004.
13. Обучение SPSS 13.0. Обучающий CD-диск. – М.: Media 2000 (www.media2000.ru), 2005.
14. Теория вероятностей и математическая статистика. Учебное пособие. Под ред.
В.И.Ермакова. – М.: Инфра-М, 2004
15. Глинский В.В., Ионин В.Г. Статистический анализ. Учебное пособие.– М.: ИИД «ФИЛИНЪ», 1998.
16. . Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. – М.: Мир,
1982.
Дополнительная литература
17. В.М.Симчера. Методы многомерного анализа статистических данных. М.:Финансы и статистика, 2008.
7
18. А. Ф. Гришин, С. Ф. Котов-Дарти, В. Н. Ягунов. Статистические модели в экономике. –
М.: Феникс, 2005.
19. Глинский В.В., Ионин В.Г. Статистический анализ. Учебное пособие.– М.: ИИД «ФИЛИНЪ», 1998.
20. Колемаев В.А., Калинина В.Н. Теория вероятностей и математическая статистика. Учебник (Серия «Высшее образование»). – М.: Юнити, 2003.
21. John A.Rice. Mathematical Statistics and Data Analysis. – ITP, 1995.
Автор программы:_____________________________________( Бобков Николай Николаевич )
Варианты экзаменационных заданий.
Вариант 1.
1. Данные, приведенные ниже, получены в литейной компании, занимающейся производством пласт-
массовых деталей для компьютерных клавиатур, стиральных машин, автомобилей и телевизоров. В
таблице указаны частоты дефектов компьютерных клавиатур, обнаруженных в течение трех месяцев:
Дефект
Черное пятно
Повреждение
Впрыскивание
Отпечаток опоры
Царапины
Брызги
Серебряная полоска
Отпечаток формы
След пульверизатора
Деформация
Всего
Количество
413
1039
258
834
442
275
413
371
292
1987
6324
Построив диаграмму Парето для категориальной переменной «дефект»:
1). Определите основные и второстепенные типы дефектов клавиатур и их процентный вклад в общее
их количество.
2). Выясните, какой процент брака соответствует трем наиболее распространенным типам дефектов.
2. Крупная консультационная компания по вопросам управления, находящаяся в Лондоне, должна
принять решение об установке новой компьютерной системы. Компания предварительно отобрала 3
системы (А, Б, В), которые ей подходят. Эти системы существенно различаются по возможностям и
цене: система А стоит 1,5 млн. ф.ст., система Б – 2 млн. ф.ст., система В – 4 млн. ф.ст. Известно также,
что отдача в течение 5 лет для системы А составляет 3 млн. ф.ст., для системы Б – 5 млн. ф.ст., а для
системы В – 6,5 млн. ф.ст. Некоторые компании уже установили у себя систему В, и она считается
полностью надежной. Вероятность полной надежности системы А – 60%, системы Б – 80%. Если компания установит систему А либо систему Б, и такая система сломается, то необходимо будет принять
решение относительно либо починки и модификации имеющейся системы, либо покупки новой системы более высокого уровня надежности. Именно, если ломается система А, то альтернативой ее модификации является покупка новой системы Б, а если ломается система Б, то альтернативой ее моди8
фикации является покупка системы В. Стоимость ремонта и модификации системы А составляет 1
млн. ф.ст., а системы Б – 2 млн. ф.ст. В результате такой модификации получается полностью надежная система прежнего класса. Если вновь купленная система ломается во второй раз, то необходимо
принять решение относительно либо ее модификации, либо установки полностью надежной, но дорогой системы В. С помощью дерева решений проиллюстрируйте ситуацию и дайте компании рекомендации, какие действия лучше всего предпринять.
3. В файле REFRIGERATOR.XLS содержатся приблизительные розничные цены (в долларах) и стои-
мость электроэнергии (в долларах), затрачиваемой морозильниками.
Источник: справочник "Refrigerators" Copyright 2002 by Consumer Union of U. S., Inc. Цитируется по журналу Consumer Reports, August 2002, 26, с разрешения организации Consumer Union of U. S., Inc., Yonkers, NY 10703-1057.
1). Постройте диаграмму рассеяния, у которой по оси X отложена стоимость энергии, а по оси Y – розничная цена.
2). Существует ли зависимость между величинами X и Y? Обоснуйте свой ответ.
3). Существует ли зависимость между розничной ценой морозильника и стоимостью электроэнергии?
Если существует, то какая: положительная или отрицательная?
4). Можно ли утверждать, что более дорогой морозильник эффективнее использует электроэнергию?
Следует ли это из приведенных данных?
5). В подтверждение рассуждений вычислите коэффициент корреляции Пирсона r .
4. Быстродействие компьютеров, объединенных в сеть, при возникновении перегрузок, как правило,
снижается. Время реакции равняется интервалу с момента нажатия вами клавиши <Enter> до момента
выдачи компьютером ответа на введенный вами запрос. Естественно, чем больше загрузка компьютера (в результате обращений со стороны других пользователей или выполнения какой-то другой работы), тем большим должно быть время реакции. Это время реакции (в секундах) измерялось в различные моменты времени наряду с количеством пользователей в системе и загрузкой компьютера (процент времени, в течение которого машина занята выполнением высокоприоритетных задач). Соответствующие данные представлены в таблице:
Количество
Загрузка
пользователей
компьютера, %
0,31
1
20,2
0,69
8
22,7
2,27
18
41,7
0,57
4
24,6
1,28
15
20,0
0,88
8
39,0
2,11
20
33,4
4,84
22
63,9
1,60
13
35,8
5,06
26
62,3
Время реакции
1).Проанализируйте эти данные, предложив собственный комментарий по поводу взаимосвязей в трех
диаграммах рассеяния, которые вы можете изобразить, рассматривая попарно указанные переменные.
В частности, выглядят ли, по вашему мнению, эти взаимосвязи разумными?
9
2). Вычислите корреляционную матрицу и сравните ее с взаимосвязями, которые вы наблюдаете на
диаграммах рассеяния.
3). Составьте уравнение регрессии для прогнозирования времени реакции, исходя из количества пользователей и загрузки компьютера. (Для выполнения этого и последующих пунктов этой задачи вам,
вероятно, придется воспользоваться компьютером.)
4). В каких приблизительно пределах (количество секунд) для этой совокупности данных можно прогнозировать время реакции исходя из количества пользователей и загрузки компьютера?
5). Является ли F-тест значимым? О чем это говорит вам?
6). Являются ли значимыми коэффициенты регрессии? Интерпретируйте (в письменном виде) для
каждой переменной ее поправочное влияние на время реакции.
7). Обратите внимание, что два коэффициента регрессии очень отличаются между собой. Вычислите
стандартизованные коэффициенты регрессии с целью их сравнения. Представьте в письменном виде
комментарий об относительной важности количества пользователей и загрузки компьютера с точки
зрения их влияния на время реакции.
Вариант 2.
1. Ниже приведены данные о зарплате преподавателей (профессоров, адъюнкт-профессоров, доцентов)
в 50 университетах США, начиная с 1990 года (тыс. долл.).
Университет
DUKE
VANDERBILT
WASHINGTON UNIV.
TULANE
CAL TECH
CARNEGIE MELLON
CORNELL
VIRGINIA
TEXAS
ROCHESTER
NEBRASKA
UNIV. OF IOWA
STANFORD
COLORADO
UNIV. OF PENN.
MICHIGAN
PRINCETON
IOWA STATE
PURDUE
UNIV. OF CHICAGO
YALE
Профессор
83,00
78,90
75,40
70,20
93,30
79,30
70,96
71,60
70,30
75,50
63,50
69,50
91,20
64,90
90,50
73,10
92,70
67,10
70,20
86,90
90,20
Адъюнкт-профессор
57,50
49,70
51,40
50,80
70,00
55,00
52,35
47,80
45,70
51,70
46,00
50,40
64,40
49,60
64,10
54,00
54,90
49,70
47,90
57,30
52,30
Доцент
46,10
42,50
43,80
41,50
56,40
49,40
44,86
39,50
40,80
43,90
40,30
42,80
50,00
42,40
56,20
44,80
43,00
40,00
40,70
50,90
43,20
10
WISCONSIN
PENN STATE
CAL BERKELEY
ILLINOIS
MINNESOTA
PITTSBURGH
HARVARD
NORTHWESTERN
MISSOURI
INDIANA
JOHN HOPKINS
CASE WESTERN
BROWN
M.I.T.
MARYLAND
OHIO STATE
NORTH CAROLINA
SYRACUSE
MICHIGAN STATE
U.S.C.
KANSAS
U.C.L.A.
UNIV. OF
WASHINGTON
OREGON
CAL SAN DIEGO
CLARK
CATHOLIC UNIV.
N.Y.U.
COLUMBIA
65,50
68,80
79,80
67,10
66,50
71,40
96,50
82,60
56,70
65,70
76,80
72,90
72,40
87,00
73,00
68,80
67,10
63,00
62,40
77,90
55,90
76,90
48,40
49,10
53,70
48,40
47,60
50,80
55,70
57,30
42,70
46,90
51,40
50,90
49,40
61,60
53,70
48,70
48,30
46,10
47,30
55,20
41,80
51,50
42,60
40,30
44,80
41,70
41,80
40,80
50,00
47,60
38,70
38,20
41,90
44,30
41,60
51,10
41,60
41,00
39,50
38,80
38,80
46,10
35,90
42,90
66,70
46,90
41,30
56,10
75,00
65,30
61,00
85,10
83,40
42,00
50,50
46,30
44,00
56,80
55,80
35,30
43,00
40,00
37,20
51,00
43,00
1). Создайте таблицу с одномерными статистическими данными для распределения зарплаты трех категорий преподавателей. В каком из трех распределений наблюдается наибольшая дисперсия?
2). Создайте диаграмму типа «ствол с листьями» для трех распределений зарплаты.
3). Создайте диаграмму типа «ящик с усами» для трех распределений зарплаты. По результатам этого и
предыдущего пунктов охарактеризуйте форму и скос распределения.
4). Определите для каждой группы преподавателей интерквартильный диапазон (IQR).
5). Допустим, необходимо принять на работу профессора, который требует оплаты не ниже, чем у 95%
коллег своего уровня. Какую зарплату следует ему предложить?
Создайте итоговый отчет с полученными диаграммами и таблицами. Сделайте выводы и сохраните
полученные результаты.
11
2. Рассматривается следующее усложнение предыдущей задачи: на первом этапе банк решает, прово-
дить ли аудиторскую проверку платежеспособности заемщика. Аудиторская фирма берет с банка за
такую проверку 80 ф.ст. На втором этапе, с учетом рекомендации аудиторской фирмы, банк принимает решение о выдаче ссуды. Решая первую проблему, банк проверяет соответствие рекомендаций
аудиторской фирмы реальной картине возврата или невозврата ссуд клиентами. Для этого выбирается
1000 человек, кредитные истории которых были проверены аудиторской фирмой и которым впоследствии выдавались ссуды. Данные сведены в таблицу:
Рекомендация
аудиторской фирмы
после проверки
платежеспособности
клиента
Фактический результат
Всего
Выдать ссуду
735
15
750
Не выдавать ссуду
225
25
250
Всего
960
40
1000
Какое решение должен принять банк, если он исходит из прежнего критерия максимизации ожидаемой прибыли от сделки?
3. Менеджер по маркетингу в компании, владеющей крупной сетью супермаркетов, желает оценить
влияние расстояния между полками (в футах) на объем продаж (в сотнях долларов США) корма для
домашних животных. Для анализа создана случайная выборка, состоящая из 12 одинаковых магазинов
(содержится в файле PETFOOD.XLS).
1). Постройте диаграмму разброса.
2). Вычислите коэффициенты простой линейной регрессии по методу наименьших квадратов.
3). Дайте интерпретацию наклона регрессионной прямой.
4). Предскажите средний еженедельный объем продаж (в сотнях долларов) в магазине, в котором расстояние между полками составляет 8 футов.
5). Предположим, что в магазине №12 объем продаж равен 0,26 тыс. долл. Повторите пункты 1 – 4 с новыми данными и сравните результаты с предыдущими.
6). На каком расстоянии вы рекомендуете устанавливать полки? Обоснуйте свой ответ.
4. Рассмотрите ставки процента по ценным бумагам с различными сроками погашения (соответству-
ющие данные представлены в следующей таблице:
Год
Федеральные фонды
(однодневная процентная ставка)
Казначейские векселя (трехмесячная
процентная ставка)
Долгосрочные казначейские обязательства (десятилетняя процентная
ставка)
12
1980
13,35
11,39
11,43
1981
16,39
14,04
13,92
1982
12,24
10,60
13,01
1983
9,09
8,62
11,1
1984
10,23
9,54
12,46
1985
8,10
7,47
10,62
1086
6,80
5,97
7,67
1987
6,66
5,78
8,39
1988
7,57
6,67
8,85
1989
9,21
8,11
8,49
1990
8,10
7,50
8,55
1991
5,69
5,38
7,86
1992
3,52
3,43
7,01
1993
3,02
3,00
5,87
1994
4,21
4,25
7,69
1995
5,83
5,49
6,57
1996
5,30
5,01
6,44
Данные взяты из таблиц 806 и 807 Бюро переписи населения США, Statistical Abstract of the
United States: /507(1 17th edition.) Washington, DC, 1997.
1). Найдите уравнение регрессии для прогнозирования долгосрочной ставки процента (долгосрочные
казначейские обязательства) на основании двух других ставок процента (с меньшими сроками погашения).
2). Создайте новую переменную («взаимодействие»), перемножив два вида ставок процента с меньшими сроками погашения. Найдите уравнение регрессии для прогнозирования долгосрочной ставки
процента (долгосрочные казначейские обязательства) на основании двух других ставок процента (с
меньшими сроками погашения) и переменной «взаимодействие».
3). Проверьте, есть ли какое-либо взаимодействие двух видов ставок процента с меньшими сроками
погашения, которое являлось бы частью взаимосвязи между краткосрочными и долгосрочными ставками процента.
13
Скачать