Программа Вероятностные моделиx

реклама
П р а в ит е л ь с т во Р о с с и йс ко й Фе д е р а ци и
Федеральное государственное автономное образовательное учреждение
высшего профессионального образования
Национальный исследовательский университет
"Высшая школа экономики"
Ф а ку л ь т е т Б и з н е с - и н фо р м а т ик и
отд. Прикладной математики и информатики
Программа дисциплины
Вероятностные модели
для направления 010400.62 «Прикладная математика и информатика»
подготовки бакалавра
Автор программы: к.ф.-м. н., доцент Горяинова Елена Рудольфовна
Одобрена на заседании кафедры высшей математики на факультете экономики 28.08.2012
г.
Зав. кафедрой
Алескеров Ф.Т.
Рекомендована секцией УМС [Введите название секции УМС] «___»____________ 20 г
Председатель
[Введите И.О.
Ф.]
Утверждена Ученым Советом факультета экономики «___»_____________20 г.
Ученый секретарь
[Введите И.О.
Ф.]
Москва, 2012
Настоящая программа не может быть использована другими подразделениями
университета и другими вузами без разрешения кафедры-разработчика программы.
1. Область применения и нормативные ссылки
Настоящая программа учебной дисциплины устанавливает минимальные
требования к знаниям и умениям студента и определяет содержание и виды учебных
занятий и отчетности.
Программа предназначена для преподавателей, ведущих данную дисциплину,
учебных ассистентов и студентов направления подготовки 010400.62 «Прикладная
математика и информатика», обучающихся по программе бакалавриата.
Программа разработана в соответствии с:
 Образовательным стандартом государственного образовательного бюджетного
учреждения высшего профессионального образования «Государственный
университет – Высшая школа экономики», в отношении которого установлена
категория «Национальный исследовательский университет»;
 Рабочим учебным планом университета подготовки бакалавра по направлению
010400.62 «Прикладная математика и информатика», утвержденном в 2012 г.
2. Цели освоения дисциплины
Целями освоения дисциплины «Вероятностные модели» являются
- сформировать теоретические знания в области теории вероятностей и математической
статистики;
-обучить студентов применять основные модели и методы математической статистики для
обработки реальных социально-экономических данных.
3. Компетенции обучающегося, формируемые в результате освоения
дисциплины
В результате освоения дисциплины студент должен:
знать:
-основные методы первичной обработки статистических данных;
- основные методы проверки однородности экспериментальных данных;
- базовые понятия теории надежности;
- принципы сравнения статистических критериев;
уметь:
– строить математические модели, адекватно описывающие социально-экономические
явления;
- использовать статистические критерии для проверки гипотез относительно
наблюдаемых случайных данных;
владеть:
-навыками решения типовых задач теории надёжности и математической статистики;
- основными определениями, методами и алгоритмами анализа данных, содержащих
случайную составляющую;
- стандартными инструментариями обработки статистической информации.
В результате освоения дисциплины студент осваивает следующие компетенции:
Компетенция
Общенаучная
Код по
ФГОС /
НИУ
Дескрипторы – основные признаки
освоения (показатели достижения
результата)
ОНК-1
Способность к анализу и синтезу
Формы и методы обучения,
способствующие
формированию и развитию
компетенции
Стандартные
Компетенция
Код по
ФГОС /
НИУ
Дескрипторы – основные признаки
освоения (показатели достижения
результата)
Формы и методы обучения,
способствующие
формированию и развитию
компетенции
на основе системного подхода
(лекционносеминарские)
ОНК-2
Способность перейти от
проблемной ситуации к
проблемам, задачам и лежащим в
их основе противоречиям
Стандартные
(лекционносеминарские)
ОНК-3
Способность использовать
методы критического анализа,
развития научных теорий,
опровержения и фальсификации,
оценить качество исследований в
некоторой предметной области
Стандартные
(лекционносеминарские)
ОНК-4
Готовность использовать
основные законы
естественнонаучных дисциплин в
профессиональной деятельности,
применять методы
математического анализа и
моделирования, теоретического и
экспериментального
исследования при работе в какойлибо предметной области
Стандартные
(лекционносеминарские)
ОНК-5
Готовность выявить
естественнонаучную сущность
проблем, возникающих в ходе
профессиональной деятельности,
привлечь их для решения
соответствующий аппарат
дисциплины
Стандартные
(лекционносеминарские)
Общенаучная
ОНК-6
Способность приобретать новые
знания с использованием научной
методологии и современных
образовательных и
информационных технологий
Стандартные
(лекционносеминарские)
Общенаучная
ОНК-7
Способность порождать новые
идеи (креативность)
Стандартные
(лекционносеминарские)
ИК-2
Умение работать на компьютере,
навыки использования основных
классов прикладного
программного обеспечения,
работы в компьютерных сетях,
составления баз данных
Стандартные
(лекционносеминарские)
ПК-1
Способность демонстрации
общенаучных базовых знаний
естественных наук, математики и
информатики, понимание
основных фактов, концепций,
принципов теорий, связанных с
Стандартные
(лекционносеминарские)
Общенаучная
Общенаучная
Общенаучная
Общенаучная
Инструментальные
Профессиональные
Компетенция
Код по
ФГОС /
НИУ
Дескрипторы – основные признаки
освоения (показатели достижения
результата)
Формы и методы обучения,
способствующие
формированию и развитию
компетенции
прикладной математикой и
информатикой
Профессиональные
Профессиональные
Профессиональные
ПК-2
Способность понимать и
применять в исследовательской и
прикладной деятельности
современный математический
аппарат
Стандартные
(лекционносеминарские)
ПК-4
способность критически
оценивать собственную
квалификацию и её
востребованность,
переосмысливать накопленный
практический опыт, изменять при
необходимости вид и характер
своей профессиональной
деятельности
Стандартные
(лекционносеминарские)
ПК-8
Способность решать задачи
производственной и
технологической деятельности на
профессиональном уровне,
включая разработку
математических моделей,
алгоритмических и программных
решений
Стандартные
(лекционносеминарские)
4. Место дисциплины в структуре образовательной программы
Программа учебной дисциплины «Вероятностные модели» предназначена для
подготовки студентов, обучающихся по направлению «Прикладная математика и
информатика». Программа составлена в соответствии с Федеральным государственным
образовательным стандартом высшего профессионального образования.
«Вероятностные модели» является самостоятельной учебной дисциплиной,
относится к математическому и естественнонаучному циклу дисциплин.
Для специализаций 010400.62 «Прикладная математика
настоящая дисциплина является дисциплиной по выбору.
и
информатика»
Изучение данной дисциплины базируется на следующих дисциплинах:
 Математический анализ;
 Теория вероятностей;
 Математическая статистика;
 Геометрия и алгебра.
Для освоения учебной дисциплины, студенты должны владеть следующими
знаниями и компетенциями:
 Знаниями основных определений и теорем перечисленных выше дисциплин;
 Навыками решения типовых задач этих дисциплин.
Основные положения дисциплины должны быть использованы в дальнейшем при
изучении следующих дисциплин:
 Стохастическое моделирование;
 Эконометрика;
 Анализ данных.
5. Тематический план учебной дисциплины
Аудиторные часы
№
Название раздела
Цепи Маркова
1.
2.
3.
4.
Марковские случайные функции с
дискретным множеством состояний
Исследование однородности двух
выборок.
Анализ статистической взаимосвязи
социально-экономических явлений
Итого
Самосто
Всего
часов
Лекции
26
4
4
18
40
8
8
24
44
8
8
28
52
10
8
34
162
30
28
104
Практиче ятельная
Семина
ские
работа
ры
занятия
6. Формы контроля знаний студентов
Тип
контроля
Текущий
(неделя)
Форма
контроля
Контрольная
работа
Домашнее
задание
Итоговы Экзамен
й
1
1 год
2 3
Параметры **
4
2
письменная работа 80
минут
9
э
письменная работа 80
минут
Критерии оценки знаний, навыков
Для прохождения контроля студент должен, как минимум, продемонстрировать
знания основных определений и формулировок теорем; умение решать типовые задачи,
разобранные на семинарских занятиях и умение выбирать оптимальный метод обработки
статистических данных.
Оценки по всем формам текущего контроля выставляются по 10-ти балльной
шкале.
6.1
6.2 Порядок формирования оценок по дисциплине
Накопленная оценка за текущий контроль учитывает результаты студента по
текущему контролю следующим образом:
Онакопленная= 0.8* Отекущий + 0.2* Оауд
где Отекущий
рассчитывается как взвешенная сумма всех форм
текущего контроля, предусмотренных в РУП
Отекущий = 0.6·Ок/р + 0.4·Одз .
Результирующая оценка за дисциплину рассчитывается следующим образом:
Орезульт = 0.5* Онакопл + 0.5*·Оэкз/зач
Способ округления результирующей оценки: если дробная часть результирующей оценки
составляет меньше 0.7, то результирующая оценка равна целой части полученного
значения; если дробная часть результирующей оценки не менее 0.7, то результирующая
оценка равна целой части полученного значения плюс 1.
Оценка за итоговый контроль блокирующая, при неудовлетворительной итоговой оценке
она равна результирующей.
7. Содержание дисциплины
Раздел I.
Цепи Маркова (Л.-4ч., С.-4ч.)
Вероятностные характеристики цепей Маркова. Классификация состояний цепи Маркова.
Эргодические цепи Маркова. Эргодическая теорема. Предельные вероятности состояний
цепи Маркова. Задача о разорении игрока.
Литература по разделу.
Основная:[ 2] с.83-98, [9] глава 8
Раздел 2.
Марковские случайные функции с дискретным множеством состояний (Л.-8ч., С.8ч.)
Случайные процессы (СП). Задание СП, основные вероятностные характеристики СП.
Стационарные СП. Потоки событий. Вероятностное описание марковских случайных
функций с дискретным множеством значений. Уравнение Колмогорова- Чепмена.
Эргодические свойства однородных марковских СП. Система алгебраических уравнений
Колмогорова. Процессы рождения и гибели.
Литература по разделу.
Основная:[ 2] с. 247-268
Раздел 3.
Исследование однородности двух выборок (Л.-8ч., С.-8ч.)
Понятие о робастных оценках в терминах кривой чувствительности SC(sensitivity curve),
B-робастные оценки. Пороговая точка (breakdown point). Исследование свойства Bробастности выборочного среднего и выборочной медианы.
Однородные выборки. Непараметрические критерии. Ранги, связки, средние ранги.
Ранговые критерии.
Выявление неоднородности, связанной со сдвигом (классический критерий Стьюдента,
критерий Вилкоксона, Фишера – Йейтса) или масштабом (классический F- критерий,
критерий Ансари-Брэдли). Проверка однородности против альтернатив общего вида
(критерий Колмогорова – Смирнова, критерий омега-квадрат).
Функция мощности критерия. Относительная асимптотическая эффективность
(ОАЭ) статистических критериев по Питмену. Сравнительный анализ ОАЭ изученных
критериев для различных распределений выборок.
Литература по разделу.
Основная:[ 1] с. 59-89
Дополнительная: [3], [8], [10], [11], [12], [13]
Раздел 4.
Анализ статистической взаимосвязи социально-экономических явлений (Л.-10ч., С.8ч.)
Шкалы измерений (количественная, порядковая, номинальная).
Исследование связи между номинальными переменными (таблица сопряженности
признаков, критерий хи-квадрат, меры связи признаков: коэффициенты контингенции,
ассоциации, среднеквадратической сопряженности, Пирсона, Крамера). Меры прогноза, λ
-меры Гутмана.
Исследование связи между порядковыми переменными (ранговый коэффициент
корреляции Спирмена, коэффициент согласованности Кендалла, коэффициент
конкордации).
Случайные векторы. Ковариационная матрица. Независимость и
некоррелированность компонент случайного вектора. Анализ структуры и тесноты связи
между количественными переменными. Выборочный коэффициент корреляции.
Исследование независимости компонент гауссовского случайного вектора. Критерий хиквадрат.
Измерение тесноты связи при нелинейной зависимости (индекс корреляции и его
оценивание по сгруппированным и несгруппированным данным).
Частные коэффициенты корреляции. Множественный коэффициент корреляции,
его вычисление и свойства для общих и нормальных моделей. Анализ множественных
связей.
Литература по разделу.
Основная: [1] с. 113-152
Дополнительная: [3], [4], [5], [7], [8], [12]
9. Оценочные средства для текущего контроля и аттестации студента
9.1 Тематика заданий текущего контроля
ВАРИАНТ БИЛЕТА КОНТРОЛЬНОЙ РАБОТЫ
1. Задана матрица переходных вероятностей однородной марковской цепи
0.5 0.5 0
0.5 0 0.5
0
1
0
Является ли цепь эргодической? Найти все стационарные распределения цепи.
2. Дан случайный процесс
𝜉(𝑡) = 𝑉𝑒 −𝑢𝑡 , t>0,
где 𝑚𝑉 = 𝑚, 𝐷𝑉 = 𝑑, 𝑢~𝐸(𝛾), 𝑉 и 𝑢 − независимые случайные величины.
Найти математическое ожидание, дисперсию и ковариационную функцию случайного
процесса 𝜉(𝑡).
3. Дан случайный процесс
1,
𝑡<𝜏
𝜉(𝑡) = {
−1,
𝑡≥𝜏
𝑡 ≥ 0, 𝜏~𝐸(𝛼).
Найти одно- и двумерные распределения процесса 𝜉(𝑡).
4. Система массового обслуживания состоит из двух одинаковых каналов обслуживания с
интенсивностями обслуживания 𝜇. Поток заявок – простейший пуассоновский поток с
интенсивностью 𝜆. Требуется: 1)построить стохастический граф процесса обслуживания;
2)выписать уравнения Колмогорова для вычисления вероятностей состояния процесса;
3)найти стационарное распределение процесса; 4)вычислить вероятность простоя и
вероятность полной занятости каналов в случае, когда 𝜆 = 2𝜇.
Вариант домашней работы
1.Средняя стоимость лечения одного пациента-льготника с диагнозом
«дуоденит» составляет (в рублях на ноябрь 2007 года):
Дальневосточный фед. округ
Амурская обл. 245,61
Еврейская АО 101,45
Камчатская обл. 202,84
Корякский АО 327,63
Магаданская обл. 144,5
Приморский край 458,81
Приволжский фед. округ
Кировская обл. 196,27
Оренбургская обл. 309,79
Пензенская обл. 271,76
Пермская обл. 329,58
Башкортостан 233,49
Марий-Эл 298,24
Мордовия 311,6
Татарстан 284,03
Чувашия 405,5
Одинакова ли средняя стоимость лечения льготников в Дальневосточном и
Приволжском федеральных округах?
2. Проведен социологический опрос 655 человек. Каждый из опрошенных отвечал
на два вопроса. Вопрос А: «Удовлетворены ли Вы своим образом жизни?» (варианты
ответов: да, нет). Вопрос В: «Каково Ваше материальное положение?» (варианты ответов:
плохое, ниже среднего, среднее, выше среднего, хорошее. Результаты опроса сведены в
следующую таблицу:
B
A
Нет
Да
ниже
среднего
плохое
92
22
выше
среднего
среднее
64
46
48
136
23
148
Имеется ли зависимость между материальным положением (признак В) и
удовлетворенностью образом жизни (признак А) ?
хорошее
3
72
Прокомментируйте характер связи между А и В с помощью коэффициентов Пирсона,
Крамера, среднеквадратической сопряженности, мер прогноза Гутмана, мер прогноза
Краскела-Гудмана.
3. В таблице представлены данные за 1997 год показателей X (индекс
человеческого развития) и Y (суточная калорийность питания населения, ккал на душу)
для следующих стран: Австрия, Аргентина, Великобритания, Германия, Египет, Норвегия,
Украина, Республика Корея, ЮАР, США.
X
0.904 0.827 0.918 0.906 0.616 0.927 0.721 0.852 0.695 0.927
Y
3343
3136
3237
3330
3289
3350
2753
3336
2933
3642
Являются ли показатели X и Y зависимыми?
4.В городе N каждый житель имеет одну из трёх профессий-A,B,C. Дети отцов,
имеющих профессии A,B,C сохраняют профессии отцов с вероятностями 3/5, 2/3, 1/4
соответственно. А если не сохраняют, то с равными вероятностями выбирают любую из
двух других профессий. Найти: 1)распределение по профессиям в следующем поколении,
если в данном поколении профессию А имело 20% жителей, профессию В -30%,
профессию С-50%; 2)предельное распределение по профессиям, когда число поколений
растёт; 3)распределение по профессиям, не меняющееся при смене поколений.
9.2 Вопросы для оценки качества освоения дисциплины
Тема 1.
1.
Что такое цепь Маркова?
2.
Какая цепь называется однородной?
3.
Какие состояния называются существенными, сообщающимися, апериодическими?
4.
Сформулируйте эргодическую теорему.
5.
Как найти стационарное распределение однородной цепи Маркова, если оно
существует?
Тема 2.
1.
Дайте определение случайного процесса(СП).
2.
Что такое конечномерное распределение СП?
3.
Каковы основные характеристики СП?
4.
Каковы основные свойства ковариационной функции СП?
5.
Дайте определение стационарного(в широком и узком смысле) процесса.
6.
Какой поток событий называется простейшим пуассоновским потоком?
7.
Дайте определение марковского свойства для СП с непрерывным временем и
конечным множеством состояний.
8.
Запишите систему алгебраических уравнений Колмогорова для однородного
марковского процесса.
Тема 3.
1. Какие выборки называют однородными?
2. Назовите основные типы неоднородности выборок.
3. Опишите условия применимости классических и ранговых критериев для проверки
гипотезы об однородности.
4. Какие преимущества и какие недостатки имеют ранговые критерии по сравнению с
классическими?
5. Какие критерии применяют для проверки гипотезы об однородности двух выборок?
6. Что такое относительная эффективность по Питмену?
7. Чему равна АОЭ по Питмену критерия Стьюдента по отношению к критерию
Вилкоксона, если наблюдения имеют гауссовское распределение?
8. Что такое В-робастная оценка?
9. Приведите пример оценки, которая является В-робастной.
10. Приведите пример оценки, которая не является В-робастной.
Тема 4.
1. Опишите основные типы шкал измерений и допустимые преобразования в этих шкалах.
2. Что такое таблица сопряженности признаков?
3. Дайте определение независимости признаков, измеряемых в номинальной шкале.
4. Как проверить гипотезу о независимости признаков в номинальной шкале?
5. Как проверить гипотезу о независимости признаков в порядковой шкале?
6. Назовите основные коэффициенты, измеряющие связь признаков в номинальной шкале.
7. Что такое коэффициент корреляции? Каковы его основные свойства?
8. Как проверить гипотезу о некоррелированности признаков?
9. В каком случае проверка некоррелированности наблюдений эквивалентна проверке
независимости?
10. Как измерить тесноту связи двух нелинейно зависимых переменных?
11. Что такое множественный коэффициент корреляции? Каковы его свойства?
9.3 Примеры заданий итогового контроля
Вариант экзаменационного билета
1.В результате проведенного исследования было установлено, что у 309
светлоглазых мужчин жены также имеют светлые газа, а у 214 светлоглазых мужчин
жены темноглазые. У 119 темноглазых мужчин жены также темноглазые, а у 132
темноглазых мужчин жены светлоглазые. Имеется ли зависимость между цветом глаз
мужей и их жен? Исследуйте силу связи между этими показателями с помощью
коэффициентов контингенции и ассоциации.
2. По 20 территориям России были изучены следующие данные: X –
среднедушевой доход (в тыс. руб.), Y – доля занятых тяжелым физическим трудом в
общей численности занятых (%), Z – доля экономически активного населения в
численности всего населения (%). По результатам наблюдений были вычислены
выборочные коэффициенты корреляции. Для показателей X и Y выборочный
коэффициент корреляции равен 0.746, для X и Z равен 0.507, для Y и Z равен 0.432.
Вычислите частный коэффициент корреляции показателей X и Y при условии, что
показатель Z зафиксирован.
3.Три квалифицированных эксперта (A,B и C) оценивают в порядке предпочтения
10 бизнес-проектов. Результаты представлены в таблице:
A
1
4
2
5
3
7
6
9
8
10
B
2
1
3
4
5
8
9
10
6
7
C
2
1
4
5
3
7
9
8
6
10
Является ли эта экспертная группа согласованной?
4. В таблице представлены данные за 1995 год показателей X (ВВП в паритетах
покупательной способности) и Y (коэффициент детской смертности в %) для следующих
стран: Бурунди, Чад, Индия, Египет, Мексика, Бразилия, Республика Корея, Канада,
США, Швейцария.
X
2.3
2.6
5.2
12.2
23.7
20
42.4
78.3
100
95.9
Y
98
117
68
16
33
44
10
6
8
6
Считая , что наблюдения имеют гауссовское распределение, выясните являются ли
признаки X и Y зависимыми и постройте приближенный доверительный интервал уровня
надежности 0.95 для коэффициента корреляции X и Y.
5.Уровень гистамина в мокроте у 7 курильщиков, склонных к аллергии, составил
(в микрограммах): 102,4; 100,0; 67,6; 65,9; 64,7; 39,6; 31,2, а у курильщиков, несклонных к
аллергии: 48,1; 45,5; 41,7; 35,4; 29,1; 18,9; 58,3; 66,8; 71,3; 94,3. Верно ли предположение о
том, что уровень гистамина у курильщиков, подверженных аллергии, выше, чем у
неаллергенов? Принять уровень значимости равным 0,05.
6. Какие преимущества и какие недостатки имеют ранговые критерии по
сравнению с классическими ?
10. Учебно-методическое и информационное обеспечение дисциплины
10.1 Базовый учебник
1. Горяинова Е.Р., Панков А.Р., Платонов Е.Н. Прикладные методы анализа
статистических данных. М.: Изд. Дом ВШЭ,2012.- 312 с.
2. Миллер Б.М., Панков А.Р. Теория случайных процессов в примерах и задачах.- М.:
Физматлит, 2002.-320с.
10.2 Основная литература
3. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. – М.: Инфра. – М, 2003.
4.Интерпретация и анализ данных в социологических исследованиях (под редакцией В.Г.
Андреенкова и Ю.Н.Толстовой). – М.: Наука, 1987.
5. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование
зависимостей. Справочное издание под ред. Айвазяна С.А. – М.: Финансы и статистика,
1985.
6. Ивченко Г.И., Медведев Ю.И. Математическая статистика. – М.: Высшая школа, 1992.
7. Кендалл М., Стьюарт А. Статистические выводы и связи.- М.:Наука,1973
8. Холлендер М., Вулф Д. Непараметрические методы статистики. – М.: Финансы и
статистика, 1983.
9. Чистяков В.П. Курс теории вероятностей.-4-е издание- М.: Агар,1996.-256с.
10.3 Дополнительная литература
10. Хьюбер П. Робастность в статистике. – М.: Мир, 1984.
11. Хампель Ф., Рончетти Э., Рауссей П., Штаэль В. Робастность в статистике. Подход на
основе функции влияния. – М.: Мир, 1989.
12. Хеттманспергер Т. Статистические выводы, основанные на рангах. – М.:Финансы и
статистика,1987
13. Дэниел К. Применение статистики в промышленном эксперименте. – М.: Мир, 1979.
11. Материально-техническое обеспечение дисциплины
Для проведения семинарских занятий требуется компьютерный класс с установленным
ППП SPSS.
Скачать