Вопросы к зачету по дисциплине «Анализ данных» для студентов 2 курса направления «Бизнес-информатикиа»

реклама
1
Вопросы к зачету по дисциплине
«Анализ данных»
для студентов 2 курса
направления «Бизнес-информатикиа»
1. Цели и задачи анализа данных, характеризующих социальноэкономические явления и процессы.
2. Общая характеристика и классификация методов обработки и анализа
экономической информации.
3. Основные технологические этапы анализа данных, их назначение и
краткая характеристика.
4. Представление исходных данных в виде матрицы «объекты- свойства».
5. Основные задачи, решаемые в процессе качественного анализа данных:
информативное описание данных, группировка (классификация)
данных, анализ взаимосвязи свойств данных, распознавание образов.
Содержательная и формальная постановка этих задач.
6. Вариационные ряды данных, числовые характеристики рядов.
7. Методы визуализации вариационных рядов: полигоны, гистограммы,
кумуляты, огивы. Анализ свойств данных на основе гистограмм.
8. Цели и задачи дескриптивного анализа данных в экономических
исследованиях.
9. Типы экономических задач, решаемых с применением методов
дескриптивного анализа.
10.Основные описательные статистики: средние величины и показатели
вариации, способы их расчета. Правило сложения дисперсий, его
применение.
11.Теоретические и эмпирические кривые распределения. Показатели
формы распределения. Критерии согласия.
12.Автоматизация дескриптивного анализа на основе статистических
пакетов прикладных программ (ППП).
13.Теоретические основы выборочного метода. Генеральная и выборочная
совокупности.
14.Способы формирования выборочных совокупностей.
15.Понятие об ошибках выборки. Методика расчета средней и предельной
ошибок выборки.
16.Определение необходимой численности выборки.
17.Понятие «статистическая гипотеза». Основные виды статистических
гипотез в экономических исследованиях. Статистические критерии
проверки гипотез
18.Понятие «уровень значимости». Этапы проверки статистических
гипотез.
2
19.Практическое применение методов статистического вывода в
экономических исследованиях и прикладных задачах. Автоматизация
статистического вывода на основе ППП.
20.Понятие «корреляционная взаимосвязь данных». Цели и задачи
корреляционного и регрессионного анализа в экономических
исследованиях и задачах. Типы экономических задач, решаемых с
применением методов корреляционно-регрессионного анализа.
21.Корреляционный
анализ
количественных
показателей.
Параметрические методы определения тесноты и направления связи
показателей.
22.Коэффициент детерминации, линейный коэффициент корреляции.
Оценка их значимости на основе критериев Фишера и Стьюдента.
Частные коэффициенты корреляции.
23.Корреляционный анализ качественных показателей. Ранговые
коэффициенты корреляции Спирмена и Кендалла.
24.Классическая модель регрессионного анализа, условия ее корректного
применения. Проверка состоятельности коэффициентов регрессии:
критерий Стьюдента, бета-коэффициенты.
25.Проверка состоятельности регрессионной модели в целом: критерий
Фишера, коэффициент детерминации.
26.Проверка наличия автокорреляции: критерий Дарбина–Уотсона.
27.Метод пошагового регрессионного анализа. Отбор наиболее
существенных факторов для включения в модель.
28.Использование фиктивных переменных.
29.Практическое применение методов регрессионного моделирования в
задачах изучения взаимосвязей показателей.
30.Автоматизация корреляционно-регрессионного анализа на основе
статистических ППП.
31.Понятие «ряды динамики», их виды.
32.Аналитические показатели изменения уровней ряда: абсолютный
прирост, темп роста, темп прироста, абсолютное значение одного
процента прироста.
33.Расчет средних показателей в рядах динамики.
34.Методы выявления основной тенденции (тренда) в рядах динамики.
35.Измерение колеблемости в рядах динамики. Выявление и измерение
сезонных колебаний. Индексы сезонности.
36.Интерполяция и экстраполяция в рядах динамики.
37.Прогнозирование уровней динамических рядов на основе среднего
абсолютного прироста, среднего темпа роста и метода аналитического
выравнивания. Прогнозирование при наличии сезонной компоненты.
38.Типы экономических задач, решаемых с применением методов
многомерного статистического анализа.
39.Цели и задачи кластерного анализа. Выбор переменных для
кластерного анализа. Нормирование значений переменных. Расстояние
3
между объектами и меры близости. Расстояние между классами
объектов.
40.Основные типы кластер-процедур: иерархические процедуры,
параллельные процедуры, последовательные кластер-процедуры.
Интерпретация кластеров. Оценка надежности и достоверности
результатов анализа.
41.Цели и задачи факторного анализа. Необходимость факторизации
(сокращения количества) переменных.
42.Метод главных компонент. Определение числа факторов.
Интерпретация факторов. Повышение интерпретируемости факторов с
помощью метода «варимакс». Вычисление значения фактора.
43.Автоматизация многомерного анализа экономической информации на
основе статистических ППП.
44.Назначение методов Data mining. Свойства знаний, обнаруживаемых в
данных. Виды моделей представленных знаний в Data mining.
45.Задачи Data mining, их классификация. Общая характеристика задач
классификации
объектов,
поиска
ассоциативных
правил,
кластеризации. Их практическое применение.
46.Предсказательные и описательные модели Data mining.
47.Методы Data mining: базовые методы, нечеткая логика, генетические
алгоритмы, нейронные сети.
48.Технология Data mining. Этапы интеллектуального анализа данных.
Подготовка исходных данных. Программные средства Data mining.
Скачать