1 Вопросы к зачету по дисциплине «Анализ данных» для студентов 2 курса направления «Бизнес-информатикиа» 1. Цели и задачи анализа данных, характеризующих социальноэкономические явления и процессы. 2. Общая характеристика и классификация методов обработки и анализа экономической информации. 3. Основные технологические этапы анализа данных, их назначение и краткая характеристика. 4. Представление исходных данных в виде матрицы «объекты- свойства». 5. Основные задачи, решаемые в процессе качественного анализа данных: информативное описание данных, группировка (классификация) данных, анализ взаимосвязи свойств данных, распознавание образов. Содержательная и формальная постановка этих задач. 6. Вариационные ряды данных, числовые характеристики рядов. 7. Методы визуализации вариационных рядов: полигоны, гистограммы, кумуляты, огивы. Анализ свойств данных на основе гистограмм. 8. Цели и задачи дескриптивного анализа данных в экономических исследованиях. 9. Типы экономических задач, решаемых с применением методов дескриптивного анализа. 10.Основные описательные статистики: средние величины и показатели вариации, способы их расчета. Правило сложения дисперсий, его применение. 11.Теоретические и эмпирические кривые распределения. Показатели формы распределения. Критерии согласия. 12.Автоматизация дескриптивного анализа на основе статистических пакетов прикладных программ (ППП). 13.Теоретические основы выборочного метода. Генеральная и выборочная совокупности. 14.Способы формирования выборочных совокупностей. 15.Понятие об ошибках выборки. Методика расчета средней и предельной ошибок выборки. 16.Определение необходимой численности выборки. 17.Понятие «статистическая гипотеза». Основные виды статистических гипотез в экономических исследованиях. Статистические критерии проверки гипотез 18.Понятие «уровень значимости». Этапы проверки статистических гипотез. 2 19.Практическое применение методов статистического вывода в экономических исследованиях и прикладных задачах. Автоматизация статистического вывода на основе ППП. 20.Понятие «корреляционная взаимосвязь данных». Цели и задачи корреляционного и регрессионного анализа в экономических исследованиях и задачах. Типы экономических задач, решаемых с применением методов корреляционно-регрессионного анализа. 21.Корреляционный анализ количественных показателей. Параметрические методы определения тесноты и направления связи показателей. 22.Коэффициент детерминации, линейный коэффициент корреляции. Оценка их значимости на основе критериев Фишера и Стьюдента. Частные коэффициенты корреляции. 23.Корреляционный анализ качественных показателей. Ранговые коэффициенты корреляции Спирмена и Кендалла. 24.Классическая модель регрессионного анализа, условия ее корректного применения. Проверка состоятельности коэффициентов регрессии: критерий Стьюдента, бета-коэффициенты. 25.Проверка состоятельности регрессионной модели в целом: критерий Фишера, коэффициент детерминации. 26.Проверка наличия автокорреляции: критерий Дарбина–Уотсона. 27.Метод пошагового регрессионного анализа. Отбор наиболее существенных факторов для включения в модель. 28.Использование фиктивных переменных. 29.Практическое применение методов регрессионного моделирования в задачах изучения взаимосвязей показателей. 30.Автоматизация корреляционно-регрессионного анализа на основе статистических ППП. 31.Понятие «ряды динамики», их виды. 32.Аналитические показатели изменения уровней ряда: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного процента прироста. 33.Расчет средних показателей в рядах динамики. 34.Методы выявления основной тенденции (тренда) в рядах динамики. 35.Измерение колеблемости в рядах динамики. Выявление и измерение сезонных колебаний. Индексы сезонности. 36.Интерполяция и экстраполяция в рядах динамики. 37.Прогнозирование уровней динамических рядов на основе среднего абсолютного прироста, среднего темпа роста и метода аналитического выравнивания. Прогнозирование при наличии сезонной компоненты. 38.Типы экономических задач, решаемых с применением методов многомерного статистического анализа. 39.Цели и задачи кластерного анализа. Выбор переменных для кластерного анализа. Нормирование значений переменных. Расстояние 3 между объектами и меры близости. Расстояние между классами объектов. 40.Основные типы кластер-процедур: иерархические процедуры, параллельные процедуры, последовательные кластер-процедуры. Интерпретация кластеров. Оценка надежности и достоверности результатов анализа. 41.Цели и задачи факторного анализа. Необходимость факторизации (сокращения количества) переменных. 42.Метод главных компонент. Определение числа факторов. Интерпретация факторов. Повышение интерпретируемости факторов с помощью метода «варимакс». Вычисление значения фактора. 43.Автоматизация многомерного анализа экономической информации на основе статистических ППП. 44.Назначение методов Data mining. Свойства знаний, обнаруживаемых в данных. Виды моделей представленных знаний в Data mining. 45.Задачи Data mining, их классификация. Общая характеристика задач классификации объектов, поиска ассоциативных правил, кластеризации. Их практическое применение. 46.Предсказательные и описательные модели Data mining. 47.Методы Data mining: базовые методы, нечеткая логика, генетические алгоритмы, нейронные сети. 48.Технология Data mining. Этапы интеллектуального анализа данных. Подготовка исходных данных. Программные средства Data mining.