Кластерный анализ

advertisement
Кластерный анализ
Демьянюк Антон
Ромашина Мария
Лисяк Марина
НИУ ВШЭ, Москва, 2012
Кластерного анализа
• Термин «кластерный анализ» был введен
математиком Р. Трионом в 1939 году;
• Кластерный анализ -один из методов
разбиения выборки на группы по каким-либо
критериям.
• Кластер = тип
Высшая школа экономики, Москва, 2012
2
Цели
• Понимание данных;
• Сжатие данных;
• Обнаружение новизны.
Высшая школа экономики, Москва, 2012
3
Преимущества
• Можно применять в различных ситуациях;
• Не требует априорных предположений о
наборе данных;
• Не накладывает ограничения на
представление исследуемых объектов;
• Позволяет анализировать показатели
различных типов данных;
• Позволяет сокращать размерность данных,
делать ее наглядной.
Высшая школа экономики, Москва, 2012
4
Задачи
• Разработка типологии или классификации;
• Исследование полезных концептуальных схем
группирования объектов;
• Порождение гипотез на основе исследования
данных;
• Проверка гипотез.
Высшая школа экономики, Москва, 2012
5
Этапы кластерного анализа
• Отбор выборки для кластеризации;
• Определение множества переменных, по
которым будут оцениваться объекты в
выборке;
• Вычисление значений той или иной меры
сходства (или различия) между объектами;
• Применение метода кластерного анализа
для создания групп сходных объектов;
• Проверка достоверности результатов
кластерного решения.
Высшая школа экономики, Москва, 2012
6
Недостатки
• Может давать неустойчивые кластеры;
• Он реализует индуктивный метод
исследования от частного к общему;
• Имеет множество особенностей,
связанных с внутренними методами;
Высшая школа экономики, Москва, 2012
7
Использование кластерного анализа
Анализ проектной
деятельности
Высшая школа экономики, Москва, 2012
Выполнение работ
в рамках проекта
8
Анализ проектной деятельности
• Анализ портфеля проектов
 Инвестиционный портфель проектов
 Портфель реальных проектов
• Оценка эффективности реализуемых проектов
Высшая школа экономики, Москва, 2012
9
Кластерный анализ
Критерий
Проект 1
……..
Проект N
Фактор 1
х
х
х
х
х
х
…………
Фактор N
Высшая школа экономики, Москва, 2012
10
Графическое отображение
Риск
Доходность
Высшая школа экономики, Москва, 2012
11
Предназначение кластерного
анализа
• Анализ портфеля проектов:
 Балансировка портфеля
 Разработка общих процессов управления
проектами
• Оценка эффективности реализуемых проектов
 Выявление групп сходных проектов, для
проведения регрессионного анализа
Высшая школа экономики, Москва, 2012
12
Пример. Создание бренда для
продукта
«Орский мясокомбинат»
Производство
колбасных изделий и
деликатесов
Производство
мясной консервации
«Говядина тушеная ГОСТ высший
сорт»
•70% продаж
•80% прибыли
13
Проведение исследования
Данные: исследовательская компания Комкон
Сбор: заполнение дневников участниками панели
Преимущества: размер выборки, стоимость и
скорость
Этапы исследования потребителей :
• Выявление списка эмоциональных и
функциональных выгод
• Разделение потребителей на группы:
– Факторный анализ (Выявлено 3 фактора)
– Кластерный анализ (на базе 3-х факторов
сформированы кластеры методом Варда)
14
Кластеры
«ищущие
качество»
«большое
содержание мяса
в банке» (86,3%)
«нет сои» (83,8%)
«высокое
качество» (79,4%)
«по ГОСТу»
(77,5%)
«ищущие вкус»
«вкусная» (100%)
«не жирная»
(92,6%),
«содержит мало
желе»
(92,6%)
«не острая»
(85,2%)
«ищущие низкую
цену»
«не дорогая»
(100%)
«безопасность с
точки зрения
отравления»
(100%)
«калорийная»
(62,8%)
«стеклянная
банка» (48,8%)
15
Итоги исследования
«ищущие
качество»
Частота покупки:
средняя
Возраст: 25-34
года
Личный доход: от
5 до 15 тыс.
рублей
«ищущие вкус»
Частота покупки:
низкая
Возраст: 45-54 лет
Личный доход:
более 20 тыс.
рублей
«ищущие низкую
цену»
Частота покупки:
высокая
Возраст: старше
55
Личный доход:
менее 5 тыс.
рублей
16
Download