А.Г. Царев (аспирант) МАССОВАЯ РЕКОМЕНДАТЕЛЬНАЯ СИСТЕМА ДЛЯ В ВЕБ-САЙТОВ НА ОСНОВЕ SAAS-ТЕХНОЛОГИИ г. Мытищи, Московский государственный университет леса C развитием и распространением Интернета растет количество крупных веб-сайтов (далее веб-сайтов) с большим количеством страниц, гиперссылок Информационная и сложной перегруженность структурой страниц и навигации. их высокая функциональность приводят к тому, что пользователям становится сложнее ориентироваться, находить и осуществлять выбор интересующей (релевантной) информации. Таким образом, в современных крупных веб-сайтах: Интернетбиблиотеках, Интернет-магазинах, государственных порталах и т.д. существует актуальная задача эффективной навигационной поддержки его пользователей. Эту задачу можно решать путем персонализации содержимого в соответствии с потребностями и особенностями поведения конечного пользователя. Под персонализацией в работе понимается автоматическое предоставление конкретному (конечному) пользователю ссылок на страницы с интересующей его информацией. Системы, предоставляющие такие возможности, относятся к частному случаю персонализации, их также называют рекомендательными. В настоящее время ряд компаний используют специально созданные, встроенные в веб-сайт рекомендательные системы. При этом для интеграции рекомендательной системы с выбранным вебсайтом необходимы координальные изменения его системы управления данными (CMS). Предлагаемая напротив, не интегрируется массовая требует в распространенный пользовательской рекомендательная перепрограммирования веб-сайт – счетчик практически статистики. информации так система CMS, же, Обработка осуществляется на (МРС), и легко как любой поступающей основе SaaS- технологии (Software as a service) – на веб-сайте устанавливается только результирующий интерфейс (блок рекомендуемых ссылок), а хранение и обработка пользовательских данных осуществляется на стороннем сервере МРС. Для установки МРС необходимо всего лишь зарегистрироваться на веб-сайте проекта, настроить внешний вид блока ссылок и вставить полученный html-код и javascript-код в нужное место своего веб-сайта. Архитектура МРС принципиально практически не отличается от архитектуры встроенной рекомендательной системы (Рис.1), ее основное отличие определяется большим количеством абонентов – вебсайтов, подключившихся и использующих МРС. Так же, как и встроенная рекомендательная система, МРС состоит из следующих подсистем (модулей): модуля сбора пользовательской информации, модуля обработки пользовательской информации, модуля вывода рекомендаций, модуля администрирования. Архитектура системы персонализации Модуль вывода рекомендаций Браузер пользователя 11 1 HTML 2 HTML 4 3 Сборщик интерфейсной информации 1…11 9 База данных SCRIPT Таблица Статистики 1 Модуль обработки пользовательской информации SCRIPT 5 База данных Таблица Кластеров Поисковых профилей Таблица Кластеров навигационных профилей 2 3 6 Формирование Множества Релевантных страниц SCRIPT Модуль сбора пользовательской информации Сборщик интерфейсной информации Поисковик кластерапобедителя навигационного/ поискового профилей Форимрование блоков реклмендуемых ссылок 10 Генерация веб-страницы 7 8 Индикатор МКОА SCRIPT SCRIPT Обозначение операций, выполняемых на лету 1…3 Кластеризатор поисковых профилей Кластеризатор Навигационных профилей SCRIPT ОФФ-ЛАЙН режим Формирование Множества рекомендуемых страниц SCRIPT 22 Обозначение операций, выполняемых в оффлайн-режиме Рис. 1. Архитектура встроенной системы персонализации данных вебсайта Модуль сбора отвечает за регистрацию необходимого набора пользовательских данных и ее хранение. Он состоит из специального счетчика, снимающего данные и таблиц базы данных, в которых хранится полученная от счетчика информация. Модуль обработки реализует алгоритм кластеризации CLOPE [1], адаптированный для решения задач кластеризация [2,3], метод расчета релевантности страниц соответствующих на основе подмодулей: МКОА [4,5] и предварительной состоит из обработки пользовательской информации, кластеризации, расчета релевантности страниц. Модуль вывода рекомендаций представляет собой информационный блок, занимающий определенное пространство на странице конкретного веб-сайта, выводимый конечному пользователю. Модуль администрирования необходим для настройки и управления указанных модулей. Для модуля сбора пользовательской информации предусматривается возможность задания количества и времени хранения записей, а также возможность настройки и перенастройки алгоритмов конвертации поисковых запросов различных поисковых систем из URL-адреса в поисковый запрос на естественном информации языке. настройка Для модуля изменения коэффициента отталкивания алгоритма кластеризации CLOPE, в матрицы в пользовательской возможности редактировании заключается обработки бинарных предпочтений ЛПР. Администрирование модуля вывода рекомендаций состоит в настройке абонентом внешнего вида соответствующего блока: стиля, размера, типа шрифта и цвета заголовка блока; цвета фона блока; цвета, стиля, размера, типа шрифта ссылок; размеров выводимого блока; количества рекомендуемых ссылок. Использование МРС позволит с минимальными затратами для владельца веб-сайта минимизировать временные и трудовые затраты пользователей его веб-сайта, повысить качество и частоту контактов пользователей с релевантной информацией и, как следствие, увеличить конверсию веб-сайта. В результате, любой веб-сайт, вне зависимости от своих объемов, тематики представленного контента, CMS, а также хостинг-сервера и его характеристик (производительности, операционной системы, языка программирования и т.д.) может получить продукт, который поднимет его на новый уровень взаимодействия с пользователями. Список литературы. 1. Y. Yang, X. Guan, and J. You. Clope: A fast and effective clustering algorithm for transactional data. Proc. of ACM SIGKDD Conference, July 2002. 2. В.Г. Домрачев, И.В. Ретинская, А.Г. Царев. Модель персонализации сайта на основе анализа постоянных потребностей конечного пользователя. // Новые информационные технологии и менеджмент качества (NIT&QM’2010). Материалы международной научной конференции/Редкол.: А.Н. Тихонов (пред.) и др.; ФГУ ГНИИ ИТТ «Информика».-М.: ООО «АртФлэш», 2010.-с.176-179. 3. А.Г. Царев. Модель персонализации сайта на основе анализа текущих потребностей конечного пользователя. // Новые информационные технологии (NIT&QM’2010). Материалы и менеджмент качества международной научной конференции/Редкол.: А.Н. Тихонов (пред.) и др.; ФГУ ГНИИ ИТТ «Информика».-М.: ООО «Арт-Флэш», 2010.-с.179-182. 4. А.Г. Царев. Модель индикатора предпочтений конечного пользователя веб-сайта на основе многокритериальной комплексной оценки альтернатив. // Мониторинг. Наука и технологии. №3, 2010.-с. 68-69. – ISSN 2076-7358. 5. А.Г. Царев. Многокритериальная оптимизация в задаче вычисления релевантности страниц веб-сайта. // Естественные и технические науки №4 (48). Москва: ООО «Изадтельство «Спутник+», 2010.- с. 298-299. – ISSN 1684-2626.