ПЕРСОНИФИЦИРОВАННАЯ СИСТЕМА КОНТЕКСТНОГО ПОИСКА

advertisement
ПЕРСОНИФИЦИРОВАННАЯ СИСТЕМА КОНТЕКСТНОГО ПОИСКА
Ю.Л.Ижванов, С.П.Алваров
ГНИИ ИТТ "Информика", Москва
E-mail: alvarov@mail.ru
В данной работе рассматривается персонифицированная система контекстного поиска для Интернетсервера. Персонификация Интернет является следующим шагом в развитии Интернет-услуг. Интернет должен
подстраиваться под конкретного пользователя для того чтобы, учитывая его предпочтения, предоставлять
интересующую информацию. Это особенно важно при нынешнем развитии Интернет как средства массовой
информации. Подобные попытки создания интеллектуальных систем, способных "подстроиться" под
пользователя, сейчас делаются на основе технологии нейронных сетей. Данный проект предусматривает
использование более традиционных подходов и в основном ориентирован на интерактивное общение с
пользователем.
Доступ к системе осуществляется через Web-сервер. В качестве поисковой машины можно использовать
наиболее популярные системы поиска такие как Яndex, Rambler. В этом случае разрабатываемое программное
обеспечение будет выступать как внешний интерфейс к этим поисковым машинам. Пользователь может послать
запрос как на одну из предложенных поисковых машин, так и на несколько одновременно. В последнем случае
система проведёт соответствующую обработку полученных данных и выдаст результат без дублирования. Для
удобства анализа и обработки информации полученной от поисковой машины, результат запроса сохраняется в
специальной базе данных. База данных содержит учётные записи пользователей системы. Для работы с
поисковой системой необходимо зарегистрироваться, после этого система сможет предоставить пользователю
ряд услуг по сохранению и обработке его личных предпочтений. Под предпочтениями понимается набор ссылок,
которые были получены в результате запросов к поисковой машине и представляют собой круг интересов
пользователя. Каждый пользователь имеет свой набор ссылок, обработка которых составляет основную услугу,
предоставляемую системой.
Каждая ссылка может принадлежать к одному из трёх классов: текущие, архив и корзина. Класс корзина
представляет собой набор ссылок, которые будут удалены из базы данных либо по запросу пользователя, либо
через определённый промежуток времени. Ссылки, принадлежащие к классу архив, являются наиболее
устойчивыми предпочтениями пользователя и могут быть востребованы в любой момент. Текущие ссылки
представляют собой рабочий материал, выборка и сортировка которых является текущей работой пользователя.
По требованию ссылки могут перемещаться между этими классами, в т.ч. из корзины до тех пор, пока они не
будут удалены из базы.
Все запросы, которые получала поисковая машина, хранятся в базе данных. Пользователь может вызвать
результат любого запроса, сделанного им ранее или повторить запрос. При вызове старого запроса изначально
будут выданы текущие ссылки. При повторном запросе новые ссылки будут отмечены особенно. Для работы с
данными предусмотрены различные фильтры. Ссылки могут быть отсортированы по различным признакам.
Данная система предоставляет пользователю возможность вести свою базу данных ссылок ресурсов сети.
При этом в отличие от известных закладок, предоставляются расширенные возможности по поиску ресурсов и
их обработке. В перспективе возможно создание системы подписки на новости с тех или иных сайтов. На основе
анализа предпочтений пользователя можно будет предложить какие-то иные источники интересующей его
информации. В данный момент система находится на стадии проектирования.
Download