Document 953621

advertisement
ТЕХНИЧЕСКОЕ ЗАДАНИЕ НА РАЗРАБОТКУ СИСТЕМЫ H-PROJECT ....................................................... 2
ОБЩАЯ ИНФОРМАЦИЯ ПО ПРОЕКТУ .............................................................................................................................. 2
Краткое описание ................................................................................................................................................... 2
Задачи проекта ....................................................................................................................................................... 2
Общие требования работы над проектом .......................................................................................................... 3
МОДУЛЬ ПОИСКА (МП) ................................................................................................................................................. 5
Назначение ............................................................................................................................................................... 5
Словарь понятий ..................................................................................................................................................... 5
Используемые данные ............................................................................................................................................. 5
Отступление. Представление информации в БД.................................................................................................................5
Процесс поиска ........................................................................................................................................................ 6
Отступление. Реализация алгоритмов..................................................................................................................................8
ТЕХНИЧЕСКОЕ ЗАДАНИЕ НА РАЗРАБОТКУ СИСТЕМЫ H-PROJECT
Общая информация по проекту
Краткое описание
Название проекта: H-project.
Цель проекта: создание полностью управляемой поисковой системы, представляющей
информацию сообразно запросам пользователя системы.
Задачи проекта
1. Разработка модуля поиска (МП).
Модуль осуществляет поиск по базе данных.
1.1. Разработка базы данных модуля.
1.1.1. Разработка модели БД, рассмотрение и утверждение ее с заказчиком.
1.1.2. Реализация БД.
1.2. Разработка механизмов поиска.
1.2.1. Разработка интерфейсов поисковых функций: стандартных входных
параметров и результирующих массивов данных.
1.2.2. Разработка функций, реализующих алгоритмы поиска.
2. Разработка модуля представления информации (МПИ).
Модуль предоставляет пользовательский интерфейс для работы с системой.
2.1. Разработка базы данных модуля.
2.1.1. Разработка модели БД, рассмотрение и утверждение ее с заказчиком.
2.1.2. Реализация БД.
2.2. Разработка механизмов представления информации.
2.2.1. Разработка функций формирования запроса на поиск.
2.2.2. Разработка функций выбора блока выдачи информации.
2.2.3. Разработка функций выдачи информации в блок.
2.2.4. Разработка функций выбора шаблона и его уровня.
2.2.5. Разработка функций формирования страницы на основе шаблона.
3. Разработка модуля управления (МУ).
Модуль позволяет управлять контентом и модулями системы.
3.1. Разработка базы данных модуля.
3.1.1. Разработка модели БД, рассмотрение и утверждение ее с заказчиком.
3.1.2. Реализация БД.
3.2. Разработка механизмов управления.
3.2.1. Разработка механизмов управления контентом.
3.2.1.1. Разработка функций добавления, редактирования, удаления типов
контента.
3.2.1.2. Разработка функций добавления, редактирования, удаления
контента.
3.2.2. Разработка механизмов управления алгоритмами поиска.
3.2.2.1. Разработка функций установки, удаления алгоритмов поиска.
3.2.2.2. Разработка функций включения, отключения, настройки параметров
алгоритмов поиска.
3.2.3. Разработка механизмов управления представлением информации.
3.2.3.1. Разработка функций установки, удаления алгоритмов представления
информации.
3.2.3.2. Разработка функций включения, отключения, настройки параметров
алгоритмов представления информации.
3.2.3.3. Разработка функций конструирования блоков, шаблонов, страниц.
3.2.3.4. Разработка функций настройки параметров формирования блоков,
шаблонов, страниц.
3.2.4. Разработка механизмов управления статистической информацией.
3.2.4.1. Разработка функций редактирования статистической информации.
3.2.5. Разработка механизмов управления рекламной информацией.
3.2.5.1. Разработка функций добавления, редактирования, удаления
рекламной информации.
3.3. Разработка пользовательского интерфейса управления.
3.3.1. Разработка форм управления контентом.
3.3.1.1. Разработка форм добавления, редактирования, удаления типов
контента.
3.3.1.2. Разработка форм добавления, редактирования, удаления контента.
3.3.2. Разработка форм управления алгоритмами поиска.
3.3.2.1. Разработка форм установки, удаления алгоритмов поиска.
3.3.2.2. Разработка форм включения, отключения, настройки параметров
алгоритмов поиска.
3.3.3. Разработка форм управления представлением информации.
3.3.3.1. Разработка форм установки, удаления алгоритмов представления
информации.
3.3.3.2. Разработка форм включения, отключения, настройки параметров
алгоритмов представления информации.
3.3.3.3. Разработка форм конструирования блоков, шаблонов, страниц.
3.3.3.4. Разработка форм настройки параметров формирования блоков,
шаблонов, страниц.
3.3.4. Разработка форм управления статистической информацией.
3.3.4.1. Разработка форм редактирования статистической информации.
3.3.5. Разработка форм управления рекламной информацией.
3.3.5.1. Разработка форм добавления, редактирования, удаления рекламной
информации.
Общие требования работы над проектом
1. Требования реализации.
1.1. Скорость поиска и выдачи информации.
Гарантированное время ответа системы на запрос (поиск, выбор категории, объекта
и т.п.) не должен превышать 1 секунды.
1.2. Надежность и однозначность работы системы.
Вся реализованная на момент сдачи проекта функциональность системы должны
при всех параметрах должна выдавать результат, который определяется только
заложенными алгоритмами и ничем другим.
1.3. Гибкость системы.
Реализованная функциональность не должна создавать препятствия для
дальнейшего добавления новых алгоритмов, сервисов, модулей.
1.4. Защищенность системы.
Административный
интерфейс
должен
быть
надежно
защищен
от
несанкционированного доступа логином/паролем и организацией работы по
защищенному протоколу передачи данных.
2. Требования работы над проектом.
2.1. Соответствие установленным срокам.
Сдача намеченных заранее промежуточных результатов в намеченные заранее
контрольные точки.
2.2. Соответствие техническому заданию.
Реализация всех алгоритмов, баз данных, пользовательских интерфейсов в
соответствии с прописанными в техническом задании.
Модуль поиска (МП)
Назначение
Поиск информации по параметрам, поступившим в модуль, и подготовка массива
результатов для передачи в вызвавший процедуру поиска модуль.
Словарь понятий
Искомое слово – слово или несколько слов, по которым производится поиск.
Элемент базы данных – запись в одной из таблиц базы данных.
Объект – это элемент базы данных, который содержит представляемую пользователю
информацию. Объект представляет все доступные пользователю типы контента.
Отношение (relation) – это элемент базы данных, определяющий связь между двумя или
более объектами. Каждое отношение формирует одно из представлений контента
(логическая основа блока в МПИ).
Область поиска – совокупность элементов базы данных, объединенных некоторым общим
признаком, для осуществления по ней поиска.
Сессия поиска – это процесс поиска, идентифицирующийся уникальным номером, временем
запуска, параметрами поиска.
Релевантность – соответствие информации требуемой (не уровень соответствия!!!).
Гарантированное время отклика – максимальный отрезок времени, в течение которого
могут быть получены результаты поиска.
Используемые данные
Исходные данные:
1. искомое слово,
2. параметры поиска,
3. параметры модуля, обратившегося к МП.
Результирующие данные:
1. массив найденных данных, отсортированный в зависимости от переданных
параметров.
Отступление. Представление информации в БД.
Заказчиком уже были рассмотрены 2 модели представления информации, их
преимущества и недостатки. Исполнителю необходимо разработать свою
собственную модель, не привязываясь к уже рассмотренным, и затем,
представить ее заказчику (аргументировать выбор структуры, описать
действие основных алгоритмов на основе такой БД). Это необходимо для
четкого понимания возможностей развития системы и сторон, в которых она
будет изначально ограничена.
Процесс поиска
Алгоритмы
1. Выбора области поиска.
1.1. По приоритету типа контента (content type priority).
1.2. По приоритету объекта (content priority).
1.3. По подтверждению (approving).
1.4. По популярности (hitcount).
1.5. По запрету на элемент БД.
2. Поиска.
2.1. По искомому слову.
2.2. По отношениям.
2.3. По ключевым словам.
3. Отбора результатов.
3.1. По релевантности.
3.2. По гарантированному времени отклика.
Общие условия работы алгоритмов
1. Каждый алгоритм может быть включен/отключен (средствами МУ) при условии, что
один из них обязательно включен в каждый момент времени.
2. Работа
всех
алгоритмов
(средствами
МУ)
может
быть
настроена
параллельно/последовательно.
3. Каждый алгоритм может быть включен/отключен (средствами МУ) на одну и более
областей поиска.
4. Каждая установка работы алгоритмов в соответствии с условиями 1-3 может быть
установлена (передачей параметров алгоритмов поиска) различной для различных сессий
поиска.
Описание алгоритмов
1. Выбора области поиска.
1.1. По приоритету типа контента (content type priority).
Каждый тип контента (товар, статья, категория, новость и т.п.) имеет определенный
приоритет поиска, устанавливаемый средствами МУ. Каждый тип контента
определяет свою область поиска, поиск по которым ведется в порядке убывания
приоритета.
1.2. По приоритету контента (content priority).
Каждый элемент базы данных (объект, отношение, keyword) может иметь свой
определенный приоритет, устанавливаемый средствами МУ.
1.3. По подтверждению (approving).
Тип контента, элементы базы данных могут быть подтверждены администратором
средствами МУ. Такие типы контента, элементы базы данных имеют приоритет при
поиске и разбивают область поиска на подтвержденную и не подтвержденную
часть.
1.4. По популярности (hitcount).
Тип контента, элементы базы данных в соответствии с hitcount делятся на
различные группы популярности, пределы которых заданы администратором в МУ.
Каждой группе соответствует своя область поиска.
1.5. По запрету на элемент БД.
Каждый элемент (объект, отношение, тип контента, keywords) по умолчанию
доступны для поиска по ним. При этом для исключения их из области поиска
каждому средствами МУ можно установить признак запрета на поиск.
2. Поиска.
2.1. По искомому слову.
Поиск в ширину искомого слова по всем элементам базы данных: объектам,
отношениям, keywords с учетом заданной ранее области поиска. Если искомое слово
состоит из нескольких слов, то для каждой комбинации слов осуществляется
отдельный поиск. В результате получаются три массива найденных элементов:
объектов, отношений, keywords.
2.2. По отношениям.
Поиск в ширину родственных элементов для каждого элемента в массиве
переданных данных по всем элементам базы данных с учетом заданной ранее
области поиска. В результате получаются три массива найденных элементов:
объектов, отношений, keywords.
2.3. По ключевым словам.
Поиск в ширину связанных по ключевым словам элементов базы данных для
каждого элемента в массиве переданных данных с учетом заданной ранее области
поиска. В результате получаются три массива найденных элементов: объектов,
отношений, keywords.
3. Отбора результатов.
3.1. По релевантности.
При поиске в ширину по любому алгоритму из пунктов 2.1-2.3 процесс следует
завершить при достижении уровня глубины поиска равного заданному (средствами
МУ) уровню релевантности.
3.2. По гарантированному времени отклика.
При поиске в ширину по любому алгоритму из пунктов 2.1-2.3 процесс следует
завершить по прошествии отрезка, равного установленному средствами МУ
гарантированному времени отклика.
Поэтапное описание процесса поиска
1. Выбор областей поиска на основе:
1.1. Алгоритмов выбора области поиска,
1.2. Параметров поиска.
2. Поиск по искомому слову в ширину по объектам, keywords, отношениям на основе:
 Алгоритмов поиска,
 Параметров поиска.
3. Определение пересечений в массивах найденных элементов и устранение повторных.
4. Поиск в ширину по массивам найденных элементов на основе:
 Отношений
 Keywords.
5. Повторение пунктов со 2 по 5 до предела, установленного:
 Уровнем релевантности
 Гарантированным временем отклика.
Взаимодействие алгоритмов
Алгоритмы одного типа и разных типов могут взаимодействовать следующим образом:
1. Работать последовательно: результат поиска по одному алгоритму является исходными
данными поиска по другому.
2. Работать параллельно: исходные данные обоих алгоритмов одинаковы, результаты
процессов поиска объединяются. Пересечения результатов считаются более
релевантными, остальные результаты равноправными по уровню релевантности.
Отступление. Реализация алгоритмов.
Алгоритмы должны быть реализованы в виде независимых функций с
общими стандартами входных параметров и результирующих. Это
необходимо для свободного отключения/удаления, подключению/включения
новых алгоритмов.
Download