Безопасность информационных систем

реклама
Сети ЭВМ и телекоммуникации.
Лабораторная работа №1. «Разработка программы АНАЛИЗАТОР САЙТОВ»
Задание:
1. Разработать клиентское приложение, которое позволяет по протоколу HTTP
заходить на любую WWW-страницу по начальному заданному адресу и далее
осуществляет на этой странице действия согласно варианту задания. Разрешается
использовать готовые библиотеки, например QT для организации работы с
сокетами.
2. Результаты работы программы сохраняются в БД, структура которой создается и
разрабатывается самостоятельно в зависимости от варианта.
Полный список операций.
ВНИМАНИЕ!!! Все их не нужно реализовывать. Из набора этих операций
строится конкретный вариант задания.
Номер
операции
О1
О2
О3
О4
О5
Название операции
Описание операции
Поиск внутренних ссылок Осуществляется поиск всех ссылок на
на странице
странице, которые принадлежат тому
же домену, что и адрес страницы
анализа. Сохраняется адрес ссылки и ее
содержимое в текстовом виде, которое
находится между открывающим и
закрывающим тегом А
Поиск
всех
внешних Осуществляется поиск всех ссылок на
ссылок на странице
странице, которые не принадлежат тому
домену,
которому
принадлежит
текущая страница анализа. Сохраняется
адрес ссылки и ее содержимое в
текстовом виде, которое находится
между открывающим и закрывающим
тегом А
Поиск списков (UL,OL) и В документе ищутся все списки,
их элементов (LI)
заданные с помощью тегов UL или OL.
При
нахождении
списка
также
осуществляется поиск информации об
элементах
списка.
Сохраняются
элементы списка и информация о их
принадлежности с самому списку
Поиск изображений и их В документе осуществляется поиск
сохранение (IMG)
изображений, которые находятся в теге
IMG. Сохраняется само изображение, а
также параметры его отображения
(атрибуты тега: размер, рамка и т.п.)
Поиск
ссылок
на В документе осуществляется поиск
документы
(архивы, ссылок на объекты, которые не
текстовые файлы, PDF являются
HTML
страницами.
файлы и т.п.) и их Сохраняется сам документ и его MIME-
О6
О7
О8
О9
О10
сохранение.
Извлечение
ключевых слов,
содержатся
в
HEAD
тип
списка В документе осуществляется поиск
которые ключевых слов, которые указаны в
разделе разделе HEAD. Список ключевых слов
сохраняется таким образом чтобы
отдельные слова сохранялись в БД
отдельно
Поиск
и
извлечение В документе осуществляется поиск
текстовой информации с текстовой
информации,
которая
разделением на блоки
находится внутри тегов P. Сохраняется
сама текстовая информация, а также
атрибуты
Создание
скриншота Создается скриншот страницы, который
страницы
сохраняется в виде изображения. При
создании изображения указывается его
размер. Сохраняется само изображение,
его размер и дата формирования.
Поиск
управляющих В документе осуществляется поиск
элементов на странице управляющих
элементов
(INPUT,
(кнопки, поля ввода и т.п.)
TEXTAREA).
Сохраняются
все
элементы и их атрибуты
Поиск
заголовков В документе осуществляется поиск
(H1,...,H6)
заголовков,
отмеченных
тегами
H1,H2,H3,H4,H5.
Сохраняется
информация,
которая
содержится
внутри указанных тегов, а также их
атрибуты
Требования для сдачи лабораторной работы:
1. Демонстрация работы реализованной вами системы.
2. АВТОРСТВО
3. Оформление и представление письменного отчета по лабораторной работе,
который содержит:
 Титульный лист
 Задание на лабораторную работу
 Структура БД
 Листинг программы
Варианты заданий:
№
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
Список реализуемых операций
О4, О3, О1
О5, О9, О2
О7, О10, О6
О8, О3, О1
О4, О9, О2
О5, О10, О6
О7, О3, О1
О8, О9, О2
О4, О10, О6
О5, О3, О1
О7, О9, О2
О8, О10, О6
О4, О3, О6
О5, О9, О1
О7, О10, О2
О8, О3, О6
О4, О9, О1
О5, О10, О2
О7, О3, О6
О8, О9, О1
Скачать