Uploaded by g.benzova

Поисково-справочные ИС

advertisement
Тема: Особенности
сопровождения
информационных систем
поисково-справочных служб
Браузер – специальное ПО,
обеспечивающее просмотр Web
–страниц и перемещение по
Всемирной паутине (Интернету)
2017
(с) Bolgova N.A.
2
Поисковая система
2017
(с) Bolgova N.A.
3
Компоненты поисковой системы:
1. База данных (Database) – хранилище всех
скаченных и обработанных страниц.
2. Веб-сервер (Web server) – отвечает за правильное
взаимодействие пользователя и элементов
поисковой системы.
3. Краулер или «путешествующий» паук (Crawler) –
программа, проверяющая и проходящая по
ссылкам на странице в автоматическом режиме.
4. Паук (Spider) – программа считывания Интернетстраницы (напоминает браузер)
5. Индексатор (Indexer) – программа для проведения
анализа веб-страниц, которые были скачаны
пауками.
6. Система выдачи результатов (Search engine results
engine) –извлечение результатов поиска из
основной базы данных.
2017
(с) Bolgova N.A.
4
База данных
Представляет собой хранилище всей
информации, которая скачивается и
анализируется поисковой системой.
В некоторых источниках базу данных
могут упоминать как индекс поисковой
системы.
2017
(с) Bolgova N.A.
5
Паук
В ходе работы выделяет все находящиеся на
Интернет странице ссылки. Основная его
задача заключается в определении ссылки, по
которой будет совершён переход и поиск новых
документов, которые ещё не были внесены в
базу данных поисковой системы.
Решение о переходе принимается на основе
заранее сформированного списка адресов или
на основе ссылок присутствующих на
анализируемой странице.
2017
(с) Bolgova N.A.
6
Web server
Чаще всего на сервере существует htmlстраница с полем ввода, которое
используется для поиска ключевых слов
или каких-либо терминов.
Одной из функций веб-сервера
является организация выдачи
результатов поиска пользователю и
представление их в виде html-страницы.
2017
(с) Bolgova N.A.
7
Паук
Программа, основной целью которой
является скачивание Интернет страниц.
Работает по тем же принципам что и
браузеры, но в отличие от них паук
работает напрямую с кодом html, а не
отображает информацию в привычном
для пользователей виде.
2017
(с) Bolgova N.A.
8
Индексатор
Осуществляет анализ страницы,
разбивая её на отдельные блоки и
элементы.
В ходе работы выделяются различные
элементы, и проводится их детальный
анализ. В качестве элементов выступают
заголовки, html-теги, структурные
особенности, текст, стилевые
особенности и т.д.
2017
(с) Bolgova N.A.
9
Система выдачи результатов.
Данный блок занимается выбором страниц
из базы поисковой системы. Данный компонент
поисковой системы является одним из
ключевых. Он определят, какие страницы
подходят под заданные пользователем
критерии и в каком порядке их необходимо
вывести.
Для анализа запроса, поиска
соответствующих страниц в базе данных и
вывода полученной информации используются
специальные базовым алгоритмам
ранжирования поисковой системы.
2017
(с) Bolgova N.A.
10
Рейтинг использования поисковых
систем в русскоязычном Интернете :
Яндекс - более 50% от общего числа
пользователей
Google – почти 35%
Rambler, Аппорт 2000 - более 10%
2017
(с) Bolgova N.A.
11
Какой поисковик лучше
Yandex или Google?
Критерии исследования:
1. Интерфейс
2. Реклама
3. Качество поиска
4. Дополнительные сервисы
2017
(с) Bolgova N.A.
12
Google
2017
(с) Bolgova N.A.
13
2017
(с) Bolgova N.A.
14
Вывод:
1. Интерфейс :Google - мало информативен и
прост, Яндекс - информативен по мах.
2. Реклама: Google - мало рекламных
материалов, Яндекс - много
3. Качество поиска: одинаково, но Google
более развит в информационном направлении,
Яндекс - в коммерческом
4. Дополнительные сервисы:
Яндекс - множество сервисов (+удобно
структурированы), Google –меньше (- имеются проблемы с
их использованием)
2017
(с) Bolgova N.A.
15
Практическое задание
Найти в WWW ответ на вопрос «Когда компания AMD
продемонстрировала свой первый двухядерный
процессор?» (Работа 2.4, задание 1 (стр 200))
А) с помощью одного из поисковых каталогов:
Яндекс http://yaca.yandex.ru
Mail.ru (List-Ru) http://www.mail.ru
Б) с помощью одного из поисковых указателей:
Яndex www.yandex.ru
Google www.google.ru
Результаты отобразить в таблице (тетрадь)
Вопрос
2017
Результат
Использованный
поисковый сервер
А)
Б) (с) Bolgova N.A.
Адрес найденной
страницы
16
Домашнее задание:
П 12, вопрос 1,2 (стр 200) внести
данные в таблицу
1) Найти информацию о том, кто был первым
чемпионом мира по шахматам и в каком году
состоялся первый чемпионат?
2) Найти текст книги Александра Беляева
«Голова профессора Доуэля»
2017
(с) Bolgova N.A.
17
Литература
1.
2.
3.
4.
5.
2017
И.Г. Семакин «Информатика 11 класс ФГОС базовый уровень» - Москва,
Бином, 2014
Единая коллекция цифровых образовательных ресурсов [http://schoolcollection.edu.ru];
Википедиа [http://ru.wikipedia.org];
http://lichnosti.net/photos/1122/13230885391.jpg– Тим Бернерс-Ли
Шерстакова Ирина Ионасовна, учитель физики Горловской гимназии
"Интеллект» «Состав поисковой системы» (из конспекта урока по информатике
«Поисковые системы. Организация поиска информации (11 класс), сайт
https://infourok.ru/user/shestakova-irina-ionasovna
(с) Bolgova N.A.
18
Download