Презентация к уроку в 10 классе Поиск данных

advertisement
МОУ СОШ №2 городского округа город Буй Костромской области
Поиск данных.
Постановка, организация,
последовательность поиска
Классификация средств поиска Интернет:
•
•
•
•
Поисковые машины (search engines).
Поисковая машина состоит из баз данных (БД) и программного
обеспечения (ПО) для их обработки. ПО, в свою очередь, делится на две
части: анализатор содержимого Web-страниц (Spider — спайдер, или
«паук») и классификатор — определитель рейтинга,
осуществляющий сортировку ссылок, найденных по запросу
пользователя.
Порталы.
Поисковые машины с интегрированным предложением собственного
информационного контента, которые могут также предоставлять
дополнительные услуги: бесплатные адреса электронной почты, места
для размещения домашних Web-страниц и другие.
Метапоисковые системы.
Надстройки над поисковыми машинами, которые не имеют собственной
БД и при поиске по запросу пользователя формируют, в свою очередь,
запросы для нескольких внешних поисковых машин, а затем анализируют
полученные результаты и выдают список ссылок в порядке,
определяемом соотношением рейтингов ответа сразу по нескольким
поисковым машинам. Проще говоря, такая машина ведет опрос нескольких
поисковых систем, а затем отбирает ссылки, следуя собственному
алгоритму.
Каталоги (directories).
Тщательно подобранные (чаще вручную) ссылки на ресурсы,
сопровождаемые описаниями. Некоторые каталоги содержат внутренние
поисковые машины.
Поисковые системы содержат
тематически сгруппированную
информацию об информационных
ресурсах Всемирной паутины в базах
данных. Специальные программыроботы периодически «обходят» Webсерверы Интернета, читают все
встречающиеся документы, выделяют в
них ключевые слова и заносят в базу
данных Интернет-адреса документов.
Поиск по ключевым словам.
Поиск документа в базе данных
поисковой системы осуществляется с
помощью введения запросов в поле
поиска.
информатика
Запрос должен содержать одно или
несколько ключевых слов, которые
являются главными для этого
документа.
Рекомендации
1. Четко поставить перед собой задачу по
поиску информации
2. Лучше выписать на бумаге тему своего
поиска и придумать несколько словсинонимов к вашему запросу.
3. Работу с любой поисковой машины
начинайте с раздела Помощь.
Релевантность поиска — это степень
соответствия ответа вашему запросу.
• Глубина и охват поиска.
Охват поиска напрямую зависит от объема
базы данных той или иной поисковой
машины.
Глубина поиска — это ограничение на
количество страниц или же на глубину
вложенности папок на одном сервере.
• Новизна информации на поисковом сервере.
Советы при составлении запросов
• Ищите не одно слово, а сразу
несколько.
• Используйте специальные термины,
которые есть только в искомой теме.
• Ищите специализированные сайты, а
дальше ведите поиск их страницам
— функции поиска в найденном.
• Охватите Интернет несколькими
поисковыми системами.
Отличия в поисковых системах
•
•
•
Заглавные буквы в запросе рекомендуется
использовать только в именах собственных,
например Москва.
Восклицательный знак в начале слова ставится
перед словом для указания нормальной формы,
например на запрос !новгородцев найдутся только
страницы с упоминанием этой фамилии, а не города
Новгород.
Используйте знаки «+», «-».
Например: аттестация +педагогических кадров
аттестация -педагогических кадров
Замечание:"-", «+» надо писать через пробел от
предыдущего и слитно с последующим словом.
Рамблер
• Регистр ключевых слов и операторов
значения не имеет, например запросы
Аттестация и АТТЕСТАЦИЯ
воспринимаются одинаково.
• Знаки «+» и «–» не действуют. Используются
операторы
 AND ( & ) — логическое И,
 OR ( | ) — логическое ИЛИ,
 NOT ( ! ) — логическое И-НЕ.
В10
В таблице приведены запросы к поисковому серверу.
Расположите номера запросов в порядке возрастания
количества страниц, которые найдет поисковый сервер по
каждому запросу.
Для обозначения логической операции “ИЛИ” в запросе
используется символ |, а для логической операции “И” – &.
Решение:
1
принтеры & сканеры & продажа
2
принтеры & продажа
3
принтеры | продажа
4
принтеры | сканеры | продажа
В10
Решение:
Наименьшее число страниц по запросу
принтеры & сканеры & продажа (1)
Затем - принтеры & продажа - (2).
Далее - принтеры | продажа (3).
И максимальное количество страниц по запросу
принтеры | сканеры | продажа (4).
Записываем в порядке возрастания:
Правильный ответ – 1234.
Отсортировать по возрастанию :
А. шкафы | (шкафы & столы & стулья)
Б. шкафы | стулья
В. шкафы & столы & стулья
Г. шкафы & столы
Решение:
С первого взгляда видно, что выражения
А и Б дадут больше результатов, чем В
и Г. Осталось разобраться с ними
попарно.
А и Б. Оба содержат логическое ИЛИ при
запросе «шкафы». Значит, больше всего
результатов даст то выражение, у которого
после логического ИЛИ идет более общий
запрос. Разумеется, запрос «стулья» –
более общий, чем запрос «шкафы И столы И
стулья». Значит, выражение Б даст больше
всего результатов, за ним – А.
Рассмотрим теперь В и Г. В данном случае
«шкафы И столы» – более результативный
запрос, чем «шкафы & столы & стулья».
Осталось только записать ответ: ВГАБ.
Домашнее задание:
§11,вопросы + записи в
тетради
Download