Поисковые машины

advertisement
Поисковые системы
В Интернете есть все, но,
чтобы найти, надо уметь
искать.
Поисковые машины

Интернет находится в процессе непрерывного
обновления и развития. Поэтому в сети нет единого
каталога, оглавления или предметного указателя
ресурсов.

Для поиска информации используются службы
автоматического поиска (специальное программное
обеспечение) -поисковые машины.

Каждая поисковая система применяет свои
уникальные методы для сбора информации о
ресурсах Интернет, формирует свою базу данных.
Инструменты поиска
Поиск по
каталогам
Ондайновые
энциклопедии и
справочники
Поисковые
машины
Подбор
доменного
имени
Поиск по каталогам

Составлением каталогов занимаются люди.

В каталоге ссылки иерархически
структурированы по темам.

Можно перемещаясь по дереву каталогов
постепенно сужать область поиска.

Каталоги используются, когда ищется
общая информация по интересующей теме.

При поиске конкретного документа каталоги
неэффективны.
Пример иерархической структуры
Структура учебных заведений в системе образования.
Поиск по тематическим каталогам имеет вид иерархической
структуры. Перемещение - по ссылкам до конкретной веб-страницы или
др.
Примеры каталогов
http://list.mail.ru – каталог на Mail.ru –
универсальный каталог Рунета.
http://www.kinder.ru — Каталог детских
ресурсов Рунета.
http://www.portal.edu.ru — Федеральный
портал «Российское образование».
http://school.holm.ru — Школьный мир:
каталог образовательных ресурсов.
http://www.yandex.ru/info/ci.html сортировка по индексу цитирования
Каталог http://list.mail.ru
Выбранный
раздел
Содержимое
раздела и
количества
ссылок в
подразделах
Рейтинг Rambler Top 100
Популярность сайтов оценивается по количеству
посетителей за определенный промежуток времени.
Каталог Образование на Rambler Top 100
В каталоге Образование вы выйдете на сайт ttp://top100.rambler.ru/top100/Education/,
см. рисунок.
Ссылки отсортированы по посещаемости. На первом месте находятся сайты с
рефератами. И только потом вы можете попасть на сайты, не содержащие рефератов.
Тематические коллекции ссылок
Тематические коллекции ссылок – списки ссылок,
составленные группой профессионалов или
отдельным специалистом.
Подбор доменного имени


Поиск сайта с ключевым
словом в названии порой
успешно конкурирует с
другими приемами поиска.
Сайты компаний или
коммерческих проектов с
односложными названиями
укладываются в формат:
www.name.com
www.name.ru
www.intel.ru
www.ibm.ru
www.microsoft.ru
www.weather.ru
www.1september.ru
www.fio.ru
www.foto.ru
pogoda.ru
Как работает поисковая машина

Поисковая машина состоит из двух частей: робота и поискового механизма.

База робота формируется им самим. Он обходит все предписанные серверы и
формирует базу данных.

Принцип работы поисковой машины сводится к тому, что она ищет в базе
данных ключевые слова, которые пользователь указывает в поле запроса, и
выдает список ссылок, ранжированный по релевантности.

Поисковая система оперирует внутренними ресурсами, а не пускается в
путешествие по Сети.

Несмотря на то что база данных поисковой машины постоянно обновляется за
счет опроса узловых адресов в Сети, внутренние ресурсы поисковой машины и
ресурсы Сети несопоставимы, и поэтому вероятность того, что машина даст
устаревший адрес или не найдет нужный ресурс, всегда больше нуля.

Проблема состоит не только в ограниченности внутренних ресурсов, но и в том, что
скорость робота ограничена.
Построение и использование индексной БД
Роботы-пауки просматривают
информационное наполнение
Web-страниц и создают
индексированную базу поиска по
ключевым словам.
По запросу пользователя выдают
ранжированный по
релевантности список сайтов.
Каждый поисковая система имеет
свой алгоритм присваивания
весовых коэффициентов. Это
одна из причин, по которой
поисковые машины по одному и
тому же ключевому слову
выдадут различные списки
ресурсов.
Популярные поисковые
системы



Google
(www.google.ru).
Яндекс
(www.yandex.ru)
Рамблер
(www.rambler.ru).
Поле ввода
ключевых слов
Кнопка запуска
поиска ссылок
Правила поиска по ключевым
словам

Запрос может состоять как из одного слова, так и из сочетания слов, которые
объединены операторами.

Сужайте круг поиска, используя несколько ключевых слов.

Каждая поисковая система использует свой язык запросов для связи ключевых слов .
Для знакомства с ним надо прочитать встроенную справку поисковой системы.

Система учитывает все формы слова по правилам русского языка: по запросу
«билет» будут найдены «билетом», «билету» и др.

Заглавные буквы используйте только в именах собственных: по запросу «кузнецов»
будут найдены и кузнецы, и Кузнецовы …

Если нужного адреса нет в первой десятке, измените запрос.

Если не найдено ни одной ссылки, проверьте орфографию.
Выход в Расширенный поиск
в Google.ru
Кнопка выхода в
режим
Расширенного
поиска
Фрагмент окна
поисковой
системы
Расширенный поиск в
Google.ru
Кнопка запуска
поиска
Модель
поиска
Выбор
языка
документа
Выбор
формата
документа
Метапоисковые системы

Метапоисковые системы транслируют ваш
запрос сразу в несколько поисковых систем.

Если при обычном поиске документов по теме
найдено много, то метапоиск не нужен и,
возможно, даже вреден, поскольку смешивает
разные логики ранжирования.

Если при обычном поиске документов по теме
найдено мало, то метапоиск может быть
полезен, потому что обращается к большому
числу поисковиков.

Весьма удобной является отечественная
программа ДИСКо Искатель.
Популярные метапоисковые
системы



Глобальные метапоисковые машины
www.search.com
www.dogpile.com
www.metacrawler.com
Российские метапоисковые машины
www.metabot.ru
www.poisk.ru
www.360.ru
Метапоисковые системы, устанавливаемые
на ПК пользователя, со способностью
запоминать параметры поиска и результаты
www.disco.ru
Copernic Agent
ДИСКо Искатель
Разработчик: фирма «ДИСКо» (www.disco.ru),
Эта метапоисковая система - инструмент для поиска информации на нескольких
поисковых серверах одновременно.
Особенность этой программы: возможность запоминать как параметры поиска,
так и его результаты, и неоднократно использовать их впоследствии.
Онлайновые энциклопедии и
справочники

Поиск толкований искомых слов,
словарных статей по указанным
терминам – по энциклопедиям и
справочникам.

Крупнейшая энциклопедия Яндекс
(http://encycl.yandex.ru/) содержит 220 000
статей из 14 энциклопедий.
Энциклопедии и словари
Рубрикон
(http://www.rubricon.com/default.asp)
Википедия
Энциклопедия, создаваемая самими пользователями.
Способы поиска изображений

С помощью поисковых машин общего
назначения: Яндекс, Google …

С помощью специализированных поисковых
машин:
www.alltheweb.com
www.ditto.com
www.fotosearch.com

В коллекциях организаций и частных лиц:
www.gifpark.ru
www.prifoto.ru
www.photocity.ru
www.fotocity.ru
www.magicbaikal.ru
www.most-spb.ru
www.rusmuseum.ru/ru/collections/paintings/
Использованные материалы

Александр Прохоров. Поисковые
системы./ КомпьютерПресс 2'2004

Информационные технологии в
деятельности учителяпредметника. Часть II / М.: ФИО 2006, 188с.
Download