Uploaded by yana_ukrainceva

2лб Украинцева MI-91b

advertisement
МИНОБРНАУКИ РОССИИ
Федеральное государственное бюджетное образовательное
учреждение высшего образования
«Юго-Западный государственный университет»
(ЮЗГУ)
Кафедра «Программная инженерия»
ОТЧЕТ
по лабораторной работе №2
по дисциплине «Информационно-поисковые системы»
Направление подготовки 02.03.03 «Математическое обеспечение и
администрирование информационных систем»
Выполнил:
студент группы МИ-91б
Украинцева Я.О.
Проверил:
Ефремов.В.В
Курск 2022
Таблица 1 - Результаты сравнительного изучения поисковых систем
№
Оpera
Yandex
Google
1.
1.1
Параметры
Поиск по тексту
Логические операторы:
конъюнкция
Логическое И, ИЛИ, НЕ
AND
Логическое И, ИЛИ, НЕ
Пробел
AND
+
&
1.2
дизъюнкция
OR
Логическое И, ИЛИ, НЕ
&
пробел
(в пределах предложения)
&&
(в пределах документа)
|
1.3
отрицание
HOT-
Синтагматические
операторы:
!
*
+
""
[]
() и |
фразы
(словосочетания, слова
рядом)
расстояние в словах
() и |-Группируют слова
при сложных запросах.
~
(в пределах предложения)
~~
(в пределах документа)
К базовым операторам
относят:
!
*
+
""
[]
() и |
() и |-Группируют слова
при сложных запросах.
Оператор /(m n), где
m — минимальное расстояние
между заданными словами, n —
Оператор /(m n), где
m — минимальное расстояние
между заданными словами, n —
1.4
1.5
OR
|
HOT-
К базовым операторам относят:
!
+
""
[]
() и |
*
() и |-Группируют слова
при сложных запросах.
Идентично как и Яндекс
Оператор /(m n), где
m — минимальное расстояние
максимальное расстояние
между заданными словами
1.6
расстояние в
предложениях
1.7
Морфологическая
нормализация
2.
2.1
Поиск по полям
по заглавию
2.2
2.3
по полю ключевых слов
по комментарию к
картинкам
2.4
2.5
Оператор && /n,
Где n — максимальное
расстояние между
предложениями, содержащими
слова запроса
Идентично Яндексу, использует
артефакты сжатия
максимальное расстояние
между заданными словами
между заданными словами, n —
максимальное расстояние между
заданными словами
Оператор && /n,
Оператор && /n,
Где n — максимальное
Где n — максимальное
расстояние между
расстояние между
предложениями, содержащими
предложениями, содержащими
слова запроса
слова запроса
Использует артефакты сжатия Google использует несжатую
морфологического словаря.
морфологию
Другими словами Яндекс
использует сжатие
title (запрос)- отвечает за
заголовок страницы
keywords=()
«filetype:» — оператор, который
позволяет найти файлы
определенного расширения
title (запрос)- отвечает за
заголовок страницы
keywords=()
«filetype:» — оператор, который
позволяет найти файлы
определенного расширения
по тексту гиперссылок
anchor (запрос)-отвечает за
текст гиперссылки
anchor (запрос)-отвечает за
текст гиперссылки
по адресам ссылок
URL=www.url.ru/cat/* — по
URL=www.url.ru/cat/* — по
title (запрос)- отвечает за
заголовок страницы
keywords=()
Как и веб-поиск, Google Картинки
поддерживают определенные
операторы,
например src: и imagesize:
Hyperlink- представляет собой
ссылку на данные, по которым
пользователь может перейти,
щелкнув или нажав. Гиперссылка
указывает на весь документ или
на конкретный элемент в
документе. Гипертекст - это
текст с гиперссылками. Текст, на
который делается ссылка,
называется якорным текстом.
https//:www.google.com- по адресу
2.6
по доменному имени
сайта (сервера)
адресу
domain=»домен»
адресу
host=www.host.ru
site:*.net запрос
rhost=»ru.url.*» или
rhost=»ru.url.www»
2.7
2.8
2.9
по языку
по дате
по формату
lang=»язык»
date=»ГГГГ{*|ММ{*|ДД}}»
mime=»тип_файла»
domain=»домен»
lang=»язык»
date=»ГГГГ{*|ММ{*|ДД}}»
mime=»тип_файла»
2.10
Другие
Intext (Пример:IT intext:seo)Ищет страницы с
обязательным вхождением
слова в тексте
site: и mime: (Пример: site:ozon.ru
mime:pdf) - Находят указанный
тип документа на конкретном
сайте
host: (Пример: seo
host:seranking.ru) - Выдает
страницы главного зеркала
сайта
3.
3.1
3.2
3.3
3.4
Интерфейс выдачи (форма представления
статистика слов из
запроса
количество найденных +
документов
количество найденных 8 млн найденных результатов
сайтов
на запрос по вопросу
«синтагматические операторы
поисковой системы»
количество
1
документов на
lang=»язык»
"after:ГГГГ/ММ/ДД".
Достаточно добавить в конце
вашего запроса filetype:doc.
Ограничивает результаты
файлами определённого
формата, например, pdf, docx, txt,
ppt и т. д. Примечание:
аналогично оператору “ext:”.
Пример: apple filetype:pdf / apple
ext:pdf
+(если более одного слова)
-
+
+
9 млн найденных результатов
на запрос по вопросу
«синтагматические операторы
поисковой системы»
3
9 млн найденных результатов на
запрос по вопросу
«синтагматические операторы
поисковой системы»
0
3.5
3.6
3.7
a)
b)
c)
d)
e)
f)
g)
h)
i)
странице результатов
сортировка
По релевантности
документов на
По дате
странице выдачи
поиск в найденном
+
Описание документа включает следующие
URL (адрес в сети)
+
размер документа
+
(объем)
дата создания
+(но не всегда)
кодировка
Кириллица
аннотация (краткое
аннотации —до 350 знаков с
содержание)
пробелами.
указание на другие
+
релевантные вебстраницы
ссылка на рубрику
+
каталога
поиск похожих
+
документов
другое
Группирование открытых
вкладок. Как и многие другие
браузеры Opera позволяет
открывать web-страницы на
разных вкладках, чтобы потом
можно было быстро
переключаться между ними.
Автозаполнение полей. После
первого заполнения формы,
будет предложено сохранить
По релевантности
По дате
По дате
По релевантности
+
+
+
+
+
+
+(но не всегда)
Кириллица
Аннотации — до 350 знаков с
пробелами.
+
(+ но не всегда)
Кириллица
Аннотации —от 300-400 знаков с
пробелами.
+
+
+
+
+
Яндекс предпочитает короткие
тексты, объем которых не
превышает 2000 знаков.
Гугл отдает предпочтение
длинным текстам, в которых
общее количество знаков
превышает 4000.
Система определяет, из какого
региона поступил запрос, и
выдает ответ в соответствии
с геолокацией.
При новом запуске браузера
поисковик учитывает запросы,
заданные в прошлый раз.
Быстрее индексирует новые
сайты.
Ранжирует по методу обратных
ссылок.
данные, и если ответить
согласием, то при следующем
посещении сайта заполнить
форму можно в один клик.
Download