Поиск информации в интернете Занятие 8. Сложные запросы в ПС Яндекс Неранжирующее «И» Оператор неранжирующее «И» << очень похож на оператор определения слов в одном документе &&, с той лишь разницей, что слово, которое находится справа, влияет на возможность документов попасть в результаты поиска, но не влияет на ранжирование. Неранжирующее «И» (пример) Например, запрос Трутнев && биография найдет документы, где указанные слова будут расположены в пределах одного документа. При этом одно из первых мест в результатах займет, например, документ, в котором будет словосочетание «биография Трутнева». Неранжирующее «И» (пример) А на запрос Трутнев << биография будут найдены документы, где будут присутствовать оба слова, но слово «биография» не будет влиять на ранжирование и первые места в списке результатов поиска займут документы со словом «Трутнев». Поиск текста в заголовке страниц Поиск текста в заголовке страниц (title): $title (запрос) На запрос Максвелл << $title (биография) будут найдены документы со словом «биография» в заголовке и словом «Максвелл» в тексте. Причем слово «Максвелл» будет определяющим. Поиск текста на сайте Поиск ограничивается группой страниц, с заданным адресом. url=«www.url.ru/cat/*» Пример: «кот Бублик» << url=«www.exler.ru*» Будет найдены все упоминания о коте Бублике на сайте www.exler.ru Поиск файлов Позволяет ограничить поиск определенным типом файла: HTML, PDF, DOC, PPT, XLS, RTF, SWF. mime=«тип_файла» На запрос: (инструкция && микроволновая печь) << (mime=«pdf» | mime=«rtf») будет найдены документы PDF и RTF, в теле которых присутствуют слова «инструкция» и «микроволновая печь». Определение языка текста Можно отобрать для поиска документы, написанные на определенном языке: • • • • • • русском (ru), украинском (uk), белорусском (be), английском (en), французском (fr), немецком (de). lang=«язык» Пример: DAAD << lang=«de» Поиск по дате Поиск производится только по страницам, дата которых удовлетворяет заданному условию date=«ГГГГ{*|ММ{*|ДД}}» Пример: date=«200310*» По запросу будет производится поиск документов, датированных октябрем 2003 года. Сложные запросы: выручат скобки Вы можете строить сколь угодно сложные конструкции, подставляя в каждом из операторов вместо отдельного слова целые выражения. Чтобы Яндекс при этом правильно понимал вас, заключайте выражения в круглые скобки. Сложные запросы Чтобы пореже натыкаться на уменьшение количества результатов, вызванные неверным синтаксисом, используйте несколько правил: 1. Всегда ставьте перед стоп-словами «+»; 2. Отделяйте операторы поиска в элементах от слов запроса символами «&&»; 3. По возможности, используйте в сложных запросах «/+1» вместо кавычек. Анализ сложных запросов Пример запроса 1 Общий запрос на тему бокса не совсем релевантен: (бокс|боксер|боксерский) Очевидно, что по результатам поиска будет найдено довольно много документов в том числе и не относящихся к спорту. Улучшим запрос… Пример запроса 1 Отсечем анекдоты, собак, чехлы для техники, душевые, больничную тему. Запрос (бокс|боксер|боксерский) ~~ (анекдот|собака|больничный|медицинский |душевая|чехол) выдаст более релевантные документы. После нескольких проверок запрос можно улучшить еще. Пример запроса 2 Например, нужно найти резюме жителей Москвы со знанием французского языка, имеющих опыт работы с Windows, Linux. При этом уровень знания французского языка имеет первостепенное значение. Строим запрос — $title(резюме) && +(москва | !495) && +французский && +linux && +windows Пример запроса 2 $title(резюме) && +(москва | !495) && +французский && +linux && +windows =«В заголовке должно быть слово «резюме», а в пределах одного документа – слова: «москва» (или код города 495), «французский», «linux», «windows» в точной словоформе» Проблема ПС так выбирает слова для аннотации результатов поиска, что слово «французский» попадает в них редко — придется открывать все страницы. Или слово «французский» играет второстепенное значение, так что смысл документов не соответствует запросу. Переформулируем… Пример запроса 2 Можно воспользоваться оператором <<: +французский << ($title(резюме) && +(москва | !495) && +linux && +windows) Теперь слово «французский» будет иметь первостепенное значение для ранжирования, но при этом остальные слова тоже играют роль в результатах поиска. Пример запроса 3 Если вы ищете описание мумие, но не хотите наталкиваться на прайсы интернетмагазинов, можете задать такой запрос: мумие << (лечение|лечебный|болезни) ~~ (цена|прайс|рубль|доллар|фирма|магазин) Будут найдены все страницы, где есть слово мумие, а также любое из слов лечение, лечебный или болезни, и нет ни одного из слов, перечисленных после оператора ~~. Практическое задание Создайте запрос для поиска резюме жителя Перми, обладающего опытом верстки и предпечатной подготовки, владеющего программами графического пакета Adobe. Создайте запрос для поиска вакансии в пермских СМИ, службах PR и рекламных агентствах для работы по гибкому графику. Пример запроса 4 «Запрос пресс-службы»: у журналистов и работников служб PR существует необходимость создавать запросы для отслеживания публикаций и документов в интернете, связанных с определенной компанией и ее руководителем. Очевидно, что в запросе должны присутствовать все варианты названия компании и имя руководителя. Пример запроса 4 Сформулируем запрос для ПГУ: (пгу|пермгу|(пермский /+1 (государственный|классический) /+1 университет)) && (маланин|(владимир /1 маланин)) Как видно, запрос учитывает четыре варианта названия вуза и два варианта упоминания имени ректора. Пример запроса 4 Существует один нюанс: в результатах поиска присутствуют документы с официального сайта университета www.psu.ru Чтобы отсечь эти документы, добавим в конце запроса ~~ url=«www.psu.ru*» Практическое задание Создайте «запрос пресс-службы» для известной Вам компании. Учитывайте русской и английское написание названия, аббревиатуры, сокращенное и полное имя руководителя. Кроме этого, можно ограничить запрос темой документа, упоминанием региона и т.п. Практическое задание «Переведи запрос» «Переведи запрос» Сначала перед Вами появится запрос, описанный «естественным» языком. Ваша задача – «перевести» описание на язык запросов. После этого Вы увидите, наоборот, формализованный запрос. Ваша задача – сделать обратный перевод на «естественный» язык. Запрос 1 Необходимо найти документы со словами «новый» или «анонсировал», или «представил», или «появился» и словами «гаджет» или «устройство», или «девайс», или «аппарат». Запрос 2 тхэквандо|тэквадно|таэквандо|тхеквандо Запрос 3 Необходимо найти документы со словами «биография» или «жизнь» в заголовке, чтобы в тексте были слова «розинг» или «зворыкин» в точной словоформе; слова «изобретение», «телевидение», «электронно-лучевая трубка» в любой словоформе. Запрос 4 ((фехтование|фехтовальщик|фехтовать) && сабля) | саблист Запрос 5 Необходимо найти документы со словами «прежнее» и «название» друг за другом или «называлась», или «переименовали» и словами «советский» и «спорт» друг за другом – в одном предложении. Запрос 6 (спортивная /1 гимнастика | (гимнаст|гимнастка|гимнастика)) && (конь|кольца|брусья|опорный /1 прыжок) Источники информации Язык запросов. Как искать? Помощь Яндекса. http://www.yandex.ru/search/?id=4819 39 © И.М. Печищев