вар 1x

advertisement
Конспект открытого урока для обучающихся по профессии
09.01.03 Мастер по обработке информационных технологий
Составитель: Каратай Алан Аликович – мастер производственного обучения
План-конспект урока по мдк 02.01
Тема урока: «Поисковые системы и каталоги»
Тип занятия: «лекция»
Цели урока: Дать представление:



о видах поисковых систем и их различии;
о принципах работы поисковых указателей;
о видах поиска (простой, расширенный, специальный;
Материальное обеспечение:



подготовленная доска;
рабочая тетрадь;
компьютеры;
Структура учебного занятия:
1.
2.
3.
4.
Организация начала занятия.
Преподнесение, обобщение и систематизация знаний и способов действий.
Применение полученных знаний при выполнении индивидуальных заданий.
Подведение итогов.
Ход урока
1.
Организация начала занятия. Сообщение темы и целей урока. Формулировка
проблемы. Учитель сообщает учащимся тему и цели урока, формулирует проблему,
обеспечивает нормальную внешнюю обстановку для работы на учебном занятии.
2. Преподнесение, обобщение и систематизация знаний и способов
действий.
Сегодня важнейшей составляющей образованности человека является свободное владение
информационными технологиями, так как деятельность людей все в большей степени
зависит от информированности и способности эффективно использовать информацию.
Квалифицированный специалист любого профиля (как технического, так и гуманитарного)
должен уметь находить (извлекать), обрабатывать и использовать информацию с помощью
компьютеров и других вычислительных и телекоммуникационных средств. Знания
информатики и информационных технологий - необходимые требования профессиональной
пригодности в XXI веке.
Поиск информации в Интернет – второй по востребованности из сервисов Интернет (первое
место по праву занимает электронная почта). Навыки поиска информации сейчас
необходимы каждому пользователю Интернет. Сеть – неиссякаемый источник информации
любого рода. По оценке фирмы Caspian Networks, объем информации, передаваемой по
каналам Интернет, удваивается каждые полгода. Более того, наблюдается тенденция роста
трафика. Получить элементарные навыки поиска информации в Интернет, правильно
организовать свою работу в Сети, сэкономив тем самым время и деньги, помогут несколько
уроков, посвященных этой теме.
Предположим, что на одном из узлов Всемирной Паутины лежит информация – "нечто", и
это "нечто" Вам действительно необходимо, Вам без него просто никак. Каковы Ваши шансы,
что это "нечто" Вам в конечном итоге достанется? От чего зависит ответ на этот вопрос? Если
Вам известно, где оно лежит, проблем, скорее всего, не возникнет. Если же Вам известно
лишь то, что это "нечто" собой представляет, да и то весьма расплывчато, то все равно
отчаиваться рано. Существует великое множество помощников - каталогов и поисковых
серверов, и если тот, кто выложил в Internet нужную Вам информацию, не поленился
поведать о ней миру, то все будет зависеть от Вашей настойчивости и опыта. При этом, чем
больше у Вас опыта общения с системами поиска, тем меньше потребуется настойчивости.
Большинство систем поиска являются по сути тематическими каталогами. Пользоваться ими
не сложнее, чем телефонными справочниками, а в разделе "Поиск в Internet" они в основном
перечисляют друг друга и те немногие серверы, которые действительно систематически
прочесывают единое информационное пространство Internet, анализируют содержимое
документов и сохраняют результаты анализа в своих базах данных, позволяющих
осуществлять быстрый и эффективный поиск по ключевым словам.
Как заставить поисковый сервер понять, что вам действительно нужно? Как не получать в
ответ на свой запрос ноль или три миллиона найденных ссылок? Как не получать в ответ на
запрос о рецепте торта «Наполеон» тысячи ссылок на биографию Наполеона Бонапарта?
Самый простой способ использования поискового сервера заключается в поиске по
некоторому набору ключевых слов, и если Вы угадали такой набор, на который сервер
отозвался всего двадцатью ссылками, и среди них оказалась нужная Вам, да еще и не
устаревшая (бывает, что отмирают документы, а то и целые сервера), значит Вам либо просто
повезло, либо вы уже очень грамотный пользователь и можете смело проходить итоговое
тестирование по предлагаемому курсу.
Итак, для удобства работы в World Wide Web существуют так называемые поисковые службы
(или информационно-поисковые системы). Их задача – предоставить пользователю адреса
web-страниц, по которым можно найти интересующую его информацию.
Можно разделить все информационно-поисковые системы на три вида:
1. поисковые каталоги
2. рейтинговые системы
3. поисковые указатели
Это разделение сейчас условно, потому что любой поисковый каталог сейчас обязательно
предлагает и услуги поискового указателя (иногда употребляется слово "поисковик"). И
наоборот, многие поисковики предлагают заранее сузить область поиска, выбрав ту или
иную тему или область поиска. Однако по результатам поиска между каталогами и
указателями есть существенная разница.
Поисковые каталоги – устроены по тому же принципу, что и тематические каталоги
крупных библиотек. Обратившись по адресу поискового каталога, вы найдете на его
основной странице сокращенный список крупных тематических категорий, например
ОБРАЗОВАНИЕ. Каждая запись в списке – это гиперссылка – далее более подробный
каталог и так далее вплоть до конкретного списка веб-страниц. Таким образом, с помощью
каталога можно достаточно быстро найти несколько сайтов, содержащих информацию по
интересующей вас теме. На самих сайтах нужные страницы придется отыскивать
самостоятельно. Особенность работы поисковых каталогов обуславливает то, что проводить с
их помощью поиск информации по узконаправленной тематике может оказаться
нецелесообразным.
Поисковые каталоги создаются вручную. Редакторы лично просматривают пространство
WWW, отбирают то, что на их взгляд представляет общественный интерес и заносят
соответствующие адреса в каталог.
Вы можете ознакомиться с работой поисковых каталогов по следующим
адресам , , (Продемонстрировать соответствующие сайты и привести примеры запросов)
Рейтинговые системы - организованы проще, чем поисковые каталоги. Принцип работы
заключается в том. что на основной странице сервера выкладывается список наиболее
важных тем, внутри каждой из которых организуется список тематических разделов. Выбрав
тему, пользователь получает список web-узлов по ней. Напротив каждого web-узла
приводится его оценка популярности, измеряемая в количестве посещений за последние
сутки. То есть поиск в рейтинговых системах происходит с ориентацией на рейтинг. Это
поиск «по рекомендации». Ведь если другие пользователи регулярно посещают
определенный web-узел, значит, имеющаяся на нем информация, скорее всего окажется
интересной и для вас.
Вы можете ознакомиться с работой рейтинговых систем по следующим адресам , .
(Продемонстрировать соответствующие сайты и привести примеры запросов)
Преимущество рейтинговых систем заключается в том, что с их помощью можно быстро
найти адреса наиболее посещаемых сайтов по интересующей теме и при этом быть
уверенным в том, что ни один из популярных ресурсов не пропущен.
Недостатки рейтинговых систем:


даже наиболее крупные рейтинги содержат ссылки лишь на несколько десятков (реже сотен) тысяч web-узлов; значительная часть имеющейся в Сети информации находится вне
поля их внимания;
если интересующая пользователя тема не относится к числу популярных, рейтинги,
фактически, окажутся вообще бесполезными.
Поисковые указатели – это большинство поисковых служб мира. Принцип работы
основан на ключевых словах. Они задаются поисковой системе пользователем в качестве
задания в специальном поле (строке) поиска. Поисковая система находит по своим базам
данных (называемым индексами или указателями) адреса веб-ресурсов, в которых
присутствуют ключевые слова, и выдает клиенту веб-страницу со ссылками на эти ресурсы.
Такая веб-страница называется результирующей.
Вы можете ознакомиться с работой поисковых указателей по следующим адресам: , , , , и
другие. (Продемонстрировать соответствующие сайты и привести примеры запросов)
Работа поисковых указателей происходит в четыре этапа:
1.
Сканирование веб-пространства.
Поисковая система круглосуточно с помощью специальных программ просматривает
доступное пространство Web и копирует к себе все встреченные страницы. Сканирование
осуществляется с помощью специальных программных средств. Их общее название –
поисковые роботы (еще – черви, гусеницы, краулеры). Каждый поисковый указатель имеет
свою собственную программу, основанную на патентованном алгоритме. Но общий
принцип действия один:
o
o
o
o
o
поисковые роботы начинают просмотр Сети с какого-то заданного адреса
копируют найденный документ на сервер своей системы
посматривают его, находят в нем все гиперссылки
переходят по ним, находят новые документы, копируют их, находят в них
гиперссылки. переходят по ним и т.д.
периодически роботы возвращаются к ранее просмотренным документам, чтобы
отследить изменения. Об изменениях они узнают по размеру и дате создания
документа.
2. Индексация ресурсов.
Обнаруженные поисковыми роботами страницы обрабатываются специальными
программными средствами и из них составляется специальная база данных, именуемая
указателем. Цель индексации – получить индексный файл, с помощью которого запрос
клиента обрабатывается почти мгновенно. Каждая система проводит индексацию по своим
алгоритмам, которые являются коммерческой тайной.
3. Поиск по запросу.
Поисковый указатель принимает запрос от пользователя в виде ключевых слов и отбирает
ссылки на те ресурсы, которые соответствуют запросу. Высокая скорость поиска
обеспечивается за счет первых двух этапов своей работы, благодаря которым поисковая
машина при обработке запроса пользователя обращается не в Сеть, а в свою базу данных.
Количество найденных страниц может быть очень велико, поэтому перед выдачей
результатов клиенту происходит ранжирование результатов поиска. То есть система
определят ценность каждого из найденных ресурсов и отсортировывает их так, чтобы
наиболее ценные располагались в начале списка. Для этого каждому ресурсу дается
оценка. На повышение оценки влияют следующие факты:
o
o
o
o
если ключевые слова встречаются в заголовке Web-страницы – это значит, что
страница действительно посвящена той теме, которую исследует пользователь
если ключевые слова, обнаруженные в документе, имеют шрифт увеличенного
размера – это говорит о том, что они входят в заголовки разделов документов
если ключевые слова неоднократно повторяются внутри документа (особенно, если
в первых 5-8 абзацах текста)
если ключевые слова входят в так называемый альтернативный текст (тот. который
подменяет иллюстрации, если их изображение отключено). Это значит, что
пользователь придает им особое значение.
4. Формирование результирующей страницы.
Система формирует динамическую web-страницу оформленных результатов поиска.
Сопоставление поисковых указателей и каталогов
Сравниваемые показатели
Поисковые
указатели
Поисковые
каталоги
неадекватность ссылок (ссылка ведет к
документу, не соответствующему теме
поиска)
есть
нет
неактуальность ссылок (ссылка указывает на
документ, которого уже не существует)
есть
нет
дублирование ссылок (несколько ссылок ведет
к одинаковым документам. хранящимся в
разных местах)
есть
нет
коэффициент охвата (то есть какую часть
общемировых ресурсов WWW отражает
поисковая система в своих базах данных)
высокий
низкий
коэффициент попадания (то есть какая часть
низкий
высокий
ссылок, возвращаемых поисковой системой,
действительно соответствует ожиданиям
клиентам)
Приемы простого поиска
1.
Поиск группы слов
Слова "открытое" или "образование" дадут при поиске поодиночке большое число
разнообразных ссылок, относящихся к совершенно различным темам, причем вряд ли
имеющим отношение к "открытому образованию". Поэтому рекомендуется добавлять одно
или два ключевых слова, связанных с искомой темой. Например, "открытое образование"
или "технологии открытого образования". Необходимо также сужать область вопроса. Если
необходимо найти информацию об автомобилях марки Ford, то запрос "автомобиль Ford"
выдаст более подходящие документы, чем "легковые автомобили". Количество слов в
группе не ограничивается.
2. Поиск словоформ
В большинстве случаев поисковая система по умолчанию ищет все словоформы языка.
Однако, можно указать поисковой системе не перебирать все словоформы слов из запроса
при поиске. Во многих системах для этого используется восклицательный знак. Например,
запрос "!кошкин" с большой вероятностью найдет страницы, цитирующие строчку из
стихотворения "Кошкин дом".
3. Роль прописных букв
В случае если пользователь ввел в качестве запроса ключевое слово с прописной буквы,
поисковая машина не найдет страниц, где содержится это слово, начинающееся со
строчной буквы Поэтому заглавные буквы в запросе рекомендуется использовать только в
именах собственных. Например, "город Москва", "Филипп Киркоров ".
4. Значение подстановочных символов
Когда нет уверенности в том, что поисковая система правильно обрабатывает словоформы
(то есть когда речь идет, например, об именах собственных или словах иностранного
происхождения) поисковые системы позволяют использовать подстановочные символы.
Чаще всего это символ "*" вместо любого количества любых символов до конца слова.
Например, если пользователь хочет найти страницы, содержащие слова "республика
Татарстан", но устроит и Татарская республика, тогда надо подать запрос "республика
Татарс*".
5.
Учет зарезервированных слов
Зарезервированными словами (стоп-словами) считаются те слова, которые не учитываются
при поиске. Обычно к ним относятся все короткие слова, в которые входят менее 4 букв
(предлоги, союзы и т.п.). Например при запросе "мы в Италии" будут найдены документы,
в которые входит слово "Италии" или его словоформы.
6. Средства контекстного поиска
Если ключевые слова взять в кавычки, то поисковая система должна найти документы, в
которых данная фраза присутствует буквально (поиск цитаты).
Приемы расширенного поиска
Для более быстрого и успешного поиска в поисковых машинах совместно с ключевыми
словами используются различные логические операторы. Благодаря этому можно
сконструировать запрос так, что будут найдены не сайты на интересующую тему, а
конкретные страницы и даже отдельные документы. Правила составления сложных
запросов на одном поисковой машине могут отличаться от таковых на другой, но в любом
случае будут использоваться следующие основные операторы:
1.
Оператор И (AND)
С помощью этого оператора объединяют два или более слов так, чтобы они все
присутствовали в искомом документе. Часто вместо И используют & или +. Пример: по
запросу Красная И Шапочка будут найдены документы, содержащие и то и другое слово.
2. Оператор ИЛИ (OR)
Обеспечивает поиск по любому из слов группы. Пример: по запросу образование ИЛИ
обучение будут найдены документы, содержащие слово образование или обучение.
3. Логические скобки
Применяются, когда надо управлять порядком следования логических операторов.
Пример: по запросу Ломоносов ИЛИ (Михаил И Васильевич) будут найдены документы,
содержащие слова Ломоносов или Михаил И Васильевич.
4. Оператор НЕ (NOT)
Используется, когда из результатов поиска надо исключить какое-либо ключевое слово.
например по запросу Млекопитающие НЕ хищники будет найдена информация о
млекопитающих, не являющихся хищниками.
5.
Оператор БЛИЗКО (NEAR)
Поиск с указанием расстояния. Он позволяет указать, на каком расстоянии друг от друга
могут располагаться слова в документе. Синтаксис такого запроса различен у разных
поисковых систем.
Средства специального поиска
Позволяют выполнять поиск документов по:





датам;
по ссылкам на определенный адрес;
по заголовкам веб-страниц;
по доменному имени сервера;
и др.
Все средства поиска реализуются при помощи так называемого языка запросов. Языки
запросов разных поисковых систем незначительно отличаются друг от друга. Для примера
на следующем уроке приведем синтаксис языка запросов поисковой системы Yandex.
3. Применение полученных знаний при выполнении индивидуальных заданий.
1.
Всем студентам предлагается попробовать найти ответы на 2-3 вопроса (общих для всей
группы).
2. Каждому из студентов предлагается найти ответы на 2 индивидуальных вопроса, используя
рейтинговые системы, каталоги или указатели (по усмотрению ученика)
Примеры вопросов:
1. Сколько томов в романе Л.Н. Толстого «Война и мир»?
2. Что такое вертикальные углы?
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
Какая из статуй выше - Родина-Мать в Волгограде или Христа в Рио-де-Жанейро?
На какой олимпиаде сборная СССР по футболу завоевала золотую медаль?
Кто и когда изобрел шариковую ручку?
Чем смерч отличается от торнадо?
Сколько официальных языков в ЮАР?
Сколько видов попугаев существует в мире?
Сколько гражданских чинов было в Табеле о рангах?
Сколько человек в истории России было удостоено звания генералиссимус?
Какова продолжительность железнодорожного переезда Саратов-Москва на скором
поезде №9?
Сколько всего стран в мире?
Существует ли в мире море, название которого начинается с буквы "В"?
Кто является автором слов "Счастлив тот, кто счастлив у себя дома"?
Что такое цитоплазма?
4. Подведение итогов урока.
Учитель объявляет оценки учащимся, комментирует при этом ошибки и недочёты
учащихся, выделяет особенно удачные ответы, оценивает как работу группы в целом, так и работу
отдельных учащихся.
5. Домашнее задание.
Учитывая, что необходимые и достаточные условия для успешного выполнения домашнего
задания всеми учащимися были созданы на уроке, учащимся предлагается придумать
занимательные вопросы в качестве заданий для поиска своим одногрупникам и попытаться найти
ответы на них в Интернет (если позволяют условия).
Download