ГРУППИРОВКИ РЕЗУЛЬТАТОВ ПОИСКА ПО ТЕМАТИЧЕСКИМ РАЗДЕЛАМ Не менее важной проблемой при поиске информации в сети является проблема группировки этой информации по тематическим разделам. База данных поисковой системы содержит текстовое содержание всех сайтов, которые были проиндексированы данной поисковой системой. Когда пользователь вводит поисковый запрос, происходит поиск в этой базе данных по алгоритму данной поисковой системы. Часто возникают ситуации, когда пользователю приходится уточнять условия поискового запроса для нахождения данных, наиболее точно отвечающих требованиям. Например, если пользователь ищет выражение «красное дерево» (по результатам тестирования поисковой системы Yandex), то получает огромный список сайтов магазинов мебели из красного дерева, а на самом деле ему необходима была информация из области ботаники. Удобней было бы, если пользователь, в результате поиска, сначала видел список разделов, к которым относятся результаты поиска. Например: 1) Наука > Ботаника (15 сайтов) 2) Торговля > Продажа мебели (79 сайтов) 3) Ремесло > Резьба по дереву (3 сайта) 4) Другое (16 сайтов) Каталоги ресурсов разбиты на разделы, но у них есть существенный недостаток — они заполняются непосредственно человеком. Как следствие — низкая насыщенность таких каталогов, потому что большинство сайтов базы данных поисковой системы остаются не включенными в каталог. Предлагается разработать специальный алгоритм, который позволит уже на этапе поиска информации решать задачу разбиения данных по различным тематикам, и формирования тематических разделов. Будет осуществляться анализ содержания найденных сайтов, проводиться сравнение и выявление закономерностей, по которым можно будет формировать тематические разделы. Список разделов (тематик) и их признаков будет определяться заранее, как можно точнее и детальней, и, по возможности, редактироваться и дополняться в дальнейшем. Цель исследования — разработка интеллектуального алгоритма анализа результатов поиска содержимого базы данных поисковой системы для группировки найденных данных по тематическим разделам. Это существенно повысит удобство использования поисковых систем и эффективность поиска. ЛИТЕРАТУРА: 1. 2. 3. 4. Курицкий А.Б. Интернет: инфраструктура информационного общества. СПб.: Судостроение, 1999. Байков В. Интернет. Поиск информации. СПб.: BHV, 2000. http://www.citforum.ru/pp/search_03.shtml http://www.yspu.yar.ru/projects/infomet/search/index.htm WEB-ДИЗАЙН ДЛЯ БАЗЫ ДАННЫХ ОРНАМЕНТОВ Т.В. Кочева Отдел физических проблем при Президиуме Бурятского научного центра СО РАН г. Улан-Удэ База данных орнаментов (БДО) создавалась как инструмент изучения и сохранения орнамента народов Центральной Азии для исследователей, художников, учащихся. И она выполняет эти задачи, однако представление данных и изображений в виде таблиц не вполне уже нас устраивает. Нами была разработана собственная структура физической модели базы данных в среде Delphi [1]. Рабочая область базы данных состоит из четырех окон: два окна для текстовой информации и два для изображений мотивов и композиций. Таким образом, экран монитора получается разделённым на четыре почти равные части, причём слева располагаются текстовые таблицы с описаниями, а справа — изображения мотива (сверху) и композиции (внизу). Однако прокручивание текстовых комментариев к изображениям, которые для мотивов орнаментов имеют 70 позиций, а для композиций узоров — 56, недостаточно удобно. Поэтому для улучшения восприятия и повышения удобства пользователей было решено воспользоваться возможностями Web-дизайна [2]. Инструментальная среда Delphi предоставляет мощные средства для быстрой разработки сложных Webприложений. В Delphi имеются специальные компоненты, генерирующие информацию из БД на HTMLстраницы. Поскольку мы планируем относительно редкое обновление данных в БД, необходимо 46 VIII Всероссийская объединенная конференция использовать инструмент статической публикации в Интернете, при этом информация из БД помещается в HTML-документ, который хранится постоянно в файле на диске [3]. Согласно ГОСТ 7.83-2001 [4] «Межгосударственный стандарт. Система стандартов по информации, библиотечному и издательскому делу. Электронные издания. Основные выходы и выходные сведения» создаваемый продукт является самостоятельным электронным изданием как не имеющий печатных аналогов, и по природе основной информации относится к мультимедийным электронным изданиям. По целевому назначению БДО будет научным изданием, но мы надеемся, что наш стиль изложения материалов будет достаточно понятен и неспециалистам в области искусствознания и искусствоведения, — учащимся различного уровня образования, художникам, этнологам, т.е. будет приближен к научно-популярным изданиям. Отдельные специальные вопросы, например, классификация мотивов и композиций по виду фона — негативный или позитивный, контура — заполненный или незаполненный; пространственные характеристики — по технике исполнения и визуальному восприятию, а также степень сложности изображения, — могут быть вынесены в отдельный раздел. Классификация мотивов и композиций орнаментов по всем остальным параметрам интуитивно понятна всем. По технологии распространения это будет издание комбинированного распространения, которое может использоваться как в качестве локального, выпускающееся в виде определенного количества идентичных экземпляров (тиража) на переносимых машиночитаемых носителях, так и в качестве сетевого. По характеру взаимодействия пользователя и электронного издания планируется создание недерминированного (интерактивного) электронного издания: Параметры, содержание и способ взаимодействия с БДО прямо или косвенно будет устанавливаться пользователем в соответствии с его интересами, целью, уровнем подготовки и т.п. на основе информации и с помощью алгоритмов, определённых нами. По периодичности это будет обновляемое электронное издание. База данных орнаментов постоянно пополняется, потому по мере накопления достаточного количества новой информации мы будем её обновлять. База данных «Орнаменты Центральной Азии» зарегистрирована в Государственном реестре баз данных в 2002 г. под № 0220208860, заявленный период обновления — 1 год. Каждый выпуск будет иметь одинаковое заглавие и частично повторяющееся содержание, полностью заменяющее предыдущий. Электронное издание будет содержать несколько взаимосвязанных страниц. Кроме названия проекта и выходных данных, которые будут присутствовать на главной странице, там будет располагаться и карта сайта, открывающая доступ к БДО и другой сопутствующей информации. На сайте обязательно будет присутствовать обзорная статья по орнаменту, ссылки на различные источники — как печатные, так и электронные. Узоры в БДО условно разделены на две большие группы: мотивы и композиции. И, если исходить из визуального ряда, необходимо сделать так, чтобы на экране выбирался мотив, допустим, в алфавитном порядке, а вокруг него располагались соответствующие ему композиции. При указании на любой графический объект должна появляться гиперссылка с его описанием по классификационным признакам, содержащимся в БД. Здесь возникает несколько проблем. Во-первых, названия мотивов и композиций в БДО на данный момент несколько условны. Если мотив имеет устойчивое собственное имя, он так и записывается, например, «улзы», «огонь», «раковина» и т.д. Однако, например, такой мотив, как «рога», представлен в БДО пятнадцатью различными изображениями, отличающимися иногда весьма значительно. И названия этим «рогам» мы давали условные, вплоть до перечисления от «рога1» до «рогаN». Также у нас есть несколько вариантов завитков, плетёнок и других мотивов. Унифицированных наименований нет, поэтому нужна совместная работа искусствоведов, историков искусства, лингвистов для уточнения названий. Что касается именования композиций, — для удобства собственной работы мы называли рисунки по источнику, причём часто сокращенно. Впрочем, для образцов композиций названия, может быть, и не так важны, важно просто увидеть, как определённый мотив вписывается в тот или иной узор. Вторая проблема в представлении БДО широкой публике состоит в том, что разные мотивы имеют различное количество соответствующих им композиций, например, мотиву «завиток» соответствует 55, а мотиву «арбагар» — 8 записей. Необходимо продумать удобное для изучения расположение всех этих рисунков на экране. Третья задача — это собственно описание того или иного мотива и композиции. Как уже упоминалось, описания содержат множество пунктов в соответствии с разработанной классификацией. И здесь, по нашему мнению, необходимо на основе записей БД генерировать по определённой схеме некий унифицированный текст для каждого рисунка. Те поля, которые имеют уникальные текстовые записи, должны входить в конечный текст полностью, а из полей, предполагающих выбор одного или нескольких значений, необходимо брать только значимые. Например, описание мотива «арбагар», включающее все характеристики БДО, может быть следующим: «Технологии информационного общества — Интернет и современное общество» (IST/IMS-2005) 47 Происхождение: Дата создания Принадлежность: Источник информации: Символ Принадлежность полу: Вид изобразительного элемента: Тип симметрии Переплетение Цвет Фон Контур Мягкие материалы: Твёрдые материалы: Расположение в композиции (круг): Расположение в композиции (прямоугольник) Расположение в костюме: Расположение на других предметах: Пространственные характеристики (по технике исполнения) Пространственные характеристики (по визуальному восприятию) Вид образующих линий Степень сложности изображения Примечания Китай, Индия, Иран; не определена (0); буряты, монголы, тувинцы; Ф.И. Балдаев. Бурятский народный орнамент: Альбом. — Улан-Удэ, 1972. бытовой; не определена (0); зооморфный; 3·n; отсутствует (0); полихромный; негативный (1); заполненный (1); ткань, кожа; дерево, кость, глина, керамика, бумага; центр; рамка; головной убор, одежда, обувь, рукавицы; сумка, ювелирные изделия, посуда, стол, кровать, жилище, плоский; плоский; дуга; не определена; нет Здесь видно, что не все позиции до конца определены, — неизвестна дата возникновения мотива, не обозначена чёткая половая принадлежность узора, не рассчитан индекс сложности. Заметим, что «Дата» и «Индекс сложности» — это те параметры, по которым необходимо проводить дополнительные исследования практически по всем изображениям БДО [4]. Сюда же можно отнести и критерий «Симметрия», который мы указываем по системе А.В. Шубникова [5], — он определён не для всех мотивов. На Web-странице это описание будет выглядеть не столь громоздко, но можно проработать два варианта представления — полный и неполный, касающийся только нескольких основных пунктов классификации, например, принадлежность народу, вид изобразительного элемента, тип симметрии, на какие материалы и предметы наносится. Четвёртой задачей является визуальная организация запросов. Для этого, видимо, одна из страниц будет посвящена используемой нами классификации мотивов и композиций орнаментов. Необходимо так организовать интерфейс, чтобы по щелчку на кнопке пользователь мог легко выбрать то, что его интересует, — узоры для украшения одежды или обуви, или все имеющиеся образцы тувинского, например, орнамента. Ещё одна важная задача — это возможность на основе имеющихся мотивов генерировать собственные узоры. Для этого необходимо, во-первых, все мотивы привести к единому масштабу; во вторых, дать подробные сведения из теории симметрии и возможных композиционных решениях; в третьих, обеспечить сам механизм построения орнамента на экране. На первом этапе в учебных целях можно имитировать создание узоров из отдельных частей наподобие складывания кубиков в интерактивном режиме. Описанный круг задач требует взаимосвязанной работы специалистов из различных областей знаний и дополнительного финансирования, которого мы пока не имеем. Однако внутренняя убеждённость в необходимости осуществления этого проекта должна принести свои плоды, и в обозримом будущем наш ресурс будет представлен на суд широкой общественности. ЛИТЕРАТУРА 1. Кочева Т.В., Кирпичников А.А. База данных народных орнаментов // Культуры и народы Западной Сибири в контексте междисциплинарного изучения. Томск: Изд-во ТГУ, 2005. Вып. 1. С. 245–251. 2. Кирсанов Д. Веб-дизайн: книга Дмитрия Кирсанова. СПб.: Символ-Плюс, 2001. 376 с. 3. Мещеряков Е.В., Хомоненко А.Д. Публикация баз данных в Интернете. СПб.: БХВ-Петербург, 2001. 4. www.internet.ru 5. Шубников А.В., Копцик В.А. Симметрия в науке и искусстве. М.: Наука, 1972. 48 VIII Всероссийская объединенная конференция