УДК 004.896(06) Интеллектуальные системы и технологии М.Н. ГРАНИН, И.В. БЫЧКОВ Институт динамики систем и теории управления СО РАН, Иркутск СОЗДАНИЕ МИКРОФОРМАТА РАЗМЕТКИ ПИКТОГРАММ Для решения задачи аннотирования пиктограмм в веб-страницах предложен микроформат hIcon, и его расширение на основе RDFa. Разработана архитектура сервиса рекомендации пиктограмм, использующая созданный микроформат. Семантическая паутина, то есть сеть данных, которые могут быть обработаны машинами, в настоящее время постепенно находит свое приложение в практических задачах. В связи с этим все большую актуальность приобретает проблема семантического описания информации содержащейся в изображениях, а также информации о пользовательских интерфейсах локальных и веб-приложений. Основным носителем информации среди графических элементов интерфейса являются компьютерные пиктограммы (далее пиктограммы). В связи с активным развитием технологий аннотирования изображений, проблема аннотирования пиктограмм в Сети Интернет становится все более актуальной. Данная работа является частью более крупного проекта целью, которого, является создание языка семантического описания пиктограмм IcoML [1], и основана на разработанной ранее модели пиктограмм. Задача наших исследований в области Семантической паутины научить компьютер распознавать пиктограммы или коллекцию пиктограмм на веб-странице, на основе разметки, которая будет понятна пользователям, публикующим содержание и интерфейсы в интернете. Исходя из анализа требований и существующих возможностей решения, было решено построить микроформат. Микроформаты [2] — часть языка разметки, которая позволяет помечать семантику в веб-страницах на HTML или XHTML. Разработка грамматики микроформата велась в соответствие с процессом создания микроформата, описанном сообществом Microformats.org. Для выделения основных элементов грамматики микроформата используется частотный анализ использования однотипных структур в различных веб-документах публикующих однотипную информацию. Серьезной проблемой является то, что практически невозможно одновременно использовать различные микроформаты на одной странице. Отчасти это связано с такими проблемами, как отсутствие механизма пространств имен, отсутствие области видимости, а также с тем, что элементы грамматики часто используют повторно, и они совпадают в различных ISBN 978-5-7262-0883-1. НАУЧНАЯ СЕССИЯ МИФИ-2008. Том 10 174 УДК 004.896(06) Интеллектуальные системы и технологии микроформатах. Использование микроформатов может порождать замкнутый круг. Если малое количество авторов публикуют определенное свойство, то это свойство, вероятно, не попадет в микроформат. Если же это свойство не опубликовано, то авторы, по-видимому, и в дальнейшем не будут его публиковать. В результате микроформат решает проблемы лишь массового пользователя и не дает новых решений новаторам. Решением этой проблемы может быть использование стандарта RDFa, который поддерживает области видимости и механизм пространства имен без дополнительных трудностей. Оно также позволяет улучшать микроформат без необходимости поиска существующих устоявшихся примеров использования. В соответствии с процессом создания микроформата был создан микроформат hIcon. Для расширения возможностей микроформата, в частности публикации новых свойств в hIcon, создан hIcon RDFa. В качестве примера использующего созданный микроформата, разработана архитектура сервиса рекомендации пиктограмм. Основная проблема, решаемая сервисом рекомендации пиктограмм: подбор разработчиком пиктограмм из различных источников. Часто вне текущего контекста (коллекции или интерфейса) пользователь не может найти все требуемые ему в интерфейсе пиктограммы и вынужден искать их в других источниках. При этом не существует инструментов, которые позволяли бы отфильтровать результаты дальнейшего поиска, оставив лишь пиктограммы, сочетающиеся по стилю и техническим требованиям с уже выбранными. В дальнейшем планируется реализовать предложенную архитектуру в сервисе рекомендации пиктограмм, а также создать расширение для браузера FireFox, которое позволит автоматически определять на страницах пиктограммы, а также будет непосредственно обмениваться данными с сервисом рекомендации пиктограмм. Список литературы 1. Гранин М.Н., Бычков И.В. Язык разметки компьютерных пиктограмм IcoML как инструмент описания информации в семантической сети // Вычислительные технологии. 2007, Том 12. № 1. С. 13-21. 2. Allsopp J. Microformats: Empowering Your Markup for Web 2.0: Apress, 2007. 345 c. ISBN 978-5-7262-0883-1. НАУЧНАЯ СЕССИЯ МИФИ-2008. Том 10 175