Создание микроформата разметки пиктограмм

advertisement
УДК 004.896(06) Интеллектуальные системы и технологии
М.Н. ГРАНИН, И.В. БЫЧКОВ
Институт динамики систем и теории управления СО РАН, Иркутск
СОЗДАНИЕ МИКРОФОРМАТА РАЗМЕТКИ ПИКТОГРАММ
Для решения задачи аннотирования пиктограмм в веб-страницах предложен
микроформат hIcon, и его расширение на основе RDFa. Разработана архитектура
сервиса рекомендации пиктограмм, использующая созданный микроформат.
Семантическая паутина, то есть сеть данных, которые могут быть обработаны машинами, в настоящее время постепенно находит свое приложение в практических задачах. В связи с этим все большую актуальность
приобретает проблема семантического описания информации содержащейся в изображениях, а также информации о пользовательских интерфейсах локальных и веб-приложений. Основным носителем информации
среди графических элементов интерфейса являются компьютерные пиктограммы (далее пиктограммы). В связи с активным развитием технологий
аннотирования изображений, проблема аннотирования пиктограмм в Сети
Интернет становится все более актуальной. Данная работа является частью более крупного проекта целью, которого, является создание языка
семантического описания пиктограмм IcoML [1], и основана на разработанной ранее модели пиктограмм.
Задача наших исследований в области Семантической паутины научить компьютер распознавать пиктограммы или коллекцию пиктограмм на веб-странице, на основе разметки, которая будет понятна пользователям, публикующим содержание и интерфейсы в интернете. Исходя
из анализа требований и существующих возможностей решения, было
решено построить микроформат.
Микроформаты [2] — часть языка разметки, которая позволяет помечать семантику в веб-страницах на HTML или XHTML. Разработка грамматики микроформата велась в соответствие с процессом создания микроформата, описанном сообществом Microformats.org. Для выделения основных элементов грамматики микроформата используется частотный
анализ использования однотипных структур в различных веб-документах
публикующих однотипную информацию.
Серьезной проблемой является то, что практически невозможно одновременно использовать различные микроформаты на одной странице. Отчасти это связано с такими проблемами, как отсутствие механизма пространств имен, отсутствие области видимости, а также с тем, что элементы грамматики часто используют повторно, и они совпадают в различных
ISBN 978-5-7262-0883-1. НАУЧНАЯ СЕССИЯ МИФИ-2008. Том 10
174
УДК 004.896(06) Интеллектуальные системы и технологии
микроформатах. Использование микроформатов может порождать замкнутый круг. Если малое количество авторов публикуют определенное
свойство, то это свойство, вероятно, не попадет в микроформат. Если же
это свойство не опубликовано, то авторы, по-видимому, и в дальнейшем
не будут его публиковать. В результате микроформат решает проблемы
лишь массового пользователя и не дает новых решений новаторам. Решением этой проблемы может быть использование стандарта RDFa, который
поддерживает области видимости и механизм пространства имен без дополнительных трудностей. Оно также позволяет улучшать микроформат
без необходимости поиска существующих устоявшихся примеров использования.
В соответствии с процессом создания микроформата был создан микроформат hIcon. Для расширения возможностей микроформата, в частности публикации новых свойств в hIcon, создан hIcon RDFa. В качестве
примера использующего созданный микроформата, разработана архитектура сервиса рекомендации пиктограмм. Основная проблема, решаемая
сервисом рекомендации пиктограмм: подбор разработчиком пиктограмм
из различных источников. Часто вне текущего контекста (коллекции или
интерфейса) пользователь не может найти все требуемые ему в интерфейсе пиктограммы и вынужден искать их в других источниках. При этом не
существует инструментов, которые позволяли бы отфильтровать результаты дальнейшего поиска, оставив лишь пиктограммы, сочетающиеся по
стилю и техническим требованиям с уже выбранными. В дальнейшем
планируется реализовать предложенную архитектуру в сервисе рекомендации пиктограмм, а также создать расширение для браузера FireFox, которое позволит автоматически определять на страницах пиктограммы, а
также будет непосредственно обмениваться данными с сервисом рекомендации пиктограмм.
Список литературы
1. Гранин М.Н., Бычков И.В. Язык разметки компьютерных пиктограмм IcoML как инструмент описания информации в семантической сети // Вычислительные технологии. 2007,
Том 12. № 1. С. 13-21.
2. Allsopp J. Microformats: Empowering Your Markup for Web 2.0: Apress, 2007. 345 c.
ISBN 978-5-7262-0883-1. НАУЧНАЯ СЕССИЯ МИФИ-2008. Том 10
175
Download