ПРАВИТЕЛЬСТВО РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" Пермский филиал Факультет бизнес-информатики Кафедра информационных технологий в бизнесе УДК 004.434+004.91 РАЗРАБОТКА ПРЕДМЕТНО-ОРИЕНТИРОВАННОГО ЯЗЫКА ОПИСАНИЯ СТРУКТУРЫ И СОДЕРЖАНИЯ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ Выпускная квалификационная работа бакалавра Работу выполнил студент группы БИ-10-2 4 курса факультета бизнес-информатики Агалакова Е.З. Научный руководитель: старший преподаватель кафедры информационных технологий в бизнесе Ланин В.В. “_____” Пермь 2014 1 20__ г. Оглавление Основные обозначения и сокращения ...................................................................... 4 Введение ...................................................................................................................... 5 Глава 1. Теоретические аспекты языков описания .................................................. 7 электронных документов ........................................................................................... 7 1.1. Понятие «электронный документ»................................................................ 7 1.2. Обзор существующих способов описания структуры электронного документа ...................................................................................................................... 12 1.2.1. Документы HTML формата .................................................................. 14 1.2.2. Документы SGML формата .................................................................. 15 1.2.3. Документы XML формата .................................................................... 16 1.2.4. Результаты обзора существующих способов описания структуры электронного документа ........................................................................................... 17 1.3. Обзор существующих способов описания документов ............................ 18 1.3.1. Подход Dublin Core ............................................................................... 21 1.3.2. Проект SHOE ......................................................................................... 22 1.3.3. Онтология проекта исследовательской группы KWARC ................. 23 1.3.4. Онтология DoCO ................................................................................... 24 1.3.5. Результаты обзора способов описания документов ........................... 24 1.4. Требования к разрабатываемому предметно-ориентированному языку. 25 1.5. Понятие предметно-ориентированного языка ........................................... 27 1.6. Обзор методов и средств разработки предметно-ориентированных языков 28 Глава 2. Разработка предметно-ориентированного языка описания структуры и содержания электронных документов ........................................................................... 34 2.1. Описание элементов электронного документа в EDocSACD .................. 34 2.2. Описание реквизитов электронного документа в EDocSACD ................. 38 2.3. Описание видов электронного документа в EDocSACD .......................... 45 2.4. Разработка модели описания структуры и содержания электронного документа ...................................................................................................................... 51 2.4.1. Пример: приказ о зачислении на 1 курс .............................................. 52 2 2.4.2. Пример: письмо-извещение .................................................................. 53 2.4.3. Пример: техническое задание .............................................................. 54 2.5. Результаты разработки предметно-ориентированного языка описания структуры и содержания электронных документов ................................................. 57 Заключение ................................................................................................................ 59 Библиографический список ..................................................................................... 61 Приложение A. Описание элементов «Дублинского ядра» ................................. 65 Приложение B. Оценка технологий создания предметно- ориентированного языка ................................................................................................. 67 Приложение C. Метамодель описания реквизитов электронного документа .... 68 Приложение D. MXM-файл графа метамодели EDocSACD ................................ 69 Приложение E. Метамодель описания структуры и содержания ЭД .................. 75 Приложение F. Сгенерированный отчет метамодели описания элементов ЭД . 76 Приложение G. Форма приказа о зачислении на 1 курс ....................................... 83 Приложение H. Образец письма-извещения .......................................................... 84 3 Основные обозначения и сокращения ЭД Электронный документ. CASE Computer-Aided Software / System Engineering (автоматизированная разработка программного обеспечения). DC Dublin Core (Дублинское ядро). DSL Domain Specific Language (предметно-ориентированный язык / язык предметной области). DSM Domain Specific Modeling (предметно-ориентированное моделирование). EDocSACD Language Electronic Document Structure and Content Description Language (язык описания структуры и содержания электронных документов). HTML Hypertext Markup Language (гипертекстовый язык разметки). PDF Portable Document Format (формат переносимых документов). SGML Standard Generalized Markup Language (стандартный обобщенный язык разметки). WWW World-Wide Web (всемирная паутина). XML Extensible Markup Language (расширенный язык разметки). 4 Введение В наше время люди стали все чаще сталкиваться с необходимостью получения из массива исходной информации сведений, которые нужны для решения конкретной проблемы. Согласно исследованиям компании IDC (The Digital Universe in 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Fare East, December 2012), количество неструктурированной информации, получившей в профессиональной ИТ-среде название Big Data («большие данные»), все стремительнее растет, составляя большую часть (примерно 80%) накопленной в мире информации. В результате роста объемов неструктурированной информации, хранящейся в электронных документах, можно столкнуться с рядом трудностей, наиболее значимыми из которых станут проблемы обработки и аналитики данных. Для разрешения этого было выбрано использование подхода, основанного на предметно-ориентированном моделировании, а именно предметно- ориентированного языка (Domain Specific Language, DSL) и DSM-платформ для создания DSL описания структуры и содержания электронного документа. Данное решение было принято по причине того, что DSL достаточно просты в применении и понятны пользователям, так как они оперируют терминологией предметной области. С другой стороны, DSL является достаточно сложным языком для разработки. Если языки общего назначения дают возможность программировать в любой предметной области, то в случае DSL это невозможно. Для каждой конкретной предметной области придется создавать собственный предметноориентированный язык. Объектом исследования являются системы управления электронными документами, их структурой и содержанием. Предметом исследования являются средства описания структуры и содержания электронных документов, а именно предметно-ориентированный язык. Целью выпускной квалификационной предметно-ориентированного языка описания электронных для снижения документов работы является структуры и содержания трудоемкости обработки неструктурированных данных, а в частности электронных документов. 5 разработка Для достижения сформулированной цели работы следует ряд задач, поставленных на время выполнения выпускной квалификационной работы: сбор, систематизация и обобщение материалов о языках описания как структуры, так и содержания электронных документов; сбор и формулировка требований к разрабатываемому предметноориентированному языку; анализ литературы о предметно-ориентированных языков; анализ существующих информационных средств создания предметноориентированного языка и выбор инструментального средства для дальнейшей разработки; разработка предметно-ориентированного языка описания структуры и содержания электронных документов. В ходе выполнения данной выпускной квалификационной работы была предпринята попытка объединить наиболее значимые элементы электронного документа, его реквизиты и виды с тем, чтобы получить максимально удобный и полно отображающий предметную область язык описания структуры и содержания электронных документов. Для достижения этого будет использоваться инструментарий MetaEdit+. В первой главе представлен обзор существующих способов описания структуры и содержания электронных документов, а также раскрыты такие понятия как электронный документ и предметно-ориентированный язык, рассмотрены средства создания предметно-ориентированного языка и обоснован выбор инструментального средства для дальнейшей разработки. Вторая глава посвящена выявлению требований к разрабатываемому языку и непосредственной разработке предметно-ориентированного языка описания структуры и содержания электронных документов. 6 Глава 1. Теоретические аспекты языков описания электронных документов Целью данной главы является изучение способов описания электронного документа, его структуры, а также предметно-ориентированных языков и инструментальных средств, используемых для их разработки. Для достижения данной цели следует раскрыть таких понятий как электронный документ и предметно-ориентированный язык. Кроме того необходимо указать какие существуют способы анализа структуры электронных документов на данный момент. На основании рассмотренных способов описания следует определить каким требованиям в дальнейшем должен удовлетворять разрабатываемый язык. Понятие «электронный документ» 1.1. Первое знакомство с понятием электронного документа состоялось еще в 1970-ых годах (на тот момент в СССР было принято называть его машиночитаемым документом), когда с массовой компьютеризацией и появлением более современных технологий возникла возможность перехода на «непечатные материалы». Факт наличия в документальной среде документации на новых носителях был официально закреплен в ГОСТ 6.10-84, вышедшем в 1984 году. На тот момент под машиночитаемым документом понимался документ, пригодный для автоматического считывания содержащейся в нем информации [1]. Отличительной особенностью таких документов являлось то, что они должны были быть пригодны для обработки на ЭВМ, или созданы с помощью вычислительной техники, но их реквизиты должны оформляться в установленном порядке. Именно в этот период времени термин «электронный документ» стал зарождаться и рассматривался как документ, обладающий новыми характеристиками. С того момента и до сих пор вопрос о понятии электронного документа является актуальным, так как специалистам данной предметной области как в научном мире, так и в современном законодательстве еще не удалось прийти к единому универсальному определению данного явления. 7 На сегодняшний день известен ряд официальных определений электронного документа, закрепленных в современном законодательстве: Документ на использованием машинном носителе носителей и – способов созданный «документ, записи, с обеспечивающих обработку его информации электронно-вычислительной машиной» [2]. Электронный документ – «документ на машиночитаемом носителе, для использования которого необходимы средства вычислительной техники» [3]. Документ электронный –информационный объект, состоящий из двух частей: «реквизитной, содержащей идентифицирующие атрибуты (имя, время и место создания, данные об авторе и т.д.) и электронную цифровую подпись»; «содержательной, включающей в себя текстовую, числовую и/или графическую информацию, которая обрабатывается в качестве единого целого» [4]. Электронный документ – «форма представления документа в виде множества взаимосвязанных реализаций в электронной среде и соответствующих им взаимосвязанных реализаций в цифровой среде» [5]. Электронный документ – «документ, в котором информация представлена в электронно-цифровой форме» [6, статья 3]. Несмотря на то, что формальное определение электронного документа существует, сущность его не раскрыта, что значительно осложняет нормативное закрепление правил его использования. Согласно мнениям, полученным в научном мире, также нет единства относительно данного вопроса. Предлагается огромное множество определений понятия электронного документа, данные учеными, например: Электронный документ – «совокупность данных в памяти вычислительной, предназначенная для восприятия человеком с помощью соответствующих программных и аппаратных средств» [7]. 8 Электронный документ – «это документ, носителем которого является электронная среда – магнитный диск, магнитная лента, компакт-диск и т.д.» [8]. Электронный документ – «документ в электронной форме: закодированное и переданное в информационную систему электронное сообщение, все реквизиты которого заверены и оформлены в соответствии с нормативными требованиями» [9]. Электронный документ – «зафиксированная на электронном (машинном) носителе информация, которая записывается, сохраняется, передается и представляется в приемлемой для человека форме с помощью технологий, поддерживаемых электронно-вычислительными машинами, и которая содержит реквизиты, позволяющие ее идентифицировать. При этом под электронным (машинным) носителем следует понимать материальный носитель, предназначенный для записи и хранения информации посредством электронно-вычислительной техники» [10]. Документом является запись информации на материальном носителе, «совершенная с помощью любой известной или могущей возникнуть в будущем технологии и в форме, обусловленной правилами оформления и в соответствии с ними»; «предназначенная для передачи этой информации во времени и пространстве»; «утверждающая, сопутствующая, подтверждающая или отражающая какой-либо факт или событие»; «содержащая атрибуты своей аутентичности (подлинности)» [11]. Электронный документ – «письменный документ, выполненный либо в виде объективной формы записи цифрового машинного кода на материальном носителе, входящем в состав электронных технических средств, либо в виде физического поля различного рода сигналов (электромагнитных, электрических, оптических и акустических), передаваемых по телекоммуникационному каналу связи во времени и пространстве» [12]. 9 По результатам рассмотрения существующих определений понятия электронного документа видно, что не существует единого варианта. В дальнейшем, при работе с понятием «электронный документ», будем опираться на определение, данное Тихоновым В.И. [10], так как оно является наиболее полным и соответствующим действительности. Также, исходя из рассмотренных определений понятий электронного документа, можно выделить основные свойства и требования, которым электронный документ должен удовлетворять, а кроме того его признаки и выполняемые функции. Функции, выполняемые электронными документами, условно можно поделить на три группы: главные, общие и специальные. Наиболее обобщенной функцией документа является главная функция, а именно хранение и передача информации во времени или пространстве. Документ создается для обеспечения потребностей общества с помощью размноженной документной информации. Общие функции, такие как информационная, коммуникативная, кумулятивная, характерны для всех документов, вне зависимости от их типа и вида. Информационная функция – это способность документа удовлетворять потребности общества и информации, то есть служить источником информации. Следующая функция, коммуникативная – это способность документа быть информативным средством передачи, обмена, коммуникации, общения и преемственности. Последней функцией является кумулятивная функция, а именно способность документа накапливать, концентрировать, собирать и упорядочивать информацию с целью ее сохранения для нынешнего и грядущего поколения [13]. Специальные функции, а именно управленческая, образовательная, правовая, общекультурная, мемориальная и другие функции, присущи не всем, а лишь определенным видам и типам документов, где они появляются в большей степени в соответствии с социальными потребностями общества. Управленческая функция выполняется документами, которые созданы для целей управления и в процессе его реализации. Образовательная функция – способность документа служить средством получения и передачи знаний для изучения процессов и явлений природы и общества. Правовая функция – способность документа служить средством доказательства, подтверждения каких-либо фактов. Общекультурная – 10 способность документа содействовать развитию культуры общества, выступать средством закрепления и передачи культурной традиции, усвоения системы ценностей. Мемориальная функция служит «внешней памятью» человека и общества в целом, сохраняя информацию и передавая ее от одного поколения к другому [14]. Для обеспечения выполнения рассмотренных функций в электронном документе выделяют следующие свойства [15]: Атрибутивность – наличие в документе информационной (содержание) и материальной (форма, которая служит для закрепления и передачи информации) составляющих. Функциональность – предназначенность для передачи информации в пространстве и времени. Способность документа выполнять разнообразные функции позволяет рассматривать его как источник информации и как средство социальной документной коммуникации. Структурность – наличие взаимосвязанных элементов и подсистем, обеспечивающих эффективность использования, его целостность и сохранение основных свойств. К основным признакам электронного документа можно отнести наличие смыслового содержания; стабильную вещественную форму, которая обеспечивает долговременную сохранность документа, возможность многократного использования и перемещения информации в пространстве и во времени; предназначенность для использования в социальной коммуникации для хранения и передачи во времени и пространстве; завершенность сообщения [15]. Помимо всего прочего, при описании электронного документа следует помнить, что документ должен соответствовать ряду требований, таким как понятность, простота, недвусмысленность и последовательность, кроме того, согласно Типовому проекту «Об электронном документе» [16], ЭД должен: создаваться, обрабатываться, передаваться и храниться с помощью программных и технических средств; иметь структуру, установленную законом, согласно которому структура электронного документа состоит из общей (информация, составляющая 11 содержание документа, и информация об адресате) и особенной (электронная цифровая подпись) частей; содержать реквизиты, позволяющие его идентифицировать; быть представленным в форме, понятной для восприятия человеком. 1.2. Обзор существующих способов описания структуры электронного документа Как было сказано ранее, одним из свойств электронного документа является структурность, то есть электронные документы, как и многие другие объекты, должны иметь свою структуру. Под данным понятием «структура электронного документа» принято понимать порядок расположения показателей и данных в документе, а также наличие взаимосвязанных элементов, обеспечивающих целостность и эффективность его использования. Однако не всегда получается так, что данные в документе находятся «в порядке», поэтому электронные документы принято подразделять по степени структурированности на: Неструктурированные – текстовые документы, которые или не имеют определенной модели данных, или не организованны определенным способом в соответствии с моделью [17]. К таким документам относятся письма, журнальные статьи, договоры. Слабоструктурированные – документы с гибкой формой, для которых определены некоторые правила и форматы, но в самом общем виде (приказы, распоряжения, служебные записки, счета-фактуры). Структурированные – электронные документы, использующие методы вложенного кодирования, например разметку, для того, чтобы присвоить всему документу и его частям различные структурные значения в соответствии со схемой [18]. Примерами структурированных документов являются заявления, обращения, жалобы, анкеты. Основной целью большинства пользователей электронных документов на данный момент является превращение неструктурированных данных, хранящихся в документе, в структурированную информацию. Наиболее яркими примерами средств структурирования данных в документах являются такие форматы электронных документов как HTML, SGML и XML: 12 Наиболее развитым является формат гипертекстового языка описания документов Hypertext Markup Language (HTML). Был предназначен для разметки научных документов и их последующего совместного использования сотрудниками разных институтов. Стандартный обобщенный язык разметки Standard Generalized Markup Language (SGML). Представляет собой метаязык, то есть средство формального описания прикладных языков разметки, предназначенных для кодирования структурированных документов. Формат eXtensible Markup Language (XML) представляет собой свод общих синтаксических правил. Целью создания было обеспечение совместимости при передачи структурированных данных между разными системами обработки информации, особенно при передачи таких данных через Интернет. Рассмотренные средства структурирования документов непосредственно взаимосвязаны друг с другом, так как первоначально язык HTML был всего лишь одним из приложений универсального стандартизированного языка разметки SGML. Другими словами, HTML – набор предписаний SGML, по которым информация подготавливается для WWW. XML, в свою очередь, также имеет отношение к SGML, а именно является его упрощенным подмножеством (см. рис. 1.1): Рисунок 1.1. Взаимосвязь языков разметки (SGML, HTML, XML) 13 Далее, для более полного понимания существующих способов описания структуры электронного документа, необходимо рассмотреть данные форматы подробнее. 1.2.1. Документы HTML формата Как было сказано ранее, HTML – это стандарт, используемый программамибраузерами службы WWW в сети Internet, благодаря которому можно не только форматировать документы, но и осуществлять связь текста и изображений с документом, расположенным на другом сервере WWW [19]. HTML ориентирован на решение нескольких важных задач, в которых участвуют его различные конструкции и элементы: описание структуры документа; адресация ресурсов; создание гипертекстовых ссылок и управление навигацией в локальных и интернет базах данных; реализация интерфейсов с пользователем. HTML – теговый язык разметки документов, то есть любой документ на данном языке представляет собой набор элементов, причем начало и конец каждого элемента обозначается специальными пометками – тегами. Другими словами, HTML позволяет создавать документы, совместимые с браузерами WWW, путем вставления управляющих кодов (тегов) в ASCII-текст для обозначения заголовков, названий, графических изображений и гипертекстовых связей [19]. Достоинствами данного языка являются простота освоения человеком и реализации инструментальных средств создания и просмотра документов. Кроме того, HTML является первым и единственным для своего времени языком разметки для представления данных web. Недостатками же формата являются отсутствие развитых средств разметки структуры документов, а также ограниченность набора тегов. 14 1.2.2. Документы SGML формата Для современного общества характерен огромный объем информации, представленной в электронном виде в библиотеках, хранилищах данных, базах данных или размещенной в дисковых файлах. Чтобы воспользоваться достижениями информационной революции, нужны средства быстрого доступа к информации, позволяющие объединять взаимосвязанные материалы и обладающие широкими возможностями поиска данных. Именно для этого и был разработан стандарт подготовки ЭД SGML (Standard Generalized Markup Language), представляющий собой набор правил для описания структуры и управления содержанием электронных документов [19]. Данный стандарт является открытым стандартом, которым можно пользоваться бесплатно, но он требует времени на обучение и применения приложений, облегчающих работу с ним и расширяющих его возможности. Документ в стандарте SGML состоит из трех частей: описание, определение типа (Document Type Definition – DTD) и содержание [19]: Описание – это заголовок файла, содержащий информацию о системе, в которой будет использоваться документ. Следующая часть – DTD – определение типа документа, что точно отражает структуру создаваемого документа (связь между элементами) и содержит информацию об обработке таких объектов, как графические изображения, звуковая и видеоинформация. При этом основной задачей является определение иерархии элементов документа. Третья часть документа – его текстовое содержание, помеченное тегами, точно соответствующими спецификациям, заданным в DTD-определении. Главным достоинством языка можно считать то, что SGML является мощным метаязыком разметки, позволяющим создавать языки разметки для различных предметных областей, например HTML, MathML, CML другие. Однако, несмотря на все достоинства SGML, его основным недостатком считается большая сложность по количеству, синтаксису и семантике объектов языка, затрудняя его использование в качестве языка разметки. Вследствие чего появился XML (Extensible Markup Language) – производный язык разметки 15 документов, позволяющий структурировать информацию разного типа, используя для этого произвольный набор инструкций. 1.2.3. Документы XML формата Как уже было сказано ранее, XML – упрощенное подмножество языка SGML. Он предназначен для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML). XML-документ представляет собой обычный текстовый файл, в котором при помощи специальных маркеров создаются элементы данных, последовательность и вложенность которых определяет структуру документа и его содержание [19]. Другими словами, каждый XML документ содержит один или несколько элементов, границы каждого из которых обозначены либо парой тегов (начальный и конечный), либо тегом пустого элемента, если это пустой элемент. Каждый элемент имеет определенный тип, который идентифицируется по имени и иногда называется «общим идентификатором» этого элемента, а также может иметь набор спецификаций к атрибутам, содержащих его имя и значение. На рисунке 1.2 наглядно показана схожесть составных частей документа, то есть структура XML не сильно отличается от структуры SGML-документ, так как XML является подмножеством языка SGML, и состоит из трех частей: описание, определение типа и содержание: Рисунок 1.2. Структура XML-документа 16 Основным достоинством XML документов является то, что при относительно простом способе создания и обработки (обычный текст может редактироваться любым тестовым процессором и обрабатываться стандартными XML анализаторами), они позволяют создавать структурированную информацию, которая одновременно понятна как человеку, так и компьютеру. Кроме того к достоинствам данного формата можно отнести и строго определенный синтаксис, что позволяет ему оставаться простым, эффективным и непротиворечивым. Также XML широко используется для хранения и обработки документов как online, так и offline. Однако, синтаксис языка XML избыточен, то есть размер документа существенно больше, чем документы в альтернативных текстовых форматах передачи данных. Избыточность может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных. Более того, существуют другие, обладающие сходными с XML возможностями, текстовые форматы данных, которые обладают более высоким удобством чтения человеком (YAML, JSON, SweetXML). 1.2.4. Результаты обзора существующих способов описания структуры электронного документа Рассмотрев наиболее известные существующие способы описания структуры электронного документа, такие как SGML, HTML и XML, можно говорить, что растущий интерес к технологии XML, являющейся попыткой вернуться к истокам идеологии SGML, приспособив замыслы его создателей к нуждам современного Интернета, ясно показывает, что www уже созрел для чего-то более мощного, чем современный HTML. Сравнительный анализ рассмотренных технологий представлен в таблице 1.1: Таблица 1.1. Сравнительный анализ языков разметки документов SGML HTML XML Год создания формата Тип разметки 1986 Строго логическая 1992 Логическая, но теги имеют жестко фиксированные параметры форматирования 17 1997 Строго логическая, определяется внешними стилевыми спецификациями Набор тегов языка и атрибутов Синтаксис тегов языка Определение типа документа (Document Type Definition) Гипертекстовая модель Совместимость с языками стилевых спецификаций Версии и спецификации Трудность освоения SGML HTML XML Произвольный Фиксированный Произвольный Гибкий Фиксированный Фиксированный Обязательно для каждого документа Одно на все документы Может быть свое у каждого документа, но может и отсутствовать Отсутствует Примитивная Развитая DSSSL (язык описания семантики и стиля) CSS (каскадные таблицы стилей) DSSSL-o Одна стабильная версия с полной и формально строгой спецификацией Множество версий и диалектов, не все из них достаточно строго документированы Незаконченная спецификация первой версии языка формально строга и легко расширяема Высокая Низкая Средняя Из таблицы видно, что разметка в SGML логична, синтаксис тегов гибкий, определение типа документа обязательно для каждого документа и трудность освоения высокая. Для формата HTML наоборот: разметка логическая, но теги имеют жестокие фиксированные параметры форматирования, синтаксис тегов фиксированный и трудность усвоения низкая [20]. Таким образом, XML является компромиссом между строго логическим языком SGML и фиксированным языком HTML, не допускающим изменение его структуры. Другими словами, XML сочетает в себе простоту HTML и свободу логической структуры SGML. 1.3. Обзор существующих способов описания документов Ранее был проведен обзор существующих способов описания структуры документов, однако немаловажным аспектом в рассмотрении электронных документов является его содержание. Библиотеки – пример организации, которая непосредственно сталкивается с проблемой описания документов. Первые документы в электронных каталогах библиотек имели описание по весьма ограниченному списку полей (примерно 8 – 10). Однако по прошествии времени ситуация стала постепенно меняться. 18 В библиотеках стали появляться каталоги, где в документах использованы ключевые слова. При проведении сравнительного анализа поисковых возможностей информационно-поисковых языков в Государственной публичной научно-технической библиотеке Сибирского отделения Российской академии наук было установлено, что наиболее высокую точность, а именно 91%, показал поиск по ключевым словам [21]. Тем не менее, данный вид поиска не всегда является узконаправленным и не во всех случаях обеспечивает релевантный поиск. Кроме того вводимые операторами ключевые слова не всегда соответствуют требованиям читателей, то есть достаточно часто можно встретить такие лексические единицы, которые никогда не будут использованы читателем в качестве поискового образа документа. Аннотации чаще всего являются весьма поверхностными, недостаточно полно описывая содержание аннотируемого документа, что не позволяет читателю точно определить возможность использования данной книги. В последние же годы данная тема стала набирать обороты, и были предприняты попытки создания новых систем структурирования электронных документов, которые за основу используют так называемые метаданные. Согласно ГОСТ Р ИСО 15489-1 – 2007 «Система стандартов по информации, библиотечному и издательскому делу. Управление документами. Общие требования», метаданные – данные, описывающие контекст, содержание, структуру документов и управление документами в течение времени. Управление метаданными – неотъемлемая часть управления документами, которая обеспечивает выполнение множества различных функций и целей [22]. Некоторые исследователи различают следующие 3 группы метаданных: 1. Метаданные, создаваемые web-службами индексирования и поиска (это данные, собираемые программами-роботами на основе использования протокола http и скриптов CGI для автоматического создания записей об онлайновых информационных ресурсах). 2. Метаданные, используемые для описания информационного ресурса (например, форматы Dublin Core и IAFA/WHOIS++ (проект ROADS); записи могут создаваться вручную или автоматически). 19 3. Метаданные, используемые для задания месторасположения, анализа, оценки, документирования и т.п. информационного ресурса (такие метаданные довольно сложные и очень детализированы, что требует привлечения специалистов для их разработки и сопровождения). Вторая категория метаданных, в свою очередь, включает в себя перечень некоторых наиболее известных систем метаданных, относящихся к электронному документу, таких как [23]: GILS – Глобальная (правительственная) служба поиска информации, обеспечивающая доступ частным лицам и организациям к федеральным информационным ресурсам, через общедоступный каталог этих ресурсов, используя систему метаданных. MARC – машиночитаемый каталог, отличающийся детальным составом элементов данных, универсальностью и развитой структурой. ЕАД. – кодировка архивных описаний. Набор изначально текстовых метаданных на базе языка разметки SGML, разработанный для нужд архивов и используемых для стандартизации и классификации уникальных архивных материалов, прежде всего рукописей. TEI – инициатива по кодированию текстов, разработанная в Центре электронных текстов Вирджинии в 1989 г. как инструмент при процессе оцифровке, который идентифицирует электронный ресурс и его печатный источник посредством метаданных, размещенных внутри самого электронного ресурса. IAFA/WHOIS++ – шаблонно-ориентированные метаданные для описания сетевых ресурсов, первоначально использовавшиеся для описания списков электронной почтовой рассылки, а позднее распространенные на другие ресурсы. Dublin Core Metadata Set (DC) – формат описания практически любых ресурсов сети Интернет. Общая схема взаимосвязи рассмотренных систем метаданных, описанных выше, приведена на рисунке 1.3, демонстрируя непосредственное отношение систем: 20 VRA MPEG MARC GILS SMPTE Dublin Core RDF LOM GELOS IMS Рисунок 1.3. Взаимосвязь систем метаданных Из рисунка видно, что справочники Dublin Core являются источниками многих систем метаданных. Кроме того, элементы DC могут быть использованы в шаблоне описания ресурса (RDF) для описания семантической составляющей информационных ресурсов. 1.3.1. Подход Dublin Core В настоящее время наиболее распространённой схемой метаданных для описания документа, непосредственно находящегося в сети Интернет, является набор, создаваемый уже в течение нескольких лет международной группой "The Dublin Core initiative". Этот набор называется, соответственно, "Dublin Core Metadata Elements". Дублинское предназначенный ядро для (Dublin описания Core) – содержания набор элементов документов метаданных, различного типа (публикации, аудиозаписи, видеозаписи). Спецификация этого набора имеет статус официального международного стандарта (ISO:15836-2003). Стандарт разделён на два уровня: простой (неквалифицированный), состоящий из 15 элементов и компетентный (квалифицированный), добавляющий к простому набору квалификаторов, которые уточняют семантику элементов (Приложение A). Особенностью Дублинского ядра является то, что каждый элемент опционален и может повторяться. 21 Дублинское ядро является мощным инструментом при описании ресурсов различного характера. Его неоспоримым преимуществом является распространённость и гибкость. Основное преимущество Дублинского ядра заключается в том, что если традиционные методы каталогизации требуют профессиональной подготовки для эффективного использования, Дублинское ядро использовать весьма просто. Однако простота конфликтует с точностью. Первоначальная цель заключалась в создании простого набора элементов метаданных для неподготовленных людей, которые публикуют электронные материалы с описанием своих результатов. Некоторые продолжают придерживаться этого минималистского подхода, они хотели бы видеть простой набор правил, которыми мог бы воспользоваться любой. Другие предпочитают ориентироваться на преимущества более тщательно разработанных правил каталогизации и согласны на увеличение трудоемкости и стоимости. Они указывают на то, что дополнительные структурные элементы позволяют добиться большей точности в метаданных [23]. Однако, несмотря на все достоинства данного подхода, у него есть ряд недостатков. Например, схема метаданных является довольно общей и подходит только для минимального описания ресурсов. Кроме того, стандартизация проведена только на уроне базового набора из 15 элементов, другие аспекты данный подход не описывает. Также DC ориентировано на описание реквизитов документа, т.е. информации, напрямую не относящейся к содержанию документа. Другие аспекты электронного документа невозможно описать [24]. 1.3.2. Проект SHOE Кроме того, для описания контента документа также можно использовать онтологические подходы. Таким образом, другим примером по праву может считаться онтология документов проекта SHOE (Simple HTML Ontology Extensions) [25]. Рассмотренная онтология документов описывает огромное количество видов документов, однако особое внимание уделяется публикациям. Источниками для данной онтологии могут считаться справочники Дублинского ядра и классификатор документов PubMed [26]. 22 Проект SHOE был ориентирован на решение проблемы добавления к webстраницам семантической информации и соотнесения ее с онтологиями соответствующих предметных областей. Предполагалось, что, используя эту информацию, поисковые системы смогут обеспечивать более релевантные ответы на запросы, чем это возможно на базе использования стандартных машин поиска, функционирующих в сети Интернет. Для поддержки процессов аннотирования в рамках проекта был разработан специальный набор инструментальных средств, основой которых был язык интернет совместимого представления знаний, давший название всему проекту [27]. На рисунке 1.4 представлен фрагмент визуализации онтологии документа: Рисунок 1.4. Фрагмент Onto-графа онтологии документа проекта SHOE 1.3.3. Онтология проекта исследовательской группы KWARC Данная онтология представляет проект, ориентированный на разработку формального описания структуры документа (онтология документов в формате CNXML), имеющей непосредственное отношение к их семантике (онтология документов в формате OMDoc (см. рис. 1.5)). Онтологии документов также могут быть использованы для классификации видов документов и их частей. Для таких форматов документов как CNXML (Connexions Markup Language) онтология документов описывает такие понятия как параграф, раздел, ссылка и 23 прочие. А для математических документов в формате типа OMDoc включены различного рода математические понятия и логические связи между этапами доказательства теорем [28]. Рисунок 1.5. Фрагмент визуализации онтологии документа в формате OMDoc 1.3.4. Онтология DoCO DoCO, или как принято расшифровывать, Document Components Ontology – онтология, характеризующая составные части библиографического документа. Представляет как структурированную лексику компонентов документа, например блок, раздел, глава, так и риторическую лексику (введение, обсуждение, благодарность, список литературы, рисунки, приложения). Это позволяет данным компонентам и документам, состоящих из них, быть описанными в формате RDF. Однако в настоящее время данная онтология находится в разработке. 1.3.5. Результаты обзора способов описания документов В результаты проведенного обзора были выявлены существующие решения для описания документов, такие как Dublin Core, SHOE, проект docOnto исследовательской группы KWARC, DoCO. Каждый из рассмотренных проектов имеет достаточное количество преимуществ. Например, Dublin Core предоставляет возможность описания контента документов различного типа (как публикаций, так и аудио и видеозаписей), являясь достаточно гибким инструментом при описании ресурсов различного характера. Однако оно ориентировано только на описание реквизитов документа, что не позволяет описать другие возможные аспекты электронного документа. Проект SHOE, разработавший онтологию описания публикаций, ориентирован непосредственно на решение проблем добавления к web-страницам 24 семантической информации и соотнесения ее с онтологиями соответствующих предметных областей. Основным недостатком данного подхода является то, что для полной его реализации необходимо, чтобы все разработчики web-страниц включали в них дополнительную информацию, что является невыполнимой задачей. Разработанная онтология docOnto исследовательской группы KWARC ориентирована на разработку формального описания структуры и семантики документов, а также механизма семантического индексирования документов и инструментальных средств обработки документов. Но, к сожалению, активные работы по данному направлению приостановлены. Как видно из проделанного обзора способов описания документа, кроме достоинств каждый из них имеет свои недостатки. Вследствие чего было принято решение использовать подход, основанный на предметно-ориентированном моделировании, использовании предметно-ориентированного языка (Domain Specific Language, DSL) и DSM-платформ, предназначенных для создания DSL, так как он является достаточно простым в применении и понятным для пользователя, оперирующим терминологией предметной области. Разрабатываемый язык будет опираться на преимущества рассмотренных подходов, однако ряд недостатков рассмотренных способов описания документов, которые необходимо учесть. 1.4. Требования к разрабатываемому предметно-ориентированному языку Принимая во внимание сложность описания структуры и содержания электронных документов крайне важно на начальном этапе определиться, каким требованиям должен удовлетворять разрабатываемый предметно-ориентированный язык. Он должен позволять выполнять описание всех элементов и реквизитов электронного документа, но при этом быть простым и понятным для пользователей, не являющихся экспертами в данной области. 25 Возможность применения в различных предметных областях может быть обеспечена соблюдением следующих требований: Доступность. Это требование обеспечивает возможность построения моделей пользователем, не имеющим глубоких знаний в области моделирования, что подразумевает наличие специализированной лексики. Ясность. Под требованием ясности получившейся модели понимается, что модель, с одной стороны, должна обладать достаточной выразительной мощностью, а с другой, не должна быть слишком запутанной и перегруженной. Неизбыточность. В языке моделирования не должно быть «лишних» или неоднозначных элементов. Пользователь не должен метаться в выборе между той или иной конструкцией языка. Достаточность. Под данным требованием подразумевается то, что набор элементов модели должен полностью удовлетворять потребностям пользователя, чтобы не возникло ситуации, когда пользователю понадобятся дополнительные объекты модели, без которых дальнейшее построение модели невозможно. Отчуждаемость. Требование заключается не только в разработке визуальных элементов, но и в создании языка с помощью специального языкового инструментария, который позволит экспортировать созданные модели. Основываясь на проблемах, выявленных в ходе анализа предметной области, а именно структуры электронного документа, основной список требований можно дополнить следующими аспектами: возможность выбора вида документа для дальнейшего описания; отображение структурных элементов электронного документа; отображение реквизитной части электронного документа; осуществление трехуровневого описания структуры электронного документа (1 уровень – элементы, 2 уровень – реквизиты, 3 – виды ЭД); возможность добавления неограниченного количества объектов в модель описания. 26 Соблюдение вышеперечисленных требований позволит более полно отобразить всю информацию о процессе описания структуры электронного документа, не перегружая при этом модель дополнительными элементами. 1.5. Понятие предметно-ориентированного языка В современном мире достаточно остро стоит вопрос о постоянном росте слабоструктурированных электронных документов. В связи с этим информация, хранящаяся в электронных документах, стала сложно извлекаемой и сложно обрабатываемой. Для разрешения данных проблем было принято решение об использовании подхода, моделировании, разработке основанного на предметно-ориентированном предметно-ориентированного языка описания структуры и содержания электронных документов. В противопоставление традиционных языков программирования, которые нацелены непосредственно на выполнение определенных функций, предметно-ориентированные языки нацелены на создание единой модели предметной области [29]. Существует большое множество вариантов определений предметно- ориентированного языка, но самым распространенным на данный момент является определение Мартина Фаулера, согласно которому предметно-ориентированным языком является «язык программирования с ограниченными выразительными возможностями, ориентированный на некую конкретную предметную область» [30]. Иными словами, понятие предметно-ориентированного языка можно определять как «урезанный язык программирования». Однако позднее было дано более точное определение: предметно- ориентированный язык – это язык программирования, специализированный для конкретной области применения (в противоположность языку общего назначения, применимому к широкому спектру областей и не учитывающему особенности конкретных сфер знаний). Поскольку в каждой области могут существовать различные понимания одних и тех же терминов, то в связи с этим предметноориентированный язык определяет соглашение о значении терминов и является посредником между человеко- и машинно-ориентированным представления информации. 27 уровнем 1.6. Обзор методов и средств разработки предметно-ориентированных языков В общем случае DSL языки могут быть как текстовыми, так и визуальными. Первые позволяют описывать модель в текстовом виде, а вторые – в графическом. Однако наиболее распространенными являются визуальные DSL, по причине того, что диаграммы обладают большей наглядностью и понятностью не только для программистов, но и для экспертов в предметной области и другим пользователям системы. Такой подход к использованию визуальных DSL принято называть предметно-ориентированное моделирование (Domain Specific Modeling, DSM). При пользоваться создании предметно-ориентированного подходящими языковыми языка инструментариями, целесообразно или DSM- платформами, предназначенными для их проектирования, редактирования и анализа. Другими слова, DSM-платформа – инструментальное программное обеспечение, служащее для поддержки разработки и сопровождения языков предметной области. Наиболее существенным достоинством DSM-платформы является то, что такие инструментальные средства облегчают процесс создания языков моделирования, а также существенно упрощают процедуру внесения изменений в уже имеющиеся DSL. Пользователю не придется разбираться в коде языка, он сможет просто изменить описание DSL в DSM-платформе. Кроме того, существует возможность интеграции в одной системе сразу нескольких DSL, так как при задании ограничений на объекты предметной области и описании бизнеспроцессов используются совершенно разные языки. На сегодняшний день известен ряд зарубежных и отечественных систем, предназначенных для разработки графических редакторов предметно- ориентированного языка с возможностью определения собственных графических нотаций. В основе этих систем находятся различные формализмы описания знаний, разнообразные модели понятий и отношений, а также разные методы обработки знаний. Ниже представлен перечень наиболее развитых на данный момент и наиболее часто встречаемых DSM-платформ: 28 MetaEdit+ является инструментальным средством CASE-системы, разработанной компанией MetaCase (Финляндия), предназначенным для создания языка моделирования и генераторов, а также с наличием среды разработки собственных систем с поддержкой языков возможности моделирования, использования генераторов кода и документации [32]. Microsoft Tools for Domain-Specific Languages (MS DSL Tools) позволяет создавать собственные визуальные языки моделирования, а также строить для них графические редакторы. DSL используется исключительно как составная часть Microsoft VS, вне которой ни DSL, ни редактор использовать нельзя [29]. Eclipse Graphical Modeling Framework (GMF) предназначена для создания графических средств, то есть для визуальных DSL, интегрируемых непосредственно в среду Eclipse. Архитектура DSL строится на основе шаблона MVC (model – view – controller). Модели разрабатываются при помощи технологии EMF, а для создания уровней представления и контроллера используется технология GEF [29]. State Machine Designer является исследовательской разработкой по созданию инструментов для описания DSL, созданный на основе DSMплатформы DSL Tools. Данное инструментальное средство было предложено Санкт-Петербургским информационных технологий государственным механики и университетом оптики на кафедре Компьютерных технологий. Технология REAL-IT предназначена для быстрой разработки (моделирования и автоматической генерации) приложений, бизнес-логика которых целиком обуславливается схемой данных. В этом случае все целевое приложение является только средством заполнения и редактирования данных. Qreal, разрабатываемая на кафедре системного программирования СанктПетербургского государственного университета, изначально должна была быть развитием REAL-IT, основывающимся на использовании новой 29 версии языка UML 2.0 и удовлетворяющим требованиям многоплатформенности. Однако в систему были включены элементы метамоделирования, что позволило упростить процесс создания новых редакторов [33]. UFO-toolkit – DSM-платформа, позволяющая проводить системнообъектный анализ с применением концептуальных классификационных моделей. К преимуществам данного инструментального средства можно отнести возможность взаимосвязанного представления структуры, состава элементов и функций моделируемых систем; имитирования функционирования системы на основе объектной модели; учета семантики предметной области и семантического взаимодействия с инструментарием. Meta Programming System разработка компанией JetBrains и используется совместно со средой разработки Java-приложений Intellij-IDEA. Отличительной особенность данной системы является тот факт, что технология Meta Programming System – мощный инструмент для текстового проектирования языка при помощи таких инструментальных средств как язык структуры, язык редактирования, базовый язык и язык шаблонов [29]. Для выбора системы построения предметно-ориентированного языка описания структуры и содержания электронных документов необходимо выполнить сравнительный анализ существующих. Критериями сравнений будут являться: динамическое изменение описания метамоделей; средства описания метамодели; возможность модификации метаязыка; создание визуальных DSL; создание текстовых DSL; средства «ручной» доработки DSL; изменение графического редактора для работы с DSL; генерация; 30 трансформация моделей; интеграция нескольких DSL; отчуждаемость DSL от DSM-платформы. Результаты анализа представлены в таблице 1.2, демонстрируя, что каждая из рассмотренных технологий обладает как своими сильными сторонами, так и слабыми по сравнению с другими системами: MetaEdit+ Динамическое изменение создаваемых метамоделей Средства описания метамодели Возможность модификации метаязыка Создание визуальных DSL Создание текстовых DSL Наличие средств «ручной» доработки DSL Возможность изменения графического редактора для работы с DSL Генерация Возможность горизонтальной трансформации моделей Интеграция нескольких DSL Отчуждаемость DSL от DSMплатформы + GOPRR Таблица 1.2. Сравнительный анализ технологий создания предметно-ориентированного языка MS Tools, State Eclipse UFOMPS REAL-IT Machine GMF toolkit Designer - - - Языки: UMLUML, структуры, диаграммы MetaGME редактора, классов базовый - - Расширение Язык UMLUFOдиаграмм элементов классов + - - - - - + + + - + + - - - + - - - + + + + - + + + - - - Код, документ-ия Исходный код - - - - - - + + + + - - - - - - - - Исходный Исходный Исходный код код код 31 Код, док-ия Эти же данные можно представить в более понятном виде, если применить оценочную шкалу (Приложение B). Для удобства было принято решение использовать двухбалльную шкалу: 0 – отсутствие, 1- присутствие критерия. Очевидно, что каждая из представленных технологий имеет несомненные достоинства. Так, например, MetaEdit+, в отличие от других технологий, позволяет вносить изменения в описание DSL во время работы системы и модифицировать метаязык. Кроме того, данный инструментарий, как и DSL Tools, Eclipse GMF и Meta Programming System, позволяет интегрировать несколько языков в одной системе. Технология DSL Tools помимо визуального редактора метамоделей предоставляет в распоряжение пользователя среду программирования MS Visual Studio. Благодаря интеграции с MS Visual Studio существует возможность «ручной» доработки кода на языках высокого уровня. Однако, основываясь на результатах анализа данной таблица, ни одна из рассмотренных выше технологий не позволяет производить трансформацию созданных моделей. Отсутствие встроенных компонентов трансформации моделей ограничивает пользователей в выборе языка моделирования, а также не позволяет им разрабатывать ИС на нескольких DSM-платформах. Более того, к недостаткам данных систем можно отнести то, что разработанные предметно-ориентированные языки не могут быть использованы в сторонних приложениях. Технологии DSL Tools, Eclipse GMF, MPS сильно связаны с платформами разработки – MS Visual Studio, Eclipse, IntelliJ-IDEA соответственно. В случае с системой MetaEdit+ для экспорта моделей используется свой собственный формат файлов MXM, который отличается от общепринятого стандарта XML, что значительно сказывается на открытости данной технологии и не позволяет использовать разработанные модели в других CASE-инструментариях. Разнообразие систем создания предметно-ориентированного языка делает сложным их непосредственное сравнение, поэтому выбирать подходящую систему лучше ориентируясь на конкретную поставленную задачу. Для разрабатываемого предметно-ориентированного языка описания структуры и содержания электронных документов было принято решение 32 использовать систему MetaEdit+ по причине возможности вносить изменения в описание DSL во время работы системы благодаря использованию подхода, основанного на интерпретации метамоделей, а не на генерации. Система позволяет работать как с языками, так и с метаязыками единообразно, используя один и тот же инструментарий. Кроме того, в данном средстве для разработки графических редакторов возможно создание собственных визуальных DSL, а также изменения графического редактора и интеграции нескольких DSL. Несомненным достоинством также является возможность построения новых метамоделей на основе существующих, другими словами создание иерархий моделей. 33 Глава 2. Разработка предметно-ориентированного языка описания структуры и содержания электронных документов Проблемы анализа и обработки слабоструктурированных электронных документов послужили толчком к разработке предметно-ориентированного языка описания структуры и содержания электронных документов, который структурировал бы документ, позволяя сделать анализ документов более осмысленным. В данной главе, после изучения и анализа предметной области и существующих инструментальных средств, следует преступать к непосредственной разработке предметно-ориентированного языка описания структуры и содержания электронных документов EDocSACD в выбранной нами ранее среде, а именно в MetaEdit+ с использованием языка метамоделирования GOPRR, при помощи которого описываются основные объекты языка и связи между ними. 2.1. Описание элементов электронного документа в EDocSACD Для создания предметно-ориентированного языка EDocSACD необходимо определить его абстрактный и конкретный синтаксис. Абстрактный синтаксис, как известно, описывает понятия, используемые в языке. Другими словами, он использует существующие элементы, их свойства и их взаимодействие друг с другом. Конкретный синтаксис представляет собой описание конструкций языка с помощью визуального представления языковых элементов на диаграммах, а именно то, как элемент языка будет отображаться для пользователя. Конкретный синтаксис обычно задается в специальных графических редакторах. Описание языка целесообразно начать с абстрактного синтаксиса, который чаще всего определяется в метамодели. Ключевые понятия, используемые в языке описания структуры и содержания электронных документов, на этапе работы с элементами электронного документа являются: слово, служебный символ, предложение, абзац, изображение, таблица, ячейка, строка, столбец. В нашем случае ключевые понятия также будут являться основными объектами языка. Однако к ним добавятся еще такие классы как Element и 34 Document. Класс Document отображает связь элементов с описываемым документом, который может содержать много элементов. В данной метамодели класс Element является абстрактным. Он отмечен символом «{0}». Это означает, что количество объектов данного типа в модели будет равно нулю. Однако кроме класса Element объекты Word, Symbol, Sentence также отмечены символом «{0}». Это было сделано для того, чтобы при построении модели данные объекты не отображались. Описание конкретных объектов с их атрибутами представлено ниже в таблице 2.1: Объект языка Имя класса Слово Word Служебный символ Symbol Предложение Sentence Абзац Paragraph Изображение Image Таблица Table Строка Столбец Ячейка Ссылка Элемент Row Column Box Link Element Документ Document Таблица 2.1. Описание классов метаязыка и их атрибутов Описание Атрибут Тип атрибута атрибута Содержание description String слова number Number (unique per graph) content Text Onto-link String number Number (unique per graph) Номер предложения Содержание предложения Ссылка на онтологию предметной области Номер абзаца Ссылка на онтологию предметной области Название изображения Название таблицы Ссылка на онтологию Onto-link String title String title String Onto-link String link String Ссылка title String Название документа 35 Далее необходимо описать виды отношений, которые будут реализованы в метамодели. В нашем случае уместно использовать такие виды связи как наследование, агрегация и ассоциация. Для представления связи ассоциации может быть использован только один вид связи have, который показывает, что какой-то элемент документа содержит другой элемент. При таком роде отношений появляется связь между одним и более объектами метамодели. Кроме того в данной метамодели присутствует одна связь ассоциации, которая является двунаправленной. Это необходимо для того, чтобы показать, что как объект Table может содержать объект Box, так и наоборот (см. рис. 2.1): Рисунок 2.1. Двунаправленная связь, ассоциация Для того чтобы конкретные объекты обладали свойствами абстрактного класса необходимо провести связь наследования. Благодаря этому отношению мы сможем создавать новые объекты на основе существующих. В данном случае связи наследования проведены от практически всех объектов, а именно от Word, Symbol, Paragraph, Image, Table, Row, Column, Box, к объекту Element, так как вышеупомянутые классы являются его наследниками (см. рис. 2.2): Рисунок 2.2. Связь наследование 36 После создания всех классов и отображения связей между ними, получилось подробное описание синтаксиса метамодели, представленное на рис. 2.3, а также в таблице 2.2 предложено графическое отображение и описание объектов созданной метамодели: Таблица 2.2. Графическое отображение объектов EDocSACD Графическое Наименование Описание представление Document Объект служит для отражения на диаграммах визуального представления документа Paragraph Объект используется для расположения абзацев в документе Image Объект отражает изображения Column Объект используется для демонстрации столбцов таблицы Row Объект служит для отображения строк таблицы Table Служит для добавления таблицы и ее названия в документ Box Объект используется таблицы Связь «have» Связь «have» служит для соединения элементов электронного документа между собой. имеющиеся для отображения в документе отображения 37 ячеек Рисунок 2.3. Метамодель элементов электронного документа В приложении D представлен код MXM-файла графа метамодели EDocSACD, описывающей элементы электронного документа. 2.2. Описание реквизитов электронного документа в EDocSACD Согласно ГОСТ Р 6.30-2003 «Унифицированная система организационнораспорядительной документации. Требования к оформлению документов» [34], который устанавливает состав реквизитов документов и требования к их оформлению, при подготовке и оформлении документов используют следующие реквизиты: 1) Государственный герб Российской Федерации; 2) герб субъекта Российской Федерации; 3) эмблема организации или товарный знак (знак обслуживания); 4) код организации; 5) код формы документа; 6) наименование организации; 7) справочные данные об организации; 8) наименование вида документа; 9) дата документа; 10) регистрационный номер документа; 11) ссылка на регистрационный номер и дату документа; 38 12) место составления или издания документа; 13) гриф ограничения доступа к документу; 14) адресат; 15) гриф утверждения документа; 16) резолюция; 17) заголовок к тексту; 18) отметка о контроле; 19) текст документа; 20) отметка о наличии приложения; 21) подпись; 22) гриф согласования документа; 23) визы согласования документа; 24) оттиск печати; 25) отметка о заверении копии; 26) отметка об исполнителе; 27) отметка об исполнении документа и направлении его в дело; 28) отметка о поступлении документа в организацию; 29) идентификатор электронной копии документа. Как известно, при оформлении электронного документа, имеющего отношение к унифицированной системе организационно-распорядительной документации, реквизиты группируются в пределах трех составных частей, условно на которые можно поделить документ, такие как заголовочная, содержательная и оформляющая части. Заголовочная часть электронного документа – начало документа, состоящее из сведений об организации, являющаяся автором документа, и первичных данных непосредственно о документе (реквизиты 1-16). К первичным данным можно отнести такую информацию как наименование, дату составления, регистрационный номер или код документа по ОКУД и другие реквизиты-признаки. Содержательная часть по праву может называться основной частью, раскрывающая назначение и смысл документа (реквизиты 17-20). 39 Рассматриваемая часть, в свою очередь, состоит либо из табличной, либо из текстовой частей. К табличной части относятся реквизиты-признаки для характеристики описываемого объекта (заголовки таблиц, строк, граф) и реквизиты-основания для количественной характеристики. Третью частью считается оформляющая часть, которая включает в себя совокупность реквизитов, подтверждающих подлинность и достоверность информации, содержащейся в документе (реквизиты 21-24), а также вспомогательные надписи, которые помогут облегчить работу с ним (реквизиты 25-29) [34]. Изучив состав реквизитов электронного документа, было принято решение выделить следующие объекты языка, которые представлены в табл. 2.3. В данном случае в метамодели символом {1}. Это встречаются значит, что такие при классы, построении которые модели обозначаются объект может использоваться только один раз. В ином случае пользователю будет выведено сообщение об ошибке, согласно которому вторичное использование данного элемента не возможно. Объект языка Таблица 2.3. Описание классов метаязыка Тип Описание Атрибут атрибута атрибута Имя класса Документ Заголовочная часть Содержательная часть Оформляющая часть Государственный герб РФ Герб субъекта РФ Эмблема организации Код организации Document HeaderPart SubstantialPart MakePart EmblemOfCity OrgEmblema EnterpriseCode Code Number Код формы документа CodeOfDocumentForm Code Number Наименование организации CorporateName Name String Организационные справочные данные OrganizationReferenceData Email String Telephone Fax String String DocType Collection Наименование вида документа NationalEmblemOfRF DocumentType 40 Код организации Код формы документа Название организации Адрес электронной почты Номер телефона Номер факса Наименование вида документа DocumentDate Day Month Year Тип атрибута Number Number Number TailNumber Number Number PlaceOfIssue Addressee TextTitle TitleName Text Отметка о контроле ControlMark Mark String Текст Отметка о наличии приложения Text Content Text MarkOfApplication Number Number Name String Sheets Number Copies Number Объект языка Имя класса Дата документа Регистрационный номер Место составления Адресат Заголовок текста Атрибут Гриф согласования GrifOfApprovals Date Object Вид согласования ApprovalType Type String Печать Подпись Отметка о заверении копии Отметка об исполнении Отметка о поступлении Stamp Subscription MarkOfTheCompletionOf TheCopy Date Object Организация Organization Name String Должностное лицо OfficePerson Position String Описание атрибута День Месяц Год Регистрационный номер Заголовок Отметка о контроле Текст документа Номер приложения Название Количество страниц Количество копий Дата согласования Вид согласования Дата заверения копии MarkOfExecution MarkOfTheReceipt Название организации Должность Такие классы как PhysicalPerson и Address будут являться абстрактными классами, что значит, что свойства, используемые в классах, будут наследоваться другими классами (табл. 2.4): Объект языка Физическое лицо Адрес Таблица 2.4. Описание абстрактных классов метаязыка Тип Описание Имя абстрактного класса Атрибут атрибута атрибута ФИО PhysicalPerson Fio String человека Название Address Org_name String организации 41 Объект языка Country City Тип атрибута String String Street String House Office Index Number Number Number Имя абстрактного класса Атрибут Описание атрибута Страна Город Название улицы Номер дома Номер офиса Индекс В данной метамодели описания реквизитов электронных документов реализованы следующие виды отношений: Связь «can be» описывает адресата. Это значит, что, согласно ГОСТ Р 6.30-2003 «Унифицированная система распорядительной документации. документов» [34], адресатом может быть как организация, так и Требования организационнок оформлению должностное или физическое лицо (см. рис. 2.4): Рисунок 2.4. Связь «can be» Связь «work in» (см. рис. 2.5) соединяет должностное лицо, которое может являться адресатом, и организацию, в которой он работает: Рисунок 2.5. Связь «work in» Ассоциативная связь «have» (см. рис. 2.6), которая также была использована в предыдущей метамодели описания элементов электронного документа. Она означает причастность реквизита к определенной части документа. 42 Рисунок 2.6. Отображение связи «have» Связь наследования (см. рис. 2.7), применимая к классу Physical person, от которого класс Addressee наследуют свойство FIO, а также к абстрактному классу Address: Рисунок 2.7. Связь наследования Графическое отображение и описание объектов метамодели после создания всех классов и отображения связей между ними, представлено в таблице 2.5: Наименование Document HeaderPart Таблица 2.5. Графическое отображение объектов EDocSACD Графическое Описание представление Объект служит для отражения на диаграммах визуального представления документа. Для обозначения части. границ 43 заголовочной Наименование Графическое представление Описание SubstantialPart Для обозначения границ содержательной части. MakePart Для обозначения границ оформляющей части. NationalEmblemOfRF Показывает наличие в государственного герба Федерации. EmblemOfCity Показывает наличие герба города. OrgEmblema Отображает эмблему организации, которая является составителем документа. EnterpriseCode Показывает код организации. CodeOfDocumentForm Данный объект отображает код формы документа. CorporateName Отображает название организации. OrganizationReferenceData Предоставляет возможность ввода организационно-справочной информации, а именно адрес компании, электронную почту, телефон. Объект служит для предоставления информации о типе документа. DocumentType документе Российской DocumentDate Позволяет отобразить дату составления документа. TailNumber Представляет собой номер документа. PlaceOfIssue Указание места составления, если затруднено его определение по реквизитам «Наименование организации» и «Справочные данные». 44 регистрационный Наименование Описание Объект адресат отображает сведения о получателе документа. Им может быть организация, его структурное подразделение, должностное или физическое лицо. Выводит заголовок текста и включает в себя краткое содержание документа. Представляет собой отметку о контроле за исполнением документа. Addressee TextTitle ControlMark Text Текст документа может быть оформлен в виде анкеты, таблицы, связного текста или в виде соединения этих структур. MarkOfApplication Объект «отметка о наличии приложения» отображает количество приложения, его название, количество страниц и экземпляров. Гриф согласования показывает согласованность документа. GrifOfApprovals Stamp Объект отображает штамп организации. Subscription Объект отображает должность подписывающего, его инициалы и саму подпись. Необходим при заверении соответствия копии документа подлиннику. MarkOfTheCompletionOf TheCopy OfficePerson Графическое представление Заключается в описании должностного лица, а именно его инициалов и должности. Получившаяся метамодель с отображением всех классов и связей представлена в приложении C. 2.3. Описание видов электронного документа в EDocSACD Использование рассмотренных ранее реквизитов электронного документа, то есть его обязательных элементов, непосредственно зависит от вида документа. Поэтому третий уровень заключается в описании видов электронных документов, что в дальнейшем поможет выявить перечень обязательных реквизитов для 45 конкретного вида ЭД, так как разные документы состоят из разного набора реквизитов. Электронные документы принято подразделять на: система организационно-правовой документации; система распорядительной документации; система информационно-справочной документации [35]. В свою очередь каждая из этих систем включает в себя свой перечень документов. Далее рассмотрим данные системы, виды документов, относящиеся к ним, и обязательные реквизиты подробнее. Система организационно-правовой документации – правовая основа деятельности организации и содержащая положения, основанные на нормах административного права и обязательные для исполнения. К организационноправовым документам относятся [36]: устав; учредительный договор; положение об организации; положение о структурном подразделении; положение о коллегиальном органе; регламент; штатное расписание; инструкция; должностная инструкция. Обязательными реквизитами для организационно-правовых документов являются следующие: наименование организации; наименование вида документа; дата; номер документа; место составления; заголовок к тексту; подпись; гриф утверждения. К следующей системе, системе распорядительной документации, относятся документы, в которых фиксируются решения административных организационных вопросов деятельности организации, такие как [36]: 46 и распорядительные документы, издаваемые в условиях единоличного принятия решения, когда власть по всем вопросам управления в организации принадлежит ее руководителю: приказ; распоряжение; указание; распорядительные документы, издаваемые в условиях коллегиального принятия решения, то есть они издаются на основании решений, принимаемых совместно группой работников: решение; постановление. У распорядительных документов обязательными реквизитами указания являются: наименование организации; название вида документа; дата и регистрационный номер документа; место составления или издания; заголовок к тексту; подпись; визы согласования документа. Система информационно-справочной документации и информационносправочные документы сообщают сведения, побуждающие принимать определенные решения, то есть инициируют управленческие решения, позволяют выбирать тот или иной способ управленческого воздействия. Они не содержат поручений и не обязывают выполнять их. К таким системам относятся [36]: докладная записка; служебная записка; объяснительная записка; предложение; представление; заявление; протокол; акт; справка; заключение; отзыв; 47 перечень; список; служебное письмо – это обобщенное название различных по содержанию документов, выделяемых в связи с особым способом передачи текста, – пересылкой почтой: сопроводительное письмо; письмо-просьба; письмо-запрос; письмо-ответ; письмо-сообщение; письмо-подтверждение; информационное письмо; письмо-извещение; письмо-приглашение; письмо-напоминание; письмо-требование; письмо-благодарность; телеграмма; факс; электронное сообщение. Как и другим системам, системе информационно-справочной документации присущи свои обязательные реквизиты, такие как: наименование организации; наименование вида документа; дата и регистрационный номер; место составления; адресат; заголовок к тексту; подпись; гриф утверждения (в необходимых случаях). Однако для описания служебных писем используется более обширный перечень обязательных реквизитов: наименование организации; справочные данные об организации; код организации; основной государственный регистрационный юридического лица; 48 номер (ОГРН) идентификационный номер налогоплательщика; код причины постановки на учет; дата; регистрационный номер; адресат; заголовок к тексту (при составлении письма на бланке формата А4); подпись; отметка об исполнителе; отметка о наличии приложений (в сопроводительных письмах). Рассмотрев основные понятия видов электронных документов и список обязательных реквизитов для каждой системы электронных документов, можно выделить следующие объекты языка (табл. 2.6), абстрактные классы (табл. 2.7) и их атрибуты: Объект языка Документ Организационноправовая система Распорядительная система Информационносправочная система Служебное письмо Имя класса Document Procedural and institutional system Administrative system Inquiry and communications system Service letter Таблица 2.6. Описание классов метаязыка Тип Атрибут Описание атрибута атрибута title String Название документа System (PaI) String Система документа System (A) String Система документа System (IaC) String Система документа Addressee Organization reference data Enterprise code Mark of execution Object Адресат документа Организационносправочные данные Код организации Отметка о получении документа Отметка о приложениях документа Mark of application Объект языка Системы документов Object Object Object Object Таблица 2.7. Описание абстрактных классов метаязыка и их атрибутов Имя абстрактного Тип Атрибут Описание атрибута класса атрибута Corporate Название SystemDoc Object name организации Document type Object Вид документа Document data Object Дата составления 49 Объект языка Имя абстрактного класса Атрибут Тип атрибута Описание атрибута Tail number Object Place of issue Text title Subscription Grief of approval Object Object Object Регистрационный номер Место составления Заголовок текста Подпись Object Гриф согласования При создании метамодели видов электронных документов добавление дополнительных связей, кроме наследования и имеющейся связи «is», между объектами не потребовалось. В данном случае связь «is» показывает, что описываемый документ будет являться экземпляром системы документов, либо организационно-правовой, либо распорядительной, либо информационно- справочной. После создания всех классов и отображения связей между ними необходимо отобразить графически и описать объекты созданной метамодели. Описание представлено в таблице 2.8: Таблица 2.8. Графическое отображение объектов EDocSACD Наименование Описание Графическое представление Document Объект служит для отражения на диаграммах визуального представления документа Объект используется для отображения того, к какой системе относится документ, а именно к организационноправовой системе. Объект используется для Administrative отображения того, что system документ относится к распорядительной системе. Объект используется для Inquiry and отображения того, что communications документ является экземпляром информационноsystem справочной системы. Объект используется для того, что Research system отображения документ относится к научноисследовательской системе. Procedural and institutional system 50 Наименование Service letter Описание Отображает причастность документа к объекту, который наследуется от информационно-справочной системы. Графическое представление Получившаяся метамодель описания видов электронных документов представлена на рисунке 2.9: Рисунок 2.9. Отображение связей наследования и ассоциации в метамодели 2.4. Разработка модели описания структуры и содержания электронного документа Для объединения созданных метамоделей для описания элементов ЭД, реквизитов и видов необходимо было создать новую метамодель (приложение E), которая бы интегрировала все имеющиеся метамодели в одну. Однако после этого потребовалось добавление новых связей, чтобы показать взаимосвязь между элементами документа и его реквизитами, а также удаление некоторых атрибутов из объектов метамодели описания видов документов (см. рис. 2.10): 51 Рисунок 2.10. Элементы метамодели Далее необходимо перейти к непосредственному созданию модели, используя разработанный DSL, для демонстрации возможностей языка. Для этого рассмотрим конкретные примеры описания структуры и содержания электронных документов на основе трех документов: приказ о зачислении на 1 курс; письмоизвещение; техническое задание. 2.4.1. Пример: приказ о зачислении на 1 курс Форма приказа о зачислении на 1 курс представлена в приложении G, согласно которой документ состоит из трех частей: заголовочной, содержательной и оформляющей. В качестве основных реквизитов документа распорядительной системы заголовочной части выступают эмблема организации, содержащая название, тип документа, распорядительный номер и дата составления документа. К содержательной части относятся заголовок текста и сам текст, который может быть оформлен в виде анкеты, таблицы, связного текста или в виде соединения этих структур. Оформляющая часть включает в себя совокупность реквизитов, подтверждающих подлинность и достоверность информации, содержащейся в документе: подпись человека, который издал приказ, его инициалы и занимаемая должность. Кроме того в описываемом документе существует приложение к приказу, которое отображено в модели как раздел «Приложение». Данный раздел имеет содержательную и оформляющую часть, при том текст содержательной части 52 является таблицей, а оформляющая часть содержит подпись заместителя ответственного секретаря. На рисунке 2.11 представлено описание приказа о зачислении на 1 курс факультета бизнес-информатики Пермского филиала Государственного университета – Высшей школы экономики: Рисунок 2.11. Описание структуры приказа о зачислении 2.4.2. Пример: письмо-извещение Следующий пример описания структуры и содержания основан на письмеизвещении, которое является служебным письмом. Служебное письмо, в свою очередь, является подмножеством информационно-справочной системы. Созданная модель, отображающая структуру и содержание письмаизвещения, представлена на рисунке 2.12: 53 Рисунок 2.12. Описание структуры письма-извещения Согласно образцу письма-извещения (приложение H), в полученной модели документ поделен на три части, каждая из которых имеет свои реквизиты. Так, например, заголовочная часть содержит в себе данные об адресате, который работает в конкретной организации, имеющей организационно-справочные данные (адрес и контакты). Кроме того туда входят дата составления письма и его регистрационный номер. Содержательная часть, как и в других документах, включает в себя заголовок текста и сам текст, который в данном случае состоит из трех параграфов. Подпись отправителя, его инициалы и должность заносятся в оформляющую часть. 2.4.3. Пример: техническое задание Как известно, техническое задание является исходным документом на проектирование технического объекта и устанавливает основное назначение разрабатываемого объекта, его технические характеристики, показатели качества и технико-экономические требования, предписанные по выполнению необходимых стадий создания документации и ее состав, а также специальные требования. Согласно ГОСТ 34.602-89 техническое задание должно содержать следующие разделы, включающие в себя некоторые подразделы и реквизиты: общие сведения: полное наименование системы и ее условное обозначение; 54 шифр темы или шифр (номер) договора; наименование предприятия разработчика и заказчика, их реквизиты; перечень документов, на основании которых создается система; плановые сроки начала и окончания работы по созданию системы; сведения об источниках и порядке финансирования работ; порядок оформления и предъявления заказчику результатов работ по созданию системы; определения, обозначения и сокращения; назначение и цели создания системы: назначение системы; цели создания системы; характеристика объектов автоматизации: краткие сведения об объекте автоматизации; сведения об условиях эксплуатации объекта автоматизации; требования к системе: требования к системе в целом: требования к структуре и функционированию системы; показатели назначения; требования к надежности; требования безопасности; требования к эксплуатации; требования к защите информации; дополнительные требования; требования к функциям и задачам, выполняемым системой; требования к видам обеспечения; состав и содержание работ; порядок контроля и приемки: виды испытаний; 55 общие требования к приемке работ; статус приемной комиссии; требования к составу и содержанию работ по подготовке объекта автоматизации к вводу системы в действие; требования к документированию; источники разработки. Кроме того, в состав ТЗ входят титульный и последний листы, которые содержат перечень обязательных реквизитов: название компании разработчика ТЗ, дата составления документа, вид документа, подписи разработчика и заказчика и штамп на титульном листе; код формы документа, отметки о составлении и согласовании с подписями на последнем. На основании состава и содержания технического задания была построена модель описания структуры и содержания ТЗ (см. рис. 2.13 и рис. 2.14), созданная с помощью ранее построенной метамодели: Рисунок 2.13. Описание технического задания. Фрагмент 1: Разделы «Характеристики объектов», «Состав и содержание работ», «Порядок контроля и приемки системы», «Источники разработки» 56 Рисунок 2.14. Описание технического задания. Фрагмент 2: разделы «Общие сведения», «Назначение и цели», «Требования к системе» На данных фрагментах показаны те объекты языка EDocSACD, которые позволяют описать состав и содержание технического задания. 2.5. Результаты разработки предметно-ориентированного языка описания структуры и содержания электронных документов Данная глава была посвящена описанию процесса разработки предметноориентированного языка описания структуры и содержания электронных документов, который интегрирует в себе три метамодели описания: элементов ЭД, его реквизитов и видов. Разработанный язык был реализован при помощи платформы MetaEdit+. В ходе создания метамоделей предметной области можно констатировать, что DSM-платформа MetaEdit+ позволяет наглядно представить модели описания структуры и содержания ЭД. Одной из положительной особенностью построенной метамодели является универсальность применения ее в описании электронного документа. Визуализация объектов по праву может считаться одним из основных достоинством, что позволяет пользователю лучше ориентироваться в них. Также 57 преимуществом использования данной системы является возможность динамического изменения модели при внесении корректировок в метамодели. Однако в процессе работы с данным инструментальным средством были выявлены некоторые недостатки предлагаемой платформы: отсутствие возможности ручной доработки кода, а именно невозможность исправления ошибок, возникающих в коде в процессе разработки метамодели; недопустимость задания иной ориентации для символов, позволяющих наглядно представить как объекты, так и связи; громоздкость метамодели и модели при масштабировании и возможность возникновения трудностей с восприятием; неосуществимость экспорта метамодели и модели, так как для этих целей данная DSM-платформа использует свой собственный формат файлов MXT. 58 Заключение В результате работы все задачи, поставленные на время написания выпускной квалификационной работы, были решены и цель достигнута. Для этого были проанализированы источники, дающие определение понятия электронного документа. Анализ существующих вариантов показал, что единого варианта не существует как в научном мире, так и в современном законодательстве. На основании рассмотренных определений выделены его функции и основные свойства, для обеспечения выполнения рассмотренных функций, а также его признаки и требования, которым электронный документ должен удовлетворять. В рамках проделанной работы были проанализированы существующие способы описания структуры электронных документов, таких как форматы HTML и SGML, и существующие способы описания документов (подходы Dublin Core, SHOE, DoCO, онтология проекта исследовательской группы KWARC). Анализ показал, что существующие способы описания документов имеют не только достоинства, но и ряд недостатков, которые были учтены при разработке предметно-ориентированного языка описания структуры и содержания электронного документа. Кроме того в работе был выполнен анализ материалов о предметноориентированных языках и обзор методов и средств их разработки: MetaEdit+, MS DSL Tools, Eclipse GMF, State Machine Designer, Meta Programming System, REALIT, UFO-toolkit. Ни одна из рассмотренных технологий не позволяет производить трансформацию созданных моделей из одной нотации в другую, а также отсутствует возможность отчуждения DSL от DSM-платформ во всех описанных технологиях. Основываясь на результатах анализа, MetaEdit+, в отличие от других технологий, позволяет вносить изменения в описание DSL во время работы системы и модифицировать метаязык, поэтому для разработки была использована данная система. Результатом работы является разработанный предметно-ориентированный язык описания структуры и содержания электронных документов EDocSACD, реализованные при помощи платформы MetaEdit+. Созданный язык достаточно прост в понимании и адекватно отражает понятия исследуемой предметной 59 области, так как используются конструкции, разработанные специально для решения задачи описания структуры и содержания электронных документов. Кроме того, DSL удовлетворяет сформулированным требованиям: предоставление возможности построения моделей пользователем, не имеющим глубоких знаний в области моделирования; являться наглядной для пользователя и не перегруженной лишними элементами; набор элементов должен полностью удовлетворять потребности пользователя. Язык EDocSACD имеет три метамодели, которые достаточно просто редактировать в соответствии с особенностями конкретных предметных областей или согласно меняющимся условиям, создавая новые объекты и добавляя связи между ними. В будущем данная тема будет расширяться. В разработанном предметноориентированном языке необходима дальнейшая реализация возможности добавления онтологии предметной области для описания содержания электронных документов. Использование созданного языка возможно в системе электронного документооборота для валидации документов, что позволит компании облегчить процесс анализа и обработки электронных документов за счет описания их структуры и содержания. Кроме того, модель может быть использована при реализации различных инструментальных средств для обработки электронных документов, в частности для средств анализа документов, создания отчетов, семантической индексации. 60 Библиографический список 1. Хургин В.М. Еще раз об электронном документе. // Российская ассоциация электронных библиотек. [Электронный ресурс] [Режим доступа: http://www.aselibrary.ru/datadocs/doc_790ra.pdf] [Проверено: 28.04.2014]. 2. Делопроизводство и архивное дело. Термины и определения [Текст]: ГОСТ Р 51141-98. – М.: Изд-во стандартов, 1998. 3. Межгосударственный стандарт. Система стандартов по информации, библиотечному и издательскому делу. Электронные издания. Основные виды. Выходные сведения [Текст]: ГОСТ 7.83-2001. – Минск: Межгосударственный совет по стандартизации, метрологии и сертификации, 2001. 23 с: ил. 4. Рекомендации по стандартизации. Информационные технологии поддержки жизненного цикла продукции. Терминологический словарь. Часть 1. Стадии жизненного цикла продукции [Текст]: Р 50.1.031-2001. – М.: Изд-во стандартов, 2001. 5. Приказ Федерального агентства по техническому регулированию и метрологии от 29 декабря 2004 г. № 135-ст «Об утверждении национального стандарта» //нет данных об опубликовании [ГОСТ Р 52292-2004 Информационная технология. Электронный обмен информацией. Термины и определения.] – М.: Изд-во стандартов, 2005. 6. Федеральный закон от 10 января 2002 г. № 1-ФЗ «Об электронной цифровой подписи» //СЗ РФ. – 2002. – № 2. – ст. 127; 2007, № 46. – ст. 5554. 7. Воройский Ф.С. Систематизированный толковый словарь по информатике (вводный курс по информатике и вычислительной технике в терминах). – М.: «Либерия», 1998. 376 с. 8. Клименко С.В. Электронные документы в корпоративных сетях: второе пришествие Гутенберга. – М.: Анкей – ЭК – Трендз, 1999. 271 с. 9. Карминский А.М. Информатизация бизнеса. – М.: Финансы и статистика, 1997. 10. Тихонов В.И. Сущностные характеристики, состав и классификация электронных документов. – М.: Росархив. ВНИИДАД. РОИА. – 2000. 204 – 218 с. 61 Тихонов В.И. Электронные архивы и электронный документооборот 11. //Отечественные архивы. – 1999. – № 2. Семилетов С.И. Информация как особый объект права //Проблемы 12. информатизации. – 1999. – № 3. Швецова–Водка Г.Н. Функции и свойства документа в системе 13. социальных коммуникаций. // Кн.: исследования и материалы. – М. 1994. 37 – 57 с. Кушнаренко Н.Н. Документоведение: Учебник.- 8-е изд. – Киев: 14. Знання, 2008. Серова Л.И. Документационное обеспечение управления. Учебное 15. пособие. // Рудос. [Электронный ресурс] [Режим доступа: http://rudocs.exdat.com/docs/index-304709.html?page=4] [Проверено: 15.04.2014]. Приложение к постановлению МПА ЕврАзЭС от 25 марта 2002 г. №2- 16. 19 «Об электронном документе». Глава 2. // Межпарламентская Ассамблея Евразийского экономического сообщества. [Электронный ресурс] [Режим доступа: http://www.ipaeurasec.org/docsdown/mz_eldoc.pdf] [Проверено: 29.04.2014]. Structure, models and meaning. Is “unstructured” data merely unmodeled? 17. // InformationWeek. Connecting the business technology community. [Электронный ресурс] [Режим доступа: http://www.informationweek.com/software/information- management/structure-models-and-meaning/d/d-id/1030187?] [Проверено: 30.04.2014]. 18. A representation of Textual Information and MetaInformation for Retrieval and Interchange. // World Wide Web Consortium (W3C). [Электронный ресурс] [Режим доступа: http://www.w3.org/MarkUp/draft-ietf-iiir-html-01.txt] [Проверено: 30.04.2014]. Технология подготовки электронных документов с использованием 19. программных средств. // Учебные материалы. [Электронный ресурс] [Режим доступа: http://works.doklad.ru/view/sbM1En1aoA4/all.html] [Проверено: 22.04.2014]. Кирсанов Д. XML против HTML. // Александр Гагарин. [Электронный 20. ресурс] [Режим доступа: http://www.gagin.ru/internet/1/19.html] [Проверено: 30.05.2014]. 21. Бобко А.В. О лингвистических средствах тематического поиска в электронном каталоге ГПНТБ СО РАН // Региональные библиотечные системы: История, современное состояние, перспектива. – Новосибирск, 1995. 62 Система стандартов по информации, библиотечному и издательскому 22. делу. Процессы управления документами. Метаданные для документов. Часть 1. Принципы [Текст]: ГОСТ Р ИСО 23081-1 – 2008. – М.: Изд-во стандартов, 2008. Тевс Д.П. Создание электронной библиотеки образовательного 23. учреждения. Барнаул: Изд-во БГПУ, 2004. 24. Dublin Core Metadata Element Set, Version 1.1. // Metadata Dublin Core. [Электронный ресурс] [Режим доступа: http://dublincore.org/documents/dces/] [Проверено: 09.04.2014]. 25. Heflin J. Searching the Web with SHOE. // Computer science university of Maryland. [Электронный ресурс] [Режим http://www.cs.umd.edu/projects/plus/SHOE/pubs/aiweb2000.pdf] доступа: [Проверено: 13.04.2014]. 26. SHOE. Document Ontology (draft). // Computer science university of [Электронный Maryland. ресурс] [Режим http://www.cs.umd.edu/projects/plus/SHOE/onts/docmnt1.0.html] доступа: [Проверено: 28.04.2014]. Ефименко 27. И.В. Онтологическое моделирование экономики предприятий и отраслей современной России. Онтологическое моделирование: подходы, модели, методы, средства, решения. // Высшая школа экономики. Национальный исследовательский университет. [Электронный ресурс] [Режим доступа: http://www.hse.ru/data/2011/12/22/1261631357/WP7_2011_08_1.pdf] [Проверено: 29.04.2014]. Document Ontology. // The KWARK Research Group. [Электронный 28. ресурс] [Режим доступа: http://kwarc.info/projects/docOnto/] [Проверено: 28.04.2014]. 29. Сухов А.О. Сравнение систем разработки визуальных предметно- ориентированных языков.// Математика программных систем: межвуз. сб. науч. ст. – Пермь: Изд-во Перм. гос. нац. исслед. ун-та, 2012. – Вып. 9. 30. Фаулер М. Предметно-ориентированные языки программирования. Пер. с англ. М.: ООО «И.Д. Вильямс», 2011. 121 с. 63 31. Иванов А.Н. Моделирование интерфейса полнофункциональных веб- приложений, интенсивно работающих с данными. // Вестник Санкт- Петербургского университета, серия 10, вып. 3. 2009. 8 с. 32. Qreal. ресурс] [Электронный [Режим доступа: http://qreal.ru/] [Проверено: 28.04.2014]. 33. Унифицированная система организационно-распорядительной документации. Требования к оформлению документов [Текст]: ГОСТ Р 6.30-2003. – М.: Изд-во стандартов, 2003. 34. виды и Межгосударственный стандарт. Электронные издания. Основные выходные сведения [Текст]: ГОСТ 7.83-2001. – Минск: Межгосударственный совет по стандартизации, метрологии и сертификации, 2002. 3 с: ил. 35. Энциклопедия делопроизводства. // Центр компетенции по вопросам документационного обеспечения управления и архивного дела. [Электронный ресурс] [Режим доступа: http://www.edou.ru/enc/index.php] [Проверено: 29.04.2014]. 64 Приложение A. Описание элементов «Дублинского ядра» Title Имя элемента Заголовок Creator Автор Subject Предмет Description Описание Publisher Издатель Участник Contributor создания материала Date Дата Type Тип Format Формат Identifier Идентификатор Source Источник Language Язык Таблица А.1. Описание элементов Dublin Core Описание элемента Название, присвоенное ресурсу создателем или издателем. Человек или организация, изначально ответственная за интеллектуальное содержание ресурса (в случае рукописного документа это авторы, исполнители, фотографы или иллюстраторы в случае визуальных ресурсов). Тема ресурса. Обычно предмет выражается в ключевых словах или фразе, описывающей предмет или содержание ресурса. Приветствуется использование контролируемых словарей и формальных схем классификации. Текстовое описание содержания ресурса, включая реферат в случае документов или описание содержания в случае визуального ресурса. Организация, ответственная за создание ресурса в его нынешней форме, например, издательский дом, университетский департамент или корпорация. Человек или организация, которые не являются авторами (не обозначены в элементе “автор”), но внесли значительный интеллектуальный вклад в ресурс, однако чей вклад вторичен по отношению к любому человеку или организации, указанной в числе авторов, например, редактор, переводчик, иллюстратор. Дата, указывающая на время создания или появления (в доступном виде) ресурса. Категория ресурса, например, домашняя страничка, роман, поэма, статья, препринт, технический отчет, эссе, словарь. Для выражения типа может использоваться следующий минимальный набор обобщенных значений: текст (text); изображение (image); звук (sound); набор данных (dataset); программа (software); интерактивная система (interactive); событие (event), которое в свою очередь может также быть детализировано до конференции, семинара, круглого стола, выставки, проекта; физический объект (physical object). Формат представления данных ресурса (обычно указывается тип программного обеспечения и, возможно, тип компьютера, которые могут быть необходимы для отображения и работы с ресурсом). Для данного элемента рекомендуется выбирать значения из множества типов контента MIME (Multipurpose Internet Mail Extensions), такие как text/xml (документ на xml), text/plain (текст без форматирования и разметки), image/gif (изображение в формате gif). Набор букв или цифр, используемый для уникальной идентификации ресурса. В случае сетевых ресурсов примерами являются URL и URN. Информация о вторичном источнике, из которого был получен настоящий ресурс. Язык, на котором изложено интеллектуальное содержание ресурса. 65 Имя элемента Relation Связь Coverage Охват Rights Права Описание элемента Идентификатор вторичного ресурса и его связь с настоящим ресурсом. Этот элемент позволяет связывать между собой близкие ресурсы, а также описания ресурса, которые необходимо показать. Характеристики местонахождения и временной продолжительности ресурса. Утверждение об авторских правах и управление ими; идентификатор, связанный с таким утверждением; идентификатор, связанный с сервисом, представляющим информацию об управлении правами на данный ресурс. 66 Приложение B. Оценка технологий создания предметно-ориентированного языка Таблица B.1. Оценка технологий создания предметно-ориентированного языка MS DSL Tools, UFOEclipse GMF MPS REAL-IT State Machine toolkit Designer 0 0 0 0 0 Вес MetaEdit+ 1 1 Возможность модификации метаязыка 1 1 0 0 0 0 0 Создание визуальных DSL 1 1 1 1 0 1 1 Создание текстовых DSL 1 0 0 0 1 0 0 Наличие средств «ручной» доработки DSL 1 0 1 1 1 1 0 Возможность изменения графического редактора для работы с DSL Возможность горизонтальной трансформации моделей 1 1 1 1 0 0 0 1 0 0 0 0 0 0 Интеграция нескольких DSL 1 1 1 1 1 0 0 Отчуждаемость DSL от DSM-платформы 1 0 0 0 0 0 0 Сумма 9 5 4 4 3 2 1 Динамическое метамоделей изменение описания 67 Приложение C. Метамодель описания реквизитов электронного документа Рисунок C.1. Метамодель описания реквизитов электронного документа 68 Приложение D. MXM-файл графа метамодели EDocSACD <?xml version="1.0" encoding="UTF-8"?> <gxl xmlns="http://www.metacase.com/gxlGOPRRType" xmlns:sym="http://www.metacase.com/symbol"> <graph description="" id="Metamodel__Elementy_26_7260" typeName="Elementy"> <object description="" id="Object___Box_26_9866" typeName=" Box"> <superType> <object description="" id="Object__Element_26_5096" typeName="Element"> </object> </superType> </object> <object description="" id="Object__Column_26_5232" typeName="Column"> <superType> <object href="#Object__Element_26_5096"></object> </superType> </object> <object description="" id="Object__Document_26_5758" typeName="Document"> <slot id="p26_5151" name="title" unique="false"> <property description="" id="Property_title_26_5151" typeName="title"> <dataType> <simpleType>String</simpleType> </dataType> <widget>Input Field</widget> </property> </slot> </object> <object description="" id="Object__Image_26_5183" typeName="Image"> <superType> <object href="#Object__Element_26_5096"></object> </superType> <slot id="p26_5151" name="title" unique="false"> <property description="" id="Property_title_26_5151" typeName="title"> <dataType> <simpleType>String</simpleType> </dataType> <widget>Input Field</widget> </property> </slot> </object> <object description="" id="Object__Link_26_8731" typeName="Link"> <superType> <object href="#Object__Element_26_5096"></object> </superType> <slot id="p26_16555" name="link" unique="false"> <property description="" id="Property_link_26_16555" typeName="link"> <dataType> <simpleType>String</simpleType> </dataType> <widget>Input Field</widget> </property> </slot> </object> <object description="" id="Object__Paragraph_26_5140" typeName="Paragraph"> <superType> <object href="#Object__Element_26_5096"></object> </superType> <slot id="p26_8405" name="number" unique="false"> <property description="" id="Property_number_26_8405" typeName="number"> <dataType> <simpleType>Number</simpleType> </dataType> </property> </slot> </object> <object description="" id="Object__Row_26_5221" typeName="Row"> <superType> <object href="#Object__Element_26_5096"></object> 69 </superType> </object> <object description="" id="Object__Table_26_5194" typeName="Table"> <superType> <object href="#Object__Element_26_5096"></object> </superType> <slot id="p26_5151" name="title" unique="false"> <property description="" id="Property_title_26_5151" typeName="title"> <dataType> <simpleType>String</simpleType> </dataType> <widget>Input Field</widget> </property> </slot> </object> <relationship description="" id="Relationship__have_26_5265" typeName="have"> </relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <relationship href="#Relationship__have_26_5265"></relationship> <role description="" id="Role__Abzac_26_5437" typeName="Abzac"> </role> <role href="#Role__Abzac_26_5437"></role> <role description="" id="Role__Box_26_8588" typeName="Box"> </role> <role href="#Role__Box_26_8588"></role> <role description="" id="Role__Document_26_5780" typeName="Document"> </role> <role description="" id="Role__Predlozenie_26_5363" typeName="Predlozenie"> </role> <role href="#Role__Predlozenie_26_5363"></role> <role href="#Role__Predlozenie_26_5363"></role> <role description="" id="Role__Stolbec_26_5511" typeName="Stolbec"> </role> <role description="" id="Role__Stroka_26_5478" typeName="Stroka"> </role> <role description="" id="Role__Tablica_26_5470" typeName="Tablica"> </role> <role href="#Role__Tablica_26_5470"></role> <role href="#Role__Tablica_26_5470"></role> <role href="#Role__Abzac_26_5437"></role> <role href="#Role__Box_26_8588"></role> <role href="#Role__Box_26_8588"></role> <role href="#Role__Box_26_8588"></role> <role description="" id="Role__Element_26_5821" typeName="Element"> </role> <role description="" id="Role__Izorazenie_26_5627" typeName="Izorazenie"> </role> <role href="#Role__Izorazenie_26_5627"></role> <role href="#Role__Izorazenie_26_5627"></role> <role href="#Role__Predlozenie_26_5363"></role> <role description="" id="Role__Simvol_26_5371" typeName="Simvol"> </role> <role description="" id="Role__Slovo_26_5404" typeName="Slovo"> </role> <role href="#Role__Stolbec_26_5511"></role> <role href="#Role__Stroka_26_5478"></role> <binding> <relationship href="#Relationship__have_26_5265"></relationship> 70 <connection> <role href="#Role__Predlozenie_26_5363"></role> <object description="" id="Object__Sentence_26_5129" typeName="Sentence"> <superType> <object href="#Object__Element_26_5096"></object> </superType> <slot id="p26_8405" name="number" unique="false"> <property description="" id="Property_number_26_8405" typeName="number"> <dataType> <simpleType>Number</simpleType> </dataType> </property> </slot> <slot id="p26_8421" name="content" unique="false"> <property description="" id="Property_content_26_8421" typeName="content"> <dataType> <simpleType>Text</simpleType> </dataType> </property> </slot> </object> </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Slovo_26_5404"></role> <object description="" id="Object__Word_26_5107" typeName="Word"> <superType> <object href="#Object__Element_26_5096"></object> </superType> <slot id="p26_8974" name="description" unique="false"> <property description="" id="Property_description_26_8974" typeName="description"> <dataType> <simpleType>String</simpleType> </dataType> <widget>Input Field</widget> </property> </slot> </object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Abzac_26_5437"></role> <object href="#Object__Paragraph_26_5140"></object> </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Predlozenie_26_5363"></role> <object href="#Object__Sentence_26_5129"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Predlozenie_26_5363"></role> <object href="#Object__Sentence_26_5129"></object> </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Simvol_26_5371"></role> <object description="" id="Object__Symbol_26_5118" typeName="Symbol"> <superType> 71 <object href="#Object__Element_26_5096"></object> </superType> </object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Tablica_26_5470"></role> <object href="#Object__Table_26_5194"></object> </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Stroka_26_5478"></role> <object href="#Object__Row_26_5221"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Tablica_26_5470"></role> <object href="#Object__Table_26_5194"></object> </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Stolbec_26_5511"></role> <object href="#Object__Column_26_5232"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Abzac_26_5437"></role> <object href="#Object__Paragraph_26_5140"></object> </connection> <connection> <role href="#Role__Izorazenie_26_5627"></role> <object href="#Object__Image_26_5183"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Predlozenie_26_5363"></role> <object href="#Object__Sentence_26_5129"></object> </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Izorazenie_26_5627"></role> <object href="#Object__Image_26_5183"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Document_26_5780"></role> <object href="#Object__Document_26_5758"></object> </connection> 72 <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Element_26_5821"></role> <object href="#Object__Element_26_5096"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Tablica_26_5470"></role> <object href="#Object__Table_26_5194"></object> </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Box_26_8588"></role> <object href="#Object___Box_26_9866"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Stolbec_26_5511"></role> <object href="#Object__Column_26_5232"></object> </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Box_26_8588"></role> <object href="#Object___Box_26_9866"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Stroka_26_5478"></role> <object href="#Object__Row_26_5221"></object> </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Box_26_8588"></role> <object href="#Object___Box_26_9866"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Box_26_8588"></role> <object href="#Object___Box_26_9866"></object> </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Izorazenie_26_5627"></role> <object href="#Object__Image_26_5183"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <role href="#Role__Box_26_8588"></role> <object href="#Object___Box_26_9866"></object> 73 </connection> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Abzac_26_5437"></role> <object href="#Object__Paragraph_26_5140"></object> </connection> </binding> <binding> <relationship href="#Relationship__have_26_5265"></relationship> <connection> <cardinality start="1" stop="N"></cardinality> <role href="#Role__Box_26_8588"></role> <object href="#Object___Box_26_9866"></object> </connection> <connection> <role href="#Role__Tablica_26_5470"></role> <object href="#Object__Table_26_5194"></object> </connection> </binding> <constraints> <uniqueness> <object href="#Object__Paragraph_26_5140"></object> <propertyName>number</propertyName> </uniqueness> <uniqueness> <object href="#Object__Sentence_26_5129"></object> <propertyName>number</propertyName> </uniqueness> </constraints> </graph> </gxl> 74 Приложение E. Метамодель описания структуры и содержания ЭД Рисунок E.1. Метамодель описания структуры и содержания электронных документов 75 Приложение F. Сгенерированный отчет метамодели описания элементов ЭД Elementy Documentation Report Filename: Status: Date: Author: Elementy 11.06.2014 Agalakova Elena 76 Elementy: Metamodel [GOPRR] Properties [GOPRR]: Constraints [GOPRR]: Description [GOPRR]: Diagram picture: Elementy Graph dictionary Object Box Column Document Element Image Note Ontology Paragraph Row Sentence Symbol Table Word Type of Object Object [GOPRR] Object [GOPRR] Object [GOPRR] Object [GOPRR] Object [GOPRR] Object [GOPRR] Object [GOPRR] Object [GOPRR] Object [GOPRR] Object [GOPRR] Object [GOPRR] Object [GOPRR] Object [GOPRR] Box: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Documentation Box N Box relationships: In role Box: First role [GOPRR] Box: First role [GOPRR] Box: Last role [GOPRR] Box: Last role [GOPRR] Box: Last role [GOPRR] : Subtype [GOPRR] With objects(s) Binding Image In relationship have: [GOPRR] have: [GOPRR] have: [GOPRR] have: [GOPRR] have: [GOPRR] : [GOPRR] Box links: Link type Decomposition Explosions Binding Paragraph Binding Table Binding Column Binding Row Inheritance Graph's name none none Column: Object [GOPRR] Properties: 77 Element In role Izorazenie: Last role [GOPRR] Abzac: Last role [GOPRR] Tablica: First role [GOPRR] Stolbec: First role [GOPRR] Stroka: First role [GOPRR] : Supertype [GOPRR] Column Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] N Column relationships: In role With objects(s) Binding Box In relationship Stolbec: First role have: [GOPRR] [GOPRR] Stolbec: Last role have: [GOPRR] [GOPRR] : Subtype [GOPRR] : [GOPRR] Column links: Link type Decomposition Explosions Binding Table Inheritance Eleme Box: Last role [GOPRR] Tablica: First role [GOPRR] : Supertype [GOPRR] nt Graph's name none none Document: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Document title N Document relationships: In role In relationship Document: First role have: Binding [GOPRR] [GOPRR] Document links: Link type Decomposition Explosions Element: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] In role With objects(s) Element In role Element: Last role [GOPRR] Graph's name none none Element 0 Element relationships: In role In relationship Element: Last have: Binding role [GOPRR] [GOPRR] : Supertype : Inheritance [GOPRR] [GOPRR] : Supertype : Inheritance [GOPRR] [GOPRR] : Supertype : Inheritance [GOPRR] [GOPRR] With objects(s) Document Symbol Row Image 78 In role Document: First role [GOPRR] : Subtype [GOPRR] : Subtype [GOPRR] : Subtype [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] Supertype Supertype Supertype Supertype Supertype Supertype Supertype : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] Element links: Link type Decomposition Explosions Image: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Inheritance Column Inheritance Paragraph Inheritance Table Inheritance Word Inheritance Sentence Inheritance Ontology Inheritance Box Note: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Subtype Subtype Subtype Subtype Subtype Subtype Subtype Graph's name none none Image title N Image relationships: In role In relationship Izorazenie: Last have: Binding role [GOPRR] [GOPRR] Izorazenie: Last have: Binding role [GOPRR] [GOPRR] Izorazenie: Last have: Binding role [GOPRR] [GOPRR] : Subtype : Inheritance [GOPRR] [GOPRR] Image links: Link type Decomposition Explosions : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] : [GOPRR] With objects(s) Paragraph Sentence Box Element Graph's name none none Note Description N Note relationships: none Note links: 79 In role Abzac: First role [GOPRR] Predlozenie: First role [GOPRR] Box: First role [GOPRR] : Supertype [GOPRR] Link type Decomposition Explosions Graph's name none none Ontology: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Ontology Onto-link N Ontology relationships: In role In relationship : Subtype : Inheritance [GOPRR] [GOPRR] Ontology links: Link type Decomposition Explosions In role : Supertype [GOPRR] Graph's name none none Paragraph: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Paragraph number Onto-link N Paragraph relationships: In role In relationship Abzac: First role have: Binding [GOPRR] [GOPRR] Abzac: First role have: Binding [GOPRR] [GOPRR] Abzac: Last role have: Binding [GOPRR] [GOPRR] : Subtype : Inheritance [GOPRR] [GOPRR] Paragraph links: Link type Decomposition Explosions With objects(s) Sentence Image Box Element In role Predlozenie: Last role [GOPRR] Izorazenie: Last role [GOPRR] Box: First role [GOPRR] : Supertype [GOPRR] Graph's name none none Row: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Row relationships: In role Stroka: First role With objects(s) Element Row N In relationship have: Binding With objects(s) Box 80 In role Box: Last role [GOPRR] [GOPRR] Stroka: Last role have: [GOPRR] [GOPRR] : Subtype : [GOPRR] [GOPRR] Binding Inheritance Row links: Link type Decomposition Explosions Sentence number content Onto-link 0 Sentence relationships: In role In relationship Predlozenie: have: Binding First role [GOPRR] [GOPRR] Predlozenie: have: Binding First role [GOPRR] [GOPRR] Predlozenie: have: Binding First role [GOPRR] [GOPRR] Predlozenie: have: Binding Last role [GOPRR] [GOPRR] : Subtype : Inheritance [GOPRR] [GOPRR] Sentence links: Link type Decomposition Explosions With objects(s) Word Symbol Image Paragraph Element In role Slovo: Last role [GOPRR] Simvol: Last role [GOPRR] Izorazenie: Last role [GOPRR] Abzac: First role [GOPRR] : Supertype [GOPRR] Graph's name none none Symbol 0 Symbol relationships: In role In relationship Simvol: Last role have: Binding [GOPRR] [GOPRR] : Subtype : Inheritance [GOPRR] [GOPRR] Symbol links: Link type Decomposition Explosions Element [GOPRR] Tablica: First role [GOPRR] : Supertype [GOPRR] Graph's name none none Sentence: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Symbol: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Table With objects(s) Sentence Element Graph's name none none 81 In role Predlozenie: First role [GOPRR] : Supertype [GOPRR] Table: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Table relationships: In role Tablica: First role [GOPRR] Tablica: First role [GOPRR] Tablica: First role [GOPRR] : Subtype [GOPRR] Table title Onto-link N In relationship have: [GOPRR] have: [GOPRR] have: [GOPRR] : [GOPRR] Binding Column Stolbec: Last role [GOPRR] Binding Box Box: Last role [GOPRR] Element : Supertype [GOPRR] Stroka: Last role [GOPRR] Graph's name none none Word: Object [GOPRR] Properties: Object name [GOPRR] Property [GOPRR]s Occurrence [GOPRR] Description [GOPRR] Word description 0 In relationship Slovo: Last role have: [GOPRR] [GOPRR] : Subtype [GOPRR] : [GOPRR] Word links: Link type Decomposition Explosions In role Inheritance Table links: Link type Decomposition Explosions Word relationships: In role With objects(s) Binding Row With objects(s) Binding Sentence Inheritance Graph's name none none 82 Element In role Predlozenie: First role [GOPRR] : Supertype [GOPRR] Приложение G. Форма приказа о зачислении на 1 курс ??.??.???? ПРИКАЗ № ??.?-??/???? О зачислении на 1 курс факультета бизнес-информатики Пермского филиала Государственного университета – Высшей школы экономики На основании решения Приемной комиссии Государственного университета – Высшей школы экономики (протокол от ??.??.???? № ?-??) ПРИКАЗЫВАЮ: Зачислить в 2010 году на 1 курс факультета бизнес-информатики по направлению 080700.62 «Бизнес-информатика» на очную форму обучения на места, обеспеченные государственным финансированием, абитуриентов согласно списку (приложение). Должность подпись 83 Ф.И. Отчество Приложение H. Образец письма-извещения Тверской областной Дом печати Справочные данные об организации-авторе тел.: факс: Главному редактору газеты «Вперед» г-ну О.Б. Соколову 10.01.2005 №9 На № _________от____________ О переносе заседания Уважаемый Олег Борисович! Сообщаем Вам, что заседание главных редакторов переносится на 1 февраля 2000 г. на 15.00. Повестка заседания остается без изменений. Секретарь Совета подпись 84 М.Н. Козлов