Технология подготовки интерактивных электронных публикаций социальноэкономической информации Арушанян О.Б., Богомолов Н.А., Ковалев А.Д., Синицын М.Н. Научно-исследовательский вычислительный центр МГУ имени М.В.Ломоносова г. Москва Наиболее широко используемой формой распространения социальноэкономической информации являются тематические Интернет сайты, обеспечивающие доступ пользователей к публикуемой информации. Однако при решении задач охраны интеллектуальной собственности при организации широкого доступа к информационным ресурсам библиотек и оказанию пользователям библиотек качественных информационных услуг сохраняет актуальность способ распространения информации в виде заранее подготовленных электронных документов, которые могут размещаться на оптических носителях информации, рассылаться по электронной почте или скачиваться с ресурсов сети Интернет. В докладе будет представлен опыт практического применения технологии подготовки электронных публикаций, оформленных в виде самостоятельных электронных интерактивных документов, разрабатываемой в НИВЦ МГУ имени М.В.Ломоносова на примерах решения задач массового коммерческого распространения информации социально экономической направленности. Для информации социально экономической направленности характерно представление в виде больших коллекций различного рода таблиц, диаграмм, картограмм и т.д. Для распространения таких коллекций часто используются документы MS Office (Word, PowerPoint), фрагменты Интернет сайтов в формате HTML, документы в формате PDF и др. Однако, в большинстве случаев, отдельные представления подобных коллекций можно не создавать заранее, а генерировать в процессе просмотра пользователем публикации. Причем генерироваться могут не только графические изображения (диаграммы, картограммы, графики), но и тексты на естественном языке. Представляется, что для распространения подобной информации более удобной для пользователей формой является не статический (заранее подготовленный) электронный документ, а интерактивная электронная публикация, включающая собственно данные и программные средства визуализации и анализа. Каждая организованная таким образом интерактивная электронная публикация является самостоятельным приложением. Качество анализа разнородных данных в интерактивной электронной публикации обеспечивается за счет комплексного характера форм отображения (тексты, интерактивные таблицы, графики, картограммы, схемы), организованных во множество информационных "срезов", которые согласованно изменяются под управлением пользователя, а также возможности самостоятельного выбора состава и вида одновременно отображаемой информации. Например, эти свойства оказываются полезными при создании и использовании электронных - атласов (http://adept.srcc.msu.ru/adept/urov_blag/index.htm). Наличие встроенных в электронную публикацию программных средств доступа к данным позволяет гибко контролировать варианты дальнейшего использования содержащейся в электронной публикации информации и, соответственно, обеспечить нужную степень защиты от несанкционированного копирования. С другой стороны, возможно снабдить электронную публикацию развитыми средствами экспорта данных в широко распространенные офисные и графические пакеты (MS Word, Excel, Corel Draw и т.д.). Технология создания интерактивных электронных публикаций предполагает наличие развитых средств подготовки данных для публикации. Функциональность средств подготовки для подобных публикаций зависит от вида представляемой информации и возможностей результирующих публикаций. Исходные содержательные данные публикаций (тексты, таблицы числовых данных) Метаданные (параметры генерации представлений данных) ПО электронной публикации Набор исходных данных для генерации представлений Интерактивная электронная публикация Программные средства подготовки электронной публикации должны обеспечивать: наполнение набора исходных данных создаваемой публикации как содержательными данными, так и параметрами генерации представлений, определяющими для каждого самостоятельно публикуемого фрагмента содержательных данных типы возможных представлений и параметры их визуализации; просмотр отдельных фрагментов и публикации в целом в процессе подготовки; компоновку набора исходных данных и программного обеспечения в дистрибутив публикации для дальнейшего распространения. Рассмотрим пользовательские свойства электронной интерактивной публикации на примере проекта мегаопросов «Георейтинг», который реализуется Фондом «Общественное мнение» с 2003 года (http://www.fom.ru/projects/138.html). Мегаопросы проходят примерно раз в 3 месяца. Опросы проводятся в 65-69 регионах России, в которых проживает около 90% взрослого населения РФ. В каждом субъекте РФ опрашивается 500 респондентов по репрезентативной выборке; то есть в каждом мегаопросе «Георейтинга» опрашивается приблизительно 35 тысяч человек. Программные средства технологии позволяют автоматически создавать из табличного представления результатов опросов интерактивные электронные публикации в виде атласов картограмм и диаграмм, интерактивных таблиц, которые позволяют сопоставить регионы России по отношению к различным проблемам общественной жизни, самостоятельно кластеризовать интересующую информацию, обеспечить навигацию по числовым информационным массивам. Окно просмотра таблиц содержит элементы управления, позволяющие изменять порядок столбцов, выполнять сортировку строк по возрастанию или убыванию значений любого столбца. Значения в каждом столбце таблицы группируются в соответствии с заданным пользователем алгоритмом кластеризации. Результаты группировки данных столбцов могут отображаться за счет изменения цвета фона ячеек таблицы. Окно просмотра таблиц управляет представлением выделенных столбцов таблицы в виде картограмм и диаграмм. И картограммы и диаграммы отображаются в специальных графических окнах. При построении картограмм и диаграмм используются те же параметры группировки элементов данных и цветовая шкала, что и при закраске фона ячеек таблицы. Графические окна «привязаны» к окну просмотра таблиц, по инициативе которого они были открыты. Изображение в таких графических окнах обновляется автоматически при смене текущего выбранного столбца в соответствующем окне просмотра таблиц. При закрытии окна просмотра таблиц связанные с ним графические окна также закрываются автоматически. Для сравнения текущего графического представления фрагмента данных с графическими изображениями других фрагментов данных, можно «расцепить» связь графического окна с окном просмотра таблиц. Нарушенная связь с окном просмотра таблиц уже не восстанавливается. Графическое окно, «потерявшее» эту связь, остается открытым при закрытии окна просмотра таблиц. Графические окна имеют элементы управления, позволяющие масштабировать изображение. Таким образом, предлагаемая технология обеспечивает полный цикл производства интерактивных электронных публикаций. Исходным материалом являются числовые данные в табличной форме, а результирующие публикации обеспечивают конечного пользователя удобными средствами просмотра и анализа исходных данных в виде интерактивных таблиц, картограмм и диаграмм. Кроме того, на всех этапах производства электронных публикаций автоматически подготавливаемые графические представления исходных данных могут быть экспортированы с полиграфическим качеством, как для печати, так и для включения в другие презентационные материалы.