региональный центр высокопроизводительных вычислений

реклама
Секция B. Наукоемкие компьютерные технологии:
высокопроизводительные вычисления,
ИПИ-технологии, программирование
ОПЫТ ЭКСПЛУАТАЦИИ РАСПРЕДЕЛЕННОЙ СИСТЕМЫ ДИСПЕТЧЕРСКОГО
УПРАВЛЕНИЯ ЭНЕРГОЭФФЕКТИВНЫМИ ОБЪЕКТАМИ УЧЕБНЫХ
ЗАВЕДЕНИЙ БЕЛГОРОДСКОЙ ОБЛАСТИ
А.В.Белоусов, А.Н.Потапенко, Л.И.Колтунов
Белгородский государственный технологический университет (БГТУ) им.
В.Г.Шухова
Тел.: (0722) 25-98-21, факс: (0722) 25-71-39, e-mail: [email protected]
В рамках программы «Энергосбережение Минобразования России на 1998-2005 гг.» был разработан
в 2000 г. комплекс мероприятий по энергосбережению и сокращению коммунальных расходов в учебных
заведениях Белгородской области с учетом трехстороннего соглашения между Минобразования РФ,
Минэнерго РФ и администрацией области. Курирование научно-технической деятельности по
реализации энергосберегающих технологий с применением современных информационных технологий и
телекоммуникаций в учебных заведениях региона осуществляется БГТУ, являющегося базовым вузом в
Белгородской области с 2000 г.
Проблемы рационального использования энергетических ресурсов является особенно актуальными
для Белгородской области, в связи с отсутствием собственных природных топливно-энергетических
ресурсов и при мизерном количестве вырабатываемой энергии (менее 5%).
На базе БГТУ создана демонстрационная зона по энергосбережению на основе автоматизированной
системы диспетчерского управления (АСДУ) распределенными энергосистемами комплекса зданий вуза,
включающая 13 энергоэффективных индивидуальных тепловых пунктов (ИТП) и 7 автоматизированных
приточно-вентиляционных установок (ПВУ) и тепловых завес.
Аналогичный проект разработан для Белгородского государственного университета (БелГУ).
Основная цель проекта АСДУ для комплекса БелГУ заключается в обеспечении энергоэффективного
режима работы систем теплоснабжения учебных корпусов и зданий вуза. Первая очередь АСДУ
внедрена в 2003 г.
При выполнении программы по энергосбережению созданы энергоэффективные ИТП в 3 учебных
заведениях области: Старооскольском технологическом институте (филиале) МГИСиС, Старооскольском
геолого-разведочном техникуме и Белгородском механико-технологическом колледже, причем для
филиала МГИСиС внедрен проект пофасадного регулирования температурного режима главного
учебного корпуса.
В Белгородском техническом лицее №17 и Старооскольском политехническом колледже
установлены узлы учета расхода газа, система его аварийного отключения и узлы учета тепловой
энергии.
В
докладе
представлены
особенности
разработанной
многоуровневой
структуры
автоматизированной системы управления распределенными объектами на примере БГТУ. Нижний
уровень автоматизированной системы содержит первичные измерительные преобразователи,
осуществляющие непрерывно или с минимальным интервалом усреднения измеряемых параметров на
распределенных объектах, локальные регуляторы (контроллеры), обеспечивающие регулирование,
например, ПВУ, системой отопления и горячего водоснабжения с учетом особенностей инженерных
систем зданий, приборы узлов учета тепловой энергии и др. Средний уровень автоматизированной
системы содержит контроллеры со встроенным программным обеспечением для выполнения заданных
задач, осуществляющие в заданном цикле интервала усреднения сбор информации с распределенных
датчиков, накопление, предварительную обработку и передачу этих данных на верхний уровень
автоматизированной системы управления и соответственно передачу управляющих сигналов с верхнего
уровня на локальные регуляторы нижнего уровня. Верхний уровень содержит персональный компьютер с
программным обеспечением для SCADA-систем, осуществляющий сбор информации с контроллеров
среднего уровня, основную обработку поступившей информации с распределенных объектов,
отображение и документирование данных в виде, удобном для наблюдения за работой системы.
На АРМ диспетчера функционируют следующие программные модули: среда для программирования
контроллеров среднего уровня, среда разработки и среда выполнения InTouch, сервер ввода-вывода
84
Modbus и программное обеспечение, позволяющее публиковать информацию о функционировании
АСДУ в Интернете. Взаимодействие между программными компонентами осуществляется по протоколу
DDE. Обмен между средним и верхним уровнем осуществляется по протоколу Modbus.
Представлены разработки структур информационных связей автоматизированных систем
управления на примере демонстрационной зоны по энергосбережению, а также особенности АРМ
диспетчера АСДУ и особенности применения средств компьютерной телефонии для удаленного доступа
к технологическим параметрам распределенных объектов и применения Интернет-технологий для
удаленной диспетчеризации.
Внедрение АСДУ позволило к концу 2003 г. перевести 52% тепловых пунктов от их общего числа на
автоматическое регулирование потребления тепловой энергии с общей тепловой нагрузкой в
относительном выражении более 70% с учетом ПВУ. В 2002 г. коммунальные расходы были снижены на
22%. Экономия тепловой энергии по вузу в абсолютном выражении составила около 4000 Гкал, причем
за счет энергоэффективной работы автоматизированных ИТП она составила около 3000 Гкал или
порядка 800 тыс. рублей.
ОСОБЕННОСТИ СТРУКТУРЫ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ
ДИСПЕТЧЕРСКОГО УПРАВЛЕНИЯ КОМПЛЕКСА БЕЛГОРОДСКОГО
ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
А.В.Белоусов, Е.А.Потапенко, С.В.Костриков
Белгородский государственный технологический университет (БГТУ) им.
В.Г.Шухова
Тел.: (0722) 25-98-21, факс: (0722) 25-71-39, e-mail: [email protected]
Курирование научно-технической деятельности по реализации энергосберегающих технологий с
применением современных информационных технологий и телекоммуникаций в учебных заведениях
региона осуществляется БГТУ им. В.Г.Шухова, являющегося базовым вузом в Белгородской области.
На базе БГТУ создана демонстрационная зона по энергосбережению на основе автоматизированной
системы диспетчерского управления (АСДУ), входящая в состав региональных центров
энергосбережения, утвержденных Минобразования РФ.
Аналогичный проект разработан для Белгородского государственного университета (БелГУ).
Основная цель проекта АСДУ для комплекса БелГУ заключается в обеспечении энергоэффективного
режима работы систем теплоснабжения учебных корпусов и зданий вуза.
В докладе представлены особенности систем теплоснабжения зданий БелГУ, заключающиеся в
применение закрытой системы централизованного теплоснабжения зданий при независимом
присоединением отопительных систем зданий к наружным тепловым сетям. Особенность разработанной
АСДУ заключается в том, что на нижнем ее уровне находятся локальные системы регулирования
распределенными энергосистемами учебных корпусов и зданий БелГУ, а на верхнем – диспетчерский
пульт управления на базе персонального компьютера.
Внедрение
многоуровневой
АСДУ
с
энергоэффективными
тепловыми
пунктами
и
автоматизированными приточно-вентиляционными установками позволяет не только создать
комфортные условия в помещениях учебных корпусов, но прежде всего выполнить энергосберегающие
мероприятия:
 регулирование расхода теплоносителя в зависимости от температуры наружного воздуха, что
позволяет избежать перерасхода тепловой энергии в весенне-осенние периоды;
 изменение подачи теплоносителя согласно суточного и недельного графика с учетом снижения
теплопотребления в праздничные дни и каникулы;
 отключение отопления при достижении заданной температуры наружного воздуха (например, +10
0С);
 пуск и выключение приточно-вентиляционных установок согласно расписанию занятий и
регулирование в них расхода теплоносителя через воздухонагреватели с учетом температуры
наружного воздуха, а также реализация других преимуществ автоматизированных систем.
Основное регулирование в АСДУ осуществляется с центрального пульта управления согласно
программам и автономно через автоматические регуляторы (контроллеры) нижнего уровня, что
существенно повышает уровень надежности в работе системы в целом.
Локальные САР отопления нижнего уровня АСДУ обеспечивают экономию и рациональное
использование тепловой энергии в помещениях зданий путем изменения расхода теплоносителя в
системе с учетом температурного графика подачи теплоносителя, температуры наружного воздуха и
температуры внутри зданий. Локальные САР отопления являются двухконтурными, что повышает
динамическую устойчивость и точность регулирования. Локальные САР горячего водоснабжения
обеспечивают стабилизацию заданной температуры в системах ГВС зданий путем изменения расхода
теплоносителя в 2-х ступенчатом теплообменнике. Особенность САР горячего водоснабжения
заключается в том, что она реализована для закрытой системы централизованного теплоснабжения и
имеет высокоскоростной водоподогреватель. Локальные САР горячего водоснабжения являются
85
одноконтурными и функционируют по пропорциональному закону регулирования. Автоматизация ПВУ,
состоящих из воздухонагревателей (калориферов) и вентиляторов, заключается в управлении потоками
теплоносителя и воздуха по заданному алгоритму.
На АРМ диспетчера функционируют следующие программные модули: среда для программирования
контроллеров среднего уровня (Soft-Logic верхнего уровня), которая взаимодействует с программным
обеспечением контроллера телеметрии (Soft-Logic нижнего уровня), среда разработки и среда
выполнения InTouch, сервер ввода-вывода Modbus и программное обеспечение, позволяющее
публиковать информацию о функционировании АСДУ в Интернет и локальной вычислительной сети
(ЛВС). Взаимодействие между программными компонентами осуществляется по протоколу DDE. Обмен
между средним и верхним уровнем осуществляется по протоколу Modbus. В связи с тем, что учебные
корпуса БелГУ распределены на территории и находятся на значительном удалении, в структуре
технологической сети присутствуют несколько сегментов сети, соединенных при помощи радиомодемов.
ПОДХОД К СОЗДАНИЮ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
ВЫЧИСЛИТЕЛЬНЫМИ СЕТЯМИ
Ю.С.Данилюк
Бийский технологический институт Алтайского государственного технического
университета им. И.И.Ползунова
Тел.: (3854) 25-24-86, e-mail: [email protected]
В настоящее время наблюдается активное развитие крупных локальных вычислительных сетей и
сетей масштаба города, создаваемых с использованием технологий IP, Ethernet и DSL. Протекающие в
подобных сетях процессы, как правило, характеризуются резкими периодичными снижениями
эффективности работы. Причина этого заключается в сложном характере взаимодействия компонент
вычислительных сетей. С одной стороны это коммуникационное оборудование и линии связи, с
присущими им ограничениями, а с другой стороны – сетевые приложения, как правило, использующие
адаптивный протокол TCP, работающий поверх протокола Ethernet. Обеспечение эффективной работы
подобных вычислительных сетей с сильной неоднородностью, обусловленной разнообразием
применяемого коммуникационного оборудования, сетевого программного обеспечения, разной
пропускной способности линий связи и особенностей их загрузки, как правило, требует серьезных усилий
сетевых администраторов.
Имеющийся в настоящее время инструментарий по управлению компонентами вычислительных
сетей, как правило, ограничивается коммуникационным оборудованием или программным обеспечением
одного производителя. Возможности по взаимодействию с другими инструментами и реализации
автоматического режима управления зачастую сильно ограничены или отсутствуют. Таким образом,
реализуемые с помощью подобных инструментов решения, как правило, отличаются отсутствием
комплексного управления и низкой степенью автоматизации, что выражается в низкой эффективности
работы вычислительной сети.
В свете всего вышесказанного, представляется актуальной задача создания систем автоматического
управления вычислительными сетями, соответствующих следующим требованиям:
 точность – система должна принимать точные решения, учитывающие максимально большое
количество аспектов протекающих в вычислительной сети процессов;
 оперативность – процессы в современных вычислительных сетях отличаются скоротечностью,
запаздывающее правильное управляющее воздействие зачастую производит эффект, обратный
ожидаемому;
 универсальность – система по возможности должна охватывать все классы объектов
вычислительной сети и быть адаптируемой к условиям разных вычислительных сетей, что
позволит создавать комплексные системы автоматического управления. Для решения этой задачи
была разработана методика построения систем автоматического управления вычислительными
сетями.
Структура систем управления, создаваемых в соответствии с предлагаемой методикой, полностью
повторяет каноническую модель системы автоматического управления, где в качестве объекта
управления выступает вычислительная сеть, представляемая множеством её объектов, а ядром
системы является программный модуль, обрабатывающий информацию о состоянии объекта
управления, и вырабатывающий управляющие воздействия. Взаимодействие ядра системы и объекта
управления осуществляется посредством интерфейсных модулей, задачей которых является
выполнение действий, связанных со сбором информации и передачей управляющих воздействий
объектам вычислительной сети.
Ядром создаваемых систем управления являются статистические модели или нейронные сети,
определяющие некоторый набор зависимостей управляющих воздействий от известного состояния
объекта управления. Подобный выбор обусловлен требованием оперативности, то есть ядро системы
должно характеризоваться стабильностью времени отклика и реализовываться на базе алгоритмов с
высокой вычислительной эффективностью.
86
В качестве источника информации о зависимостях между управляющими воздействиями и
состояниями объекта управления используются имитационные модели вычислительных сетей. Такой
выбор обусловлен рядом причин. Первой причиной, обуславливающей неприменимость аналитических
моделей, является потребность в инструменте, позволяющем детально воспроизводить процессы,
протекающие в реальных вычислительных сетях. Второй причиной является практическая
невозможность применения натурных моделей объекта управления, обусловленная высокими затратами
времени, большой трудоемкостью и дороговизной процесса получения детальной информации о
функционировании вычислительной сети. Таким образом, имитационное моделирование является
единственным практически реализуемым путем получения детальной информации о работе
вычислительной сети при создании ядра системы управления. Кроме того, использование имитационной
модели объекта управления предоставляет возможность разрабатывать систему управления уже на
этапе проектирования вычислительной сети, когда имитационная модель используется для проверки тех
или иных аспектов работы проектируемого объекта.
Еще одним требованием, определившим структуру создаваемых управляющих систем, было
требование универсальности – способности системы получать информацию о состоянии
вычислительной сети и реализовывать управляющие воздействия, взаимодействуя с широким спектром
неоднородных объектов, таких как коммутаторы, маршрутизаторы, мосты, ЭВМ, системное и прикладное
программное обеспечение. Разработка методики создания систем управления, предусматривающей все
особенности компонентов вычислительных сетей, потребовала создания унифицированного интерфейса
для сбора информации и реализации управляющих воздействий, позволяющего ядру системы
управления абстрагироваться от конкретных особенностей используемого сетевого оборудования и
программного обеспечения. Для этого был разработан набор программных модулей, которые
предоставляют унифицированный интерфейс ядру системы, реализуя требуемые функции посредством
взаимодействия с компонентами сети в терминальном режиме (через интерфейс RS-232, протоколы
Telnet и SSH) и по протоколу SNMP. Такой подход позволяет эффективно взаимодействовать со всем
спектром современного коммуникационного оборудования, так как позволяет задействовать практически
все используемые в настоящее время механизмы управления сетевым оборудованием и программным
обеспечением.
Таким образом, процесс создания системы автоматизированного управления в соответствии с
предлагаемой методикой будет заключаться в создании ядра системы управления и связывании ядра с
программными модулями, предоставляющими информацию о сети и реализующими требуемые
управляющие воздействия.
В настоящее время, данная методика и соответствующий программный инструментарий проходят
апробацию в процессе создания системы автоматического управления образовательной
вычислительной сетью города Бийска. Перспективными направлениями развития предлагаемой
методики представляются доработка методики и программного инструментария для создания
децентрализованных систем автоматического управления и применение экспертных систем на разных
этапах методики для сокращения затрат времени.
ПРОБЛЕМЫ ИНТЕГРАЦИИ ДАННЫХ И УНИФИКАЦИИ ДОСТУПА К
ПРИЛОЖЕНИЯМ В ЕДИНОЙ ИНФОРМАЦИОННОЙ СРЕДЕ ВУЗА
В.В.Крюков, К.И.Шахгельдян
Владивостокский государственный университет экономики и сервиса
Тел.: (4232) 40-40-40, e-mail: [email protected]
В настоящее время в вузах в основном завершился переход от локальных программных
приложений, автоматизирующих отдельный деловой процесс и опирающихся на локальный набор
данных, к корпоративным клиент-серверным информационным системам, обеспечивающим доступ
пользователей к оперативным базам данных вуза. В том или ином виде решена задача интеграции
данных, порожденных различными информационными системами, что позволяет усовершенствовать
бизнес-процессы, повысить качество управления и принятия решений. Если в начале 90-х годов был
высокий спрос на бухгалтерское программное обеспечение и программное обеспечение управленческого
учета (учет кадров, отчетность и т.д.), то в настоящее время этот спрос в большей части удовлетворен, и
стоит задача обеспечить достоверными данными о деятельности образовательного учреждения не
только управленческий персонал, но и каждого преподавателя и студента. Т.е. стоит задача научиться
эффективно управлять данными и их доставкой пользователям, а также информационными ресурсами в
единой информационной среде образовательного учреждения, которая, в свою очередь, согласована с
отраслевыми ИТ-решениями.
Как отдельные проблемы интеграции данных на корпоративном уровне решаются задачи по
актуализации и систематизации данных, повышению качества информации и формированию
метаданных информационных систем. Особенностью этого этапа развития корпоративных приложений
является большая трудоемкость сопровождения и модернизации программного обеспечения, так как
изменения в структуре данных приводят к необходимости изменения кода большого числа программ.
Темой сегодняшнего дня становятся технологии и программно-технические решения, позволяющие
обеспечить интеграцию баз данных, унификацию доступа к централизованным данным и возможность
87
формирования агрегированной информации с целью оперативного анализа, долгосрочного
планирования и прогнозирования деятельности вуза. Необходимы средства интеграции, которые
обеспечивали бы не только унифицированный интерфейс к унаследованным и новым информационным
системам, но и позволяли создать информационную инфраструктуру для доступа к корпоративным
ресурсам и сервисам, опирающуюся на единые принципы сетевого взаимодействия и управления
доступом к ресурсам.
Многие вузы, в том числе и Владивостокский государственный университет экономики и сервиса
(ВГУЭС), имеют информационные системы управления, состоящие из различных взаимосвязанных
компонентов и использующие общую структуру данных. Например, во ВГУЭС используются
реляционные СУБД (MS SQL Server, Oracle) для решения задач управления финансами, оргструктурой,
персоналом, учебным процессом, обеспечением учебно-методическими материалами и т.п. Документноориентированная база данных Lotus Notes используется для реализации групповой работы и
документооборота вуза. Применяются клиент-серверные двух- и трехуровневые архитектуры
приложений, компонентные приложения, использующие CORBA-технологию, web-приложения,
использующие Java, Asp, C#, Oracle Application Server. Для задач, связанных с метрическими данными,
используются геоинформационные системы (ESRI GIS, MapObject и MapExterem). Некоторые вузы
используют для автоматизации основной деятельности монолитные решения на базе ERP-систем. Такое
многообразие технологий обусловлено разными причинами, среди которых разные корпоративные
стандарты, необходимость поддержки работы унаследованных систем, опыт персонала ИТподразделения и т.д.
Особенности университета как объекта информатизации связаны с многопрофильным характером
деятельности, обилием форм и методов учебной работы, пространственной распределенностью
инфраструктуры (филиалы, представительства), многообразием источников финансирования, наличием
развитой структуры вспомогательных подразделений и служб (строительная, производственная,
хозяйственная деятельность), необходимостью адаптации к меняющемуся рынку образовательных
услуг, потребностью анализа рынка труда, отсутствием общепринятой формализации деловых
процессов, необходимостью электронного взаимодействия с вышестоящими организациями, частым
изменением статуса сотрудников и обучаемых. Несколько облегчает проблему то, что вуз представляет
собой стабильную, иерархическую по функциям управления систему, обладающую всеми необходимыми
системами жизнедеятельности и действующую на принципах централизованного управления (последнее
означает, что в управлении задачами информатизации может активно использоваться
административный ресурс).
Тенденция развития информационных технологий последних лет связана с формированием в вузе
единой корпоративной информационной среды.
Для создания информационной среды могут использоваться несколько организационнотехнологических подходов. Наибольшее распространение получили два – на основе концепции
использования монолитных систем класса ERP (например, SAP R\3) и на основе развития
корпоративных веб-служб (Web-service). Второй подход состоит в консолидации уже существующих
информационных сервисов с использованием единой концепции сетевого взаимодействия и управления
доступом к ресурсам, что обеспечивает интеграцию данных и унификацию доступа к сервисам и
приложениям. Такой подход, с одной стороны обеспечит перенос в более современную
информационную среду функций унаследованных приложений и дальнейшее использование имеющихся
данных, а с другой стороны позволит в дальнейшем внедрять новые информационные сервисы на базе
единой технологической политики, что упростит сопровождение и развитие корпоративной
информационной среды. Технологией, обеспечивающей данный подход, является концепция
развертывания Web-служб.
Привлекательным второй подход делает то, что вузы обычно уже имеют работающие
информационные системы, функциональность которых вполне адекватна стратегическим и текущим
задачам развития вуза. Проблема состоит в необходимости переноса этой функциональности на новую
технологическую основу, например переход на клиент-серверную архитектуру с «тонким клиентом».
Значительно больше шансов быть успешным имеет ИТ-проект, в котором не требуется кардинальная
смена всех наработанных ранее и используемых информационных систем, а лишь некоторая их
модернизация для интеграции в единую среду.
Во-вторых, особенности развития инноваций в конкретном вузе, а информатизация безусловно
попадает в данную категорию, часто требуют оперативного изменения или наращивания
функциональности определенной ИТ-системы, что значительно проще реализовать собственным
персоналом на базе компонентных архитектур и концепции web-служб.
В настоящее время большинство крупных производителей программного обеспечения (Microsoft,
IBM, Oracle, Sun, Bea и т.п.) заявили о поддержке web-служб и протокола SOAP [1]. Эта технология
позволяет объединить программное обеспечение от различных производителей и обеспечить
интеграцию на уровне данных и унификацию доступа к информационным ресурсам и сервисам. Недавно
анонсирована новая технология, использующая web-службы – Общая шина предприятия (Enterprise
Service Bus - ESB) [2]. Данная технология обеспечивает доступ к информационным сервисам и
маршрутизацию запросов от клиентов к web-службам (объединению поддаются большинство известных
решений, в том числе и ERP-системы). Использование этой технологии в единой информационной среде
вуза выглядит привлекательным решением для перенаправления запросов от одной службы к другой и
использования в одном приложении различных источников данных.
88
Во ВГУЭС завершается разработка единой информационной среды вуза на базе концепции Webслужб. В настоящее время в среду интегрированы приложения .Net (корпоративный портал), клиентсерверные приложения (Delphi, С++), Lotus Notes/Domino, Web-приложения Oracle Application Server
(J2EE). В интеграции участвуют так же СУБД MS SQL Server, Oracle 9i.
Литература
1. Шагурина Н. Web-службы: новая парадигма интеграции?//Сетевой. №2, 2003.
2. Черняк Л. Общая шина предприятия.// Открытые системы №4, 2003.
АППАРАТ НЕЧЕТКИХ МНОЖЕСТВ В ПОИСКОВОМ МЕХАНИЗМЕ СИСТЕМ
КАТАЛОГИЗАЦИИ И УЧЕТА ТЕКСТОВЫХ ДОКУМЕНТОВ
А.Ю.Лексин, О.П.Сергеева, И.М.Кошевой
Владимирский государственный университет
Тел.: (0922) 27-99-47, e-mail: [email protected]
Одной из важных задач для различных систем учета текстовых документов является
предоставление инструментов качественного поиска необходимой информации. Это является
актуальным как для локальных систем автоматизированного документооборота, так и для таких
открытых и больших систем, как образовательные порталы.
Целью настоящей работы являлось определение возможностей и подходов к воплощению идеи
использования математического аппарата теории нечетких множеств и мягких вычислений при
реализации поискового модуля разрабатываемой на кафедре физики и прикладной математики
Владимирского государственного университета библиографической системы. Поиск литературных
источников, посвященных подобной тематике, дал отрицательный результат, что позволяет говорить о
двух возможных причинах: во-первых, о достаточной новизне идеи, а во-вторых, о возможной закрытости
такой информации со стороны разработчиков поисковых систем.
В ходе работы было предложено два подхода по привлечению теории нечетких множеств в
поисковом механизме, один из которых реализован программно. Кроме того, намечены возможные пути
развития идей и проведения исследований по определению эффективности сформулированных
подходов.
Первый вариант использования аппарата нечетких вычислений для обработки запроса пользователя
является, фактически, другой интерпретацией существующего подхода на основе законов Зипфа [1,2].
Отличие состоит в том, что в текстовом анализаторе при выделении значимых слов текста
рассчитывается не интервал на оси "Ранг" [2], который должен содержать именно эти слова, а строится
функция принадлежности. Именно по значениям этой функции отбрасываются слова, которые не могут
повлиять на основное содержание (смысл) анализируемого текста. Для оставшихся слов значения
функции принадлежности заменяют вычисляемые по законам Зипфа весовые коэффициенты слов базы
данных.
Определение вида функции принадлежности является предметом возможных дальнейших
исследований, на основе которых в результате проведения экспериментов с различными ее видами
можно будет выделить именно ту функцию принадлежности, которая будет отражать соответствие
значимости выделенных слов и последующей релевантности запросу. Основное, что нужно помнить при
выборе вида функции принадлежности, – это то, что по закону Зипфа слова, отражающие смысл
содержания текста, лежат в средней части диаграммы "частота-ранг".
В дальнейшем, при обработке запроса пользователя, вычисление меры близости заменяется на
вычисление расстояния между четким множеством слов (терминов) в запросе пользователя и нечетким
множеством, определяемым значениями функции принадлежности этих терминов для каждого из
документов в базе данных. Четкость множества терминов запроса в соответствии с определением
нечеткого множества [3,4] математически выражается тем, что функция принадлежности их принимается
равной единице. Значение функции принадлежности для терминов, не входящих в анализируемый
документ, принимается равным нулю.
Используя различные определения расстояния между нечеткими множествами [3,4], можно
вычислить расстояния между множествами как относительное расстояние Хемминга или относительное
евклидово расстояние. Документами, наиболее подходящими запросу, будут являться документы, для
которых эти величины принимают наименьшие значения среди всех документов. Очевидно, что расчет
следует вести лишь для документов, в которых встречается хотя бы одно слово из запроса.
Второй вариант использования аппарата нечетких вычислений для обработки поискового запроса не
требует модификации существующего подхода. Он может служить либо дополнительным вариантом
поиска документов по релевантности запросу, либо работать вместе с использующимся.
Суть его состоит в том, что после выделения из текста ключевых слов и сопоставления им весовых
коэффициентов вычисляется дополнительная характеристика – нормированный весовой коэффициент
по максимальному весовому коэффициенту. Именно эта характеристика будет в дальнейшем влиять на
релевантность документа запросу пользователя. При поступлении запроса программа должна выбрать
все документы, где встречается хотя бы одно слово из запроса, и вычислить значение функции
89
принадлежности по нормированному весовому коэффициенту для каждого слова. Для каждого слова,
встречающегося в запросе и документе, вычисляется значение функции принадлежности, а в
дальнейшем, для выделения релевантных документов по запросам из нескольких слов применяется
операция алгебраического сложения над нечеткими числами [4]. Выбор именно этой операции
обусловлен тем, что она, в отличие от других операций (умножение, деление и т.п.), не вносит искажений
в конечный результат. Так, если использовать операцию умножения, то релевантность документа, в
котором отсутствует хотя бы одно слово из запроса, будет равна нулю, что, конечно, не верно. В
результате сложения всех значений для слов, встречающихся в запросе и документах, самым близким
по релевантности будет выбран тот документ, где значение функции принадлежности получившейся
суммы будет максимальным. В настоящее время был технически реализован первый из предложенных
вариантов и проводится исследование влияния различных видов функции принадлежности и ее
параметров на результаты поиска.
Литература
1. GK Zipf, Psycho-Biology of Languages (Houghton-Mifflin, 1935; MIT Press, 1965).
2. А.Попов. Поиск в Интернете – внутри и снаружи. Эффективная методика поиска информации в
сети Интернет, http://www.citforum.ru/pp/search_03.shtml.
3. Пивкин В.Я., Бакулин Е.П., Кореньков Д.И. Нечеткие множества в системах управления. Учебное
пособие. Томск: Томский государственный университет, 2001.
4. Поспелов Д.А. Нечёткие множества в моделях управления искусственного интеллекта. М.,1986.
ПОВЫШЕНИЕ СТЕПЕНИ ЗАЩИЩЕННОСТИ ТРАНЗАКЦИЙ В ИНТЕРНЕТ С
ИСПОЛЬЗОВАНИЕМ ПЛАСТИКОВЫХ КАРТ НА ОСНОВЕ СЕТИ С
УДОСТОВЕРЯЮЩИМИ ЦЕНТРАМИ
И.В.Черковский, А.В.Скакунов, А.Ю.Тимохов
Волгоградский государственный технический университет
Тел.: (8442) 91-84-26, e-mail: [email protected]
Последние два года в сфере электронной коммерции в Интернете произошли по истине глобальные
перемены. Последствия этих изменений отразились на всех электронных магазинах, использующих для
проведения транзакций самое удобное (с учетом специфики удаленной оплаты) средство расчета –
пластиковые карты.
Инициаторами выступили всемирно известные компании Visa (лидер американского рынка
платежных систем) и MasterCard (лидер европейского рынка). В 2003 г. эти компании значительно
ужесточили правила приема карт к оплате в Интернете. Допустимая норма отказов от оплаты была
снижена с 4% до 2% от общей суммы всех транзакций. Отказ от оплаты (chargeback) может произойти по
следующим причинам:
 плательщику не подошел товар или услуга по субъективным причинам;
 недобросовестный покупатель, воспользовавшись услугой (например, справочной информацией),
заявляет, что это не то, что он хотел получить и требует назад свои деньги;
 в результате незаконных операций мошенник получает доступ к информации, достаточной для
снятия денег с чужих карточных счетов. Естественно, просмотрев выписку по счету, законный
владелец отказывается от оплаты покупок, которых он не совершал;
 другие, менее распространенные причины конфликтных ситуаций.
Наибольший урон платежным системам наносят мошенники, так называемые кардеры.
Подавляющее большинство электронных магазинов ведут базу данных по карточкам, по которым у них
проходила оплата. Вернее, это делают посредники между магазинами и платежными системами. Если
мошенникам удается взломать такую базу, то они могут получить доступ ко всем картам, по которым
когда-либо проходила оплата.
Ужесточив правила, две корпорации поставили всех посредников перед необходимостью ужесточить
в свою очередь правила приема карт. Мы не будем рассматривать механизмы и критерии, которые ведут
к принятию решения о том, принять ли очередную транзакцию по карте, либо отклонить транзакцию из-за
возникшего подозрения о возможной попытке мошенничества. Единых критериев нет, и каждый
посредник обладает своим алгоритмом принятия решения, который является коммерческой тайной.
Отметим лишь, что нет ни одного посредника, который мог бы с вероятностью 1 отличить “честную
транзакцию” от транзакции по украденной карте.
Предлагаемым решением по увеличению степени защищенности расчетов может служить единая
глобальная сеть удостоверяющих центров (УЦ), основанная на инфраструктуре открытых ключей.
Основные понятия – удостоверяющий центр и сертификат открытого ключа.
Сертификат открытого ключа представляет собой открытый ключ абонента и некоторую
дополнительную информацию, подписанную закрытым ключом удостоверяющего центра. Сертификаты
выдаются удостоверяющими центрами конечным абонентам сети (владельцам карточных счетов) и
подчинённым удостоверяющим центрам. УЦ работает как нотариус, удостоверяя соответствие между
90
открытым ключом и личностью, которой принадлежит этот ключ. Сертификат абонента подписывается на
ключе удостоверяющего центра, и если это не корневой УЦ, то его сертификат открытого ключа
подписан на закрытом ключе вышестоящего УЦ. Корневой УЦ имеет самоподписанный сертификат.
Таким образом, создается цепочка сертификатов, с помощью которых можно будет проверить
транзакцию каждого владельца пластиковой карты, например:
Корневой сертификат УЦ компании Visa → Сертификат УЦ российского рынка VISA → Сертификат
Сбербанка РФ → Сертификат отделения Сбербанка РФ → Сертификат владельца карточного счета в
Сбербанке РФ.
Проверив все сертификаты в цепочке, начиная с сертификата владельца пластиковой карты, можно
однозначно ответить на вопрос о том, стоит ли проводить данную транзакцию или нет.
Плюсы. Очевидно, невозможно будет провести транзакцию без ведома владельца пластиковой
карты, так как закрытый ключ хранится только у него. Даже в случае успешной атаки на базы
посредников, мошенники не получат всей необходимой для проведения транзакции информации.
Минусы. Минусы носят характер финансовых расходов на развертывание сети удостоверяющих
центров, внесение изменений в ПО посредников, дополнительные носители ключевой информации для
каждого вновь открываемого счета.
МОДЕЛЬ ТРЕХМЕРНОЙ ГОЛОГРАФИЧЕСКОЙ ПАМЯТИ ДЛЯ
ОБЕСПЕЧЕНИЯ ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ ВЫЧИСЛЕНИЙ ПРИ
РЕШЕНИИ ЗАДАЧ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
С.В.Политова, Д.А.Давыдов, С.А.Фоменков
Волгоградский государственный технический университет
Тел.: (8442) 34-42-46, e-mail: [email protected]
Большинство задач из области искусственного интеллекта требуют массивных вычислений.
Например, задачи обработки изображений, распознавания образов, выделения фигуры на фоне леса,
распознавания мелодии и т.п. Такие задачи на обычном компьютере решаются, во-первых, долго, вовторых, необходимо каждый раз писать новую программу.
Если мы хотим получить нечто похожее на мозг, то для обработки изображений нужны образцы.
Люди могут отличить дерево от металла, красное от синего, одну мелодию от другой. Чтобы хранить в
обычном компьютере все образцы (например, звуковые сигналы), требуется большой объем памяти.
Такая память, к тому же, должна иметь большую скорость считывания, так как образцов много, их надо
предъявлять быстро. Кроме того, для распознавания образов нейросетевыми методами требуется
загружать в процессор большие матрицы межнейронных связей, такая загрузка подразумевает
использование большой скоростной памяти.
Необходимо считывать информацию не побитово, а параллельно, чтобы можно было предъявить
один или несколько образцов сразу.
Реальный путь для решения таких задач из области ИИ – использование трехмерной оптической
памяти. Дополнительный аргумент в пользу использования такой памяти – свет – самый удобный
инструмент для подобных задач, так как с прочитанным информационным массивом можно:
 Проводить линейные преобразования (вычислять Фурье-компоненты, изменять яркость, масштаб,
изменять повороты, наклоны и т.д.).
 Параллельно сравнивать фрагменты изображений (массивов). (В случае электронного варианта
решения задачи приходится сравнивать все биты).
 Проводить нелинейные преобразования (вычисление корреляции, свертки, нелинейное
преобразование яркости).
Итак, для решения вычислительных задач из области ИИ требуется обеспечение системой памяти
большой емкости со скоростным высокопараллельным считыванием.
Существующие системы оптической памяти (CD, DVD) не удовлетворяют всем выдвигаемым
требованиям (большая емкость, высокая скорость считывания, параллельное считывание). Поэтому
весьма актуально изучение новых принципов построения оптической памяти.
Среди перспективных схем трехмерной оптической памяти наиболее популярны схемы с послойным
хранением информации, которые позволяют использовать методы записи информации, разработанные
для двумерной памяти, и допускают параллельное считывание информации, записанной в слое. Для
осуществления такого послойного считывания необходим способ выделения вклада от требуемого слоя
в детектируемую световую волну. Этот способ может быть основан на различных физических принципах.
В типичном случае наведенная неоднородность представляет собой ограниченную по координате
абсцисс бегущую волну (импульс), движущуюся вдоль данной оси. Такую волну называют маркирующей
волной.
Природа маркирующей волны может быть совершенно различной. Как примеры бегущей волны
можно указать: ультразвуковые импульсы в акустооптических материалах, солитоны в
полупроводниковых материалах, распределения , формируемые с помощью световых потоков в
фоторефрактивных и фотохромных материалах. При использовании бегущей маркирующей волны
91
считывание информационного слоя должно производиться в определенный промежуток времени, т.е.
требуется синхронизация считывания с движением маркирующей волны через среду. От требования
жесткой синхронизации в схеме с модуляцией фазовой отстройки можно избавиться, если в качестве
маркирующей волн использовать не бегущую волну, а статическую модуляцию (статическую волну),
положение которой в пространстве задается некоторым внешним управляющим воздействием (полем,
давлением и т.д.). В качестве примеров стационарной волны можно назвать домены и доменные
границы в магнитных, сегнетоэлектрических материалах, различные неоднородности , наведенные
светом, электронным лучом, неоднородным нагревом, неоднородным полем в разнообразных
материалах.
В работе рассматривается схема послойного считывания информационных слоев с помощью
маркирующей волны - движущегося профиля диэлектрической проницаемости.
Рассмотрим среду в виде плоского слоя с неперекрывающимися по толщине голограммами. На
среду падает плоская монохроматическая световая волна. В результате дифракции на голограммах
падающей (считывающей) волны возникает дифрагированная волна. В отличие от падающей
дифрагированная волна имеет богатый угловой спектр, определяемый записанной информацией.
Если есть возможность измерять изменения интенсивности дифрагированной волны, то можно
использовать модуляцию диэлектрической проницаемости для выделения вклада от отдельных
голограмм. В некоторый момент времени выделяется та голограмма, через которую в этот момент
проходит маркирующая волна
Для описанного режима считывания голограмм необходимо временное дифференцирование
дифрагированной волны. Можно обойтись без операции временного дифференцирования, если в
качестве информационного слоя использовать пару голограмм, дающих противоположный вклад в
дифрагированную волну. Если условие компенсации вкладов выполняется для всех информационных
слоев, то в отсутствие маркирующей волны на выходе из среды нет дифрагированной волны.
Прохождение маркирующей волны через некоторый слой нарушает условие компенсации вкладов для
этого слоя, что позволяет производить послойное считывание информации.
Результаты работы демонстрируют возможность выделения требуемого слоя (голограммы)
информационного носителя с помощью проходящей через данный слой маркирующей волны в виде
локализованной (по толщине) модуляции показателя преломления. Заметим, что изменения,
возникающие при переходе к случаю отражательных голограмм, сводятся к изменению пределов
интегрирования в выражениях для дифрагированной волны. В таком случае полученные оценки
остаются в силе. Cлучай отражательных голограмм более благоприятен для сильной модуляции
фазового рассогласования.
Литература
1. Yang X., Wrigley C.Y., Lindmayer J. // Optical Memory and Neural Networks. 1994. v.3. n.2. p. 135-149.
2. Котов В.Б. //Радиотехника и электроника. 2000. т.45. N9. с.1103-1108.
3. Kotov V.B., Politova S.V.// Optical Memory and Neural Networks. 2003. v.12. n.2. p. 95-110.
СИСТЕМА УДАЛЕННОГО ДОСТУПА К ПАРАЛЛЕЛЬНОМУ
КОМПЬЮТЕРНОМУ КЛАСТЕРУ
С.Д.Кургалин, В.В.Расхожев
Воронежский государственный университет
Тел.: (0732) 20-83-84, факс: (0732) 20-87-55, e-mail: [email protected]
На 20-процессорном параллельном компьютерном кластере Воронежского государственного
университета (ВГУ) на базе программного обеспечения Microsoft Internet Information Server (MS IIS)
создан специализированный Web-сервер, обеспечивающий дистанционный доступ по сети Интернет к
его вычислительным ресурсам.
Кластер состоит из четырехпроцессорного сервера SUPERSERVER 8060 (4×CPU Pentium III Xeon,
700 MГц, 4 Гб SDRAM), четырех двухпроцессорных серверов SUPERSERVER 6010H (2×CPU Pentium-III,
1,13 ГГц, 1 Гб SDRAM), восьми рабочих станций (Pentium-4, 2,0 ГГц, 512 Mб RIMM), его пиковая
производительность – 28 Gflops. На кластере установлена операционная система Windows 2000,
используется среда параллельного программирования MPICH 1.2.5. Узлы кластера первого уровня
(четырех- и двухпроцессорные) связаны по протоколу Gigabit Ethernet, для связи остальных 8 узлов
(однопроцессорных) реализован протокол Fast Ethernet. Используется высокопроизводительное
коммутационное оборудование (Rapier G6f и Rapier 24) компании Allied Telesyn. Кластер связан
оптоволоконным каналом с разветвленной внутренней сетью ВГУ и имеет высокоскоростной выход во
внешнюю сеть, объединяющую вузы Воронежа.
Web-сервер, являющийся основой системы удаленного доступа, размещен на 4-процессорном
внутреннем узле кластера – SUPERSERVER 8060. Интерфейс сервера разработан на основе технологии
Active Server Pages на языке JavaScript. Для удаленного доступа к кластеру необходима регистрация,
осуществляемая администратором кластера средствами управления учетными записями операционной
системы Windows 2000 Server. Зарегистрированным пользователям предоставляется возможность через
Web-браузер размещать свои программы для выполнения на кластере, дистанционно компилировать и
92
исполнять их. Первый вариант системы доступа обеспечивает функционирование программ, созданных в
среде Microsoft Visual Fortran (MVF). Перед пересылкой и размещением на сервере программы
архивируются. В каждом архиве может быть одно задание. Если в архиве находятся файлы проекта,
созданного средой MVF, то параметры компиляции определяются содержимым этих файлов. При
отсутствии файлов проекта запускаемая программа считается состоящей из одного модуля и
компилируется в соответствии со спецификацией среды MVF как Win32 Release. Файлы с заданием
после размещения в кластере разархивируются в каталог, имя которого совпадает с именем архива.
Пользователь имеет возможность просматривать любой файл из этого каталога, удалять его или
изменять содержимое. Кроме того, при создании во время работы программы новых файлов, например,
с результатами расчетов, пользователь также может просматривать и эти файлы. Защита данных на
Web-сервере осуществляется средствами MS IIS и файловой системы NTFS. Программы выполняются в
пакетном (автоматическом) режиме без взаимодействия с администратором или пользователем.
Результаты работы программы переносятся на компьютер пользователя средствами Web-браузера.
На следующем этапе развития программного обеспечения кластера предполагается создать ряд
средств управления заданиями (прерывание или приостановка выполнения задания, изменение его
параметров без перекомпиляции и др.).
Объединение параллельного кластера и регионального информационно-образовательного
Интернет-портала «Воронежский виртуальный университет» (http://Voronezh.OpeNet.ru), созданного и
администрируемого ВГУ и включенного в общероссийскую информационно-образовательную среду, и
внедрение системы удаленного доступа к ресурсам кластера позволяет обеспечить условия для
дистанционного проведения сложных вычислительных экспериментов в научных и учебных целях.
Образование на этой базе лаборатории высокопроизводительных вычислений кафедры цифровых
технологий факультета компьютерных наук ВГУ и включение ее в информационно-образовательную
среду открывает новые перспективы для научных исследований в Воронеже, области и регионе. Эта
лаборатория интегрируется с лабораторией открытого образования ВГУ на основе оптоволоконного
канала доступа к их ресурсам. На их базе организован универсальный учебно-научный комплекс, в
котором ведутся учебные занятия, проходят научные семинары, а также разрабатывается программное
обеспечение для проведения исследований с использованием возможностей компьютерного кластера.
МОДЕЛИРОВАНИЕ ПРОЦЕССА ВНУТРЕННЕГО ТОРМОЗНОГО ИЗЛУЧЕНИЯ
НА ПАРАЛЛЕЛЬНОМ КОМПЬЮТЕРНОМ КЛАСТЕРЕ
С.Д.Кургалин
Воронежский государственный университет
Тел.: (0732) 20-83-84, факс: (0732) 20-87-55, e-mail: [email protected]
Компьютерное моделирование с использованием высокопроизводительных параллельных кластеров
является эффективным средством исследования сложных физических процессов. Среди множества
проблем, решение которых можно найти на пути использования принципов компьютерного
моделирования, выделяется своей актуальностью комплекс задач анализа свойств излучений,
возникающих при движении заряженных микрочастиц частиц внутри потенциальных барьеров. Так, при
выходе заряженных частиц из ядер и прохождении их сквозь кулоновский барьер испускается
электромагнитное излучение с непрерывным спектром частот – внутреннее тормозное излучение (ВТИ).
С середины 1980-х годов началось теоретическое изучение ВТИ при α-распаде [1]. Его дальнейшее
экспериментальное обнаружение [2,3] привело к активизации теоретических исследований. Однако все
модели ВТИ, разработанные до последнего времени, основывались на существенно упрощенных
представлениях об этом явлении. В частности, взаимодействие частиц описывалось простыми
модельными потенциалами, весьма далекими от реального ядерного взаимодействия.
В работах [4,5] предложена новая математическая модель расчета спектров ВТИ на основе
использования реалистических ядерных потенциалов, универсальная для α-, кластерного и протонного
распадов, в которой отсутствуют вышеуказанные недостатки. Модель имеет высокую степень сложности,
учитывает большое число параметров изучаемого явления и поэтому требует для своей программной
реализации использования высокопроизводительных компьютерных средств.
Компьютерное моделирование на основе этой модели дало возможность получить спектры ВТИ для
α-распада 210Po и для кластерного распада 222Ra. Рассчитанные вероятности для этих физических
процессов достаточно хорошо совпали с имеющимися экспериментальными данными. В последнее
время большое внимание привлечено к исследованию протонного распада, поэтому было проведено
моделирование процесса ВТИ и для этого вида распада.
На основе дальнейшего развития модели [4,5] были детально исследованы спектры ВТИ для αраспада ядер 226Ra и 214Po. При построении волновых функций начального квазистационарного и
конечного состояний ядерной системы во всех случаях численно решалось уравнение Шредингера с
реалистическим ядерным потенциалом и учетом кулоновского взаимодействия. Принципиальным при
этом является выбор для теоретических исследований ядерных оптических потенциалов, проверенных
на других задачах ядерной физики.
Подробно изучены свойства радиальных матричных элементов, от квадрата которых зависит
вероятность ВТИ, что позволило оценить вклад внутриядерной, подбарьерной и периферийной областей
93
формирования γ-излучения в суммарную вероятность ВТИ. Определено, что областью, дающей
максимальный вклад в вероятность ВТИ при α-распаде, является периферийная область.
Проведено изучение ВТИ разной мультипольности, что дало возможность сопоставить значения,
полученные прямым расчетом, и выяснить долю вкладов дипольного и квадрупольного излучений в
суммарные спектры ВТИ.
При
компьютерном
моделировании
процесса
ВТИ
использован
20-процессорный
высокопроизводительный вычислительный кластер кафедры цифровых технологий факультета
компьютерных наук Воронежского государственного университета. Программирование проводилось в
среде MPICH 1.2.5 на языке Fortran. Применялись как известные приемы распараллеливания
алгоритмов, так и вновь созданные для обеспечения эффективности компьютерного моделирования.
Сопоставление имеющихся экспериментальных и рассчитанных в рамках предложенной модели
величин, определяющих вероятность ВТИ, свидетельствует об описании созданной моделью основных
свойств экспериментальных спектров.
Разработанная модель позволяет не только провести подробное исследование характеристик
спектров ВТИ и дать объяснение имеющимся экспериментальным данным, но и оценить дальнейшие
перспективы поиска ВТИ в различных типах распадов в широкой области ядер.
Работа поддержана Российским фондом фундаментальных исследований, грант № 02-02-16411.
Литература
1. Баткин И.С., Копытин И.В., Чуракова Т.А. // Ядерная физика. – 1986. – T.44, Вып.6(12). – C.1454.
2. D'Arrigo A., Eremin N.V., Fazio G. // Physics Letters. – 1994. – V.B332, № 1,2. – P.25.
3. Kasagi J., Yamazaki H., Kasajima N. et al. // Phys. Rev. Lett. – 1997. – V.79, № 3. – P.371.
4. Кургалин С.Д., Чувильский Ю.М., Чуракова Т.А. // Вестн. Воронеж. ун-та. Сер. Физика,
математика.– 2001. – №1. – C.40.
5 .Кургалин С.Д., Чувильский Ю.М., Чуракова Т.А // Известия РАН, сер. физ. – 2001.–T.65, №5. –
C.666.
ПОСТРОЕНИЕ СИСТЕМ ДЛЯ ПАРАЛЛЕЛЬНОЙ ОБРАБОТКИ ЗАПРОСОВ К
СУБД
М.В.Локшин, О.Я.Кравец
Воронежский государственный технический университет
Тел.: (0732) 13-36-09, 77-67-47, e-mail: [email protected]
Проблема повышения производительности СУБД в настоящее время продолжает оставаться
актуальной. Увеличение количества пользователей, работающих с базой данных, и возрастание
объемов обрабатываемой информации требует соответствующего повышения быстродействия СУБД
для обеспечения приемлемого времени реакции на пользовательский запрос. Применение архитектуры
массовой мультипроцессорной обработки (MMP) в качестве основы платформы для сервера базы
данных позволяет решать обозначенные выше проблемы. Данная архитектура обеспечивает более
высокий уровень масштабируемости по сравнению с системами, основанными на симметричной
мультипроцессорной обработке (SMP), и позволяет легко организовать поддержку работы большого
количества
узлов
системы.
Эти
два
подхода
являются
основными
при
построении
высокопроизводительных СУБД [1,2].
Опишем систему, которая предоставляет возможности для параллельного исполнения SQLзапросов. Здесь и далее под параллельным исполнением запроса будем понимать параллельную работу
нескольких вычислительных устройств направленную на формирование результата запроса. Пусть
система состоит из N узлов, на которых установлены SQL-сервера, причем данные SQL-сервера не
обязательно должны быть однородными – т.е. они не обязательно должны быть копиями одного и того
же программного продукта. В таком случае, для обращения к подобной системе необходимо
использовать подмножество языка SQL общее для всех SQL-серверов системы. В то же время,
использование однородных СУБД позволяет применять средства для распределенной обработки
запросов, предусмотренные производителем СУБД, что должно повышать общую производительность
системы.
Предположим наличие распределенной базы данных. Также предположим, что интересующий нас
набор данных реплицирован на N серверов распределенной системы. Рассматриваемый набор данных
должен быть согласован в любой момент времени работы системы. Это означает, что на момент старта
системы наборы данных на узлах системы должны быть синхронизированы, а все их обновления должны
выполняться в рамках распределенных транзакций. Можно отказаться от идентичности копий на любой
момент времени, однако в этом случае будет иметься возможность для работы с базой в целом только в
режиме, эквивалентном грязному чтению (dirty read), что может оказаться достаточным для работы ряда
приложений. В этом случае возможно возникновение проблемы несогласованной обработки (также
известной как проблемы неповторяемости чтения) [3]. Отметим, что возникновение проблем подобного
рода при исполнении параллельных запросов не зависит от уровня изоляций модифицирующих
94
транзакций на локальных сайтах системы. Для обеспечения более высокого уровня изоляции
пользовательских транзакций это требование является необходимым.
В то же время следует понимать, что предлагаемая конфигурация системы позволяет ускорять
выполнение SQL-запросов на чтение данных за счет понижения скорости исполнения запросов на
вставку/изменение/удаление данных (далее – модификации). Известно, что наличие необходимости
обновления реплицированных данных в рамках транзакции требует большего количества затрат и
вносит свои ограничения. Имеются пути решения данной проблемы (соблюдения приемлемого баланса
между скоростью операции выборки и модификации данных). Одно из возможных решений –
использование, наряду с реплицированием данных, разделение данных по диапазонам между
серверами системы с несимметричным реплицированием диапазонов между серверами с учетом
отношения количества запросов на чтение и модификацию данных.
Возможно ли эффективное применение систем описанного класса для решения реальных
производственных задач? С учетом вышеприведенного замечания это может быть OLTP (Online
Transaction Processing) система с небольшим количеством вносимой и изменяемой информации
(относительно общего объема хранящихся данных), но содержащую большое количество информации, с
которой происходит интенсивная работа запросов на чтение. Однако наиболее полно предлагаемая
система подходит для реализации так называемых хранилищ данных (data warehouse) и для поддержки
набирающих в последнее время популярность инструментов оперативной аналитической обработки
OLAP (Online Analytical Processing). Предполагается, что такие хранилища данных содержат сведения,
поступающие из самых различных источников данных, поддерживают доступ к ранее накопленным
(историческим данным) с отсутствием необходимости обновления данных в оперативном режиме.
Для вышеописанной распределенной системы предлагается следующий алгоритм исполнения SQLзапроса. Пользовательский запрос, первоначально поступивший на один из узлов системы,
подготавливается для параллельного исполнения. Обеспечение возможности параллельного
исполнения запроса предлагается обеспечивать за счет преобразования поступившего SQL-запроса к
набору запросов, результат исполнения которых эквивалентен исходному запросу [4] (после
объединения результатов исполнения новых запросов, возможного дополнительного вычисления
агрегатных функций и переупорядочивания результата). Причем набор запросов, полученный в
результате преобразования, можно исполнять на любом из узлов системы, не зависимо друг от друга.
Набор правил преобразования запроса заранее фиксирован, и целесообразность применения того или
иного преобразования определяется видом исходного запроса и статистической информацией,
доступной для полей таблиц запроса. Такой подход позволяет динамически выбирать алгоритм
параллельного исполнения запроса в зависимости от содержания базы данных.
Преимущества, которые достигаются при реализации данного подхода, заключаются в следующем:
 обеспечивается работа с неоднородными СУБД;
 реализуется возможность достижения высокой производительности при вычислении результата
запроса;
 достигается относительная простота реализации системы с параллельной обработкой запросов.
Фактически, в системе применяется двойной процесс оптимизации – для параллельного
исполнения запроса между узлами системы и для процесса локального исполнения запроса на
каждом из узлов;
 имеется возможность реализации предлагаемых принципов параллельной обработки в системах с
классическими методами распараллеливания (операции сканирования, соединения и сортировки).
Литература
1. Вьюкова Н. Сервер для кластерных и массово-параллельных архитектур // Открытые системы. –
1995. – №4. – с. 17-21.
2. Кузьминский М. Волков Д. Современные суперкомпьютеры: состояние и перспективы. // Открытые
системы. – 1995. № 6. – с. 33-40.
3. Коннолли Т., Бегг К., Страчан А. Базы данных: проектирование, реализация и сопровождение.
Теория и практика. – М.: Вильямс, 2000. – 1120 c.
4. Локшин М.В. Об одном методе параллельного выполнения запросов в распределенных СУБД. //
Современные проблемы информатизации в системах моделирования, программирования и
телекоммуникациях: Сб. трудов. Вып. 9/ Под ред. д.т.н., проф. О.Я.Кравца. – Воронеж: Изд-во «Научная
книга», 2004. с. 360-361.
ОБЕСПЕЧЕНИЕ РАВНОМЕРНОЙ ЗАГРУЗКИ РАСПРЕДЕЛЕННЫХ
КОМПОНЕНТОВ СИСТЕМЫ ДИСТАНЦИОННОГО ОБУЧЕНИЯ
О.Я.Кравец, Т.Н.Моисеев
Воронежский государственный технический университет
Тел.: (0732) 13-36-09, e-mail: [email protected]
На данном этапе развития систем дистанционного обучения назрел вопрос создания серверных
систем на базе множества территориально распределенных серверов вуза. Создание системы
95
дистанционного обучения на базе сети серверов обусловлено несколькими причинами – обеспечение
устойчивой работы системы, повышение производительности, возможность получения хорошей
отказоустойчивой системы на случай возникновения сбоев в оборудовании, а также, сравнительно
экономически дешевое решение. Всем этим требованиям в полной мере удовлетворяет система
распределенных серверов, связь между ними организована средствами Интернет. За счет того, что
каждый сервер в отдельности не зависим, имеет собственный канал связи и в случае возникновения
сбоя в оборудовании сервера или при плановом отключении сервера, всегда есть возможность
переключения и распределения нагрузки «сбойного» сервера между оставшимися серверами сети.
Система дистанционного обучения представляет собой, в частности, распределенную
информационную базу данных. Распределение вычислительных процессов между серверами должно
происходить равномерно. Существует несколько проблем при создании системы с распределенными
серверами. Во-первых, связь между ними осуществляется по каналам Интернет и фактически сервера
имеет разные по пропускной способности каналы связи. Во-вторых, они имеют различное аппаратное
обеспечение и различную загрузку сторонними процессами. И в случае прямого распределения нагрузки
между серверами, без мониторинга состояния серверной системы, может произойти ситуация, когда
несколько серверов будут перегружены, а часть из них будет «простаивать». При разработке
программного комплекса системы дистанционного обучения задача состоит в том, чтобы добиться такого
режима работы системы, при котором будет происходить равномерное распределение нагрузки, между
серверами системы и при этом будет достигаться максимум ее производительности.
Создание распределенной многосерверной системы с равномерной загрузкой открывает большие
возможности для ее использования. Данная разработка позволит снизить нагрузку на сервер и канал
связи за счет создания множества серверов, доступных для клиентов. Это – возможность использования
удаленного обучения в филиалах учебных заведений, что позволит на местах поставить сервер данных
и использовать его по локальной сети, а не через удаленный доступ; упрощение доступа к данным
системы из удаленных областей; возможность повысить общую отказоустойчивость системы. Все эти
преобразования требуют создания системы распределения вычислительных процессов между
серверами единой системы дистанционного обучения для обеспечения ее устойчивой работы.
ОПТИМИЗАЦИОННАЯ ЗАДАЧА РАСПРЕДЕЛЕНИЯ СЕТЕВЫХ РЕСУРСОВ В
СИСТЕМАХ ИНТЕГРИРОВАННОГО ОБСЛУЖИВАНИЯ
Д.В.Шипилов, О.Я.Кравец
Воронежский государственный технический университет
Тел.: (0732) 13-36-09, e-mail: [email protected]
В работе [1] был рассмотрен подход к организации интегрированного обслуживания в сетях с
коммутацией пакетов, в некотором смысле ортогональный существующим тенденциям QoS, связанным с
резервированием сетевых ресурсов и приоритезаций потоков данных. Суть его сводилась к
необходимости разработки механизмов, обеспечивающих выполнение требований приложений
интегрированного обслуживания в рамках существующей сетевой инфраструктуры за счет привлечения
дополнительных вычислительных ресурсов на оконечных узлах сетевого соединения.
Программный модуль, выполняющий функции управления потоком на узле выполняет запросы
приложений этого узла и обслуживает множество входящих/исходящих потоков A мощности |A|=N, ими
генерируемых и/или потребляемых. При этом поток формализуется как последовательность блоков
данных:
S = {s1, s2, …, sm},
(1)
и связанных с ними размеров L = {l1,l2, …, lm}, а также последовательностью временных интервалов:
T = {0, 1, 2, …, m} ,
(2)
между моментами прихода в модуль на обработку двух смежных блоков данных, причем величины 0
и m определятся как интервалы времени между событиями создания потока, прихода первого блока
данных и прихода последнего блока данных, закрытия потока.
Основная задача модулей оконечных узлов сети, обслуживающих поток, заключается в точном
воспроизведении последовательности (1) и связанных с ней временных интервалов (2) на целевом узле
сетевого соединения. Такая формализация отличается от традиционного представления о потоке в сети
наличием требований, связанных с (2).
Коммуникационная инфраструктура сети, как следует из [1], не обеспечивает гарантированного
сервиса доставки данных, поэтому программный модуль узла, для выполнения требований приложений
интегрированного обслуживания, должен использовать внутренние вычислительные ресурсы узла:
R = {r1, …, rM}, |R| = M
(3)
максимизируя при этом величину N в условиях ограничений
96
QR = {qR1, …, qRm},
(4)
связанных с этими ресурсами. Если описать требования, предъявляемые к обслуживанию потоками,
в виде некоторого кортежа требований Qs, то “емкость” сетевого узла по количеству одновременно
обслуживаемых потоков можно определить как зависимость:
UA = Ф(R, QR, Qs),
(5)
при этом критерий эффективности используемых ресурсов определится как функционал:
F = max(UA).
(6)
Ресурсы – это, прежде всего используемое процессорное время, пропускная способность сетевого
оборудования узла и память. Стоит так же отметить, что описанная задача об оптимальном
распределения вычислительных ресурсов на множествах ограничений и требований QR, QS, осложняется
тем, что, по сути, является динамической и распределенной. Состояние системы управления потоками
каждого узла зависит, прежде всего, от состояния каналов в коммуникационной сети (которая сама по
себе является динамической системой) между данным узлом и удаленными узлами, а так же от
внутренних состояний самих этих узлов (поскольку с точки зрения каждого отдельно взятого узла
система, составленная из множества взаимодействующих узлов не является замкнутой). Кроме того,
Создание новых потоков и завершение уже существующих (по сути, стохастический процесс) также
оказывает сильное влияние на состояния взаимодействующих узлов и требует перераспределения
ресурсов для соблюдения критерия (6).
Таким образом, исходная задача управления потоками в сетях интегрированного обслуживания, при
использовании подхода, предложенного в [1], по сути, сводится к динамической задаче распределенного
управления вычислительными ресурсами.
Литература
1. Шипилов Д.В. Организация интегрированного обслуживания в сетях с классической архитектурой/
Современные проблемы информатизации в технике и технологиях: Сб. тр. Вып. 8. – Воронеж:
Центрально-Черноземное книжное издательство, 2003. – C. 125-126.
ТЕХНОЛОГИИ ПОСТРОЕНИЯ КОРПОРАТИВНЫХ ПОРТАЛОВ
Е.Ю.Жилин, А.В.Макаров
Московский физико-технический институт (государственный университет),
Долгопрудный
Тел.: (095) 408-63-36, e-mail: [email protected], [email protected]
Любое современное предприятие имеет один или несколько сайтов, ориентированных на работу с
клиентами, набор внутренних приложений, обеспечивающих выполнение бизнес-процессов. Рано или
поздно встает вопрос об организации совместного функционирования всех этих приложений,
централизованном управлении пользователями, обеспечения совместной работы и др.
Главное назначение портала – обеспечение единой точки входа и организация доступа к Webприложениям. Помимо этого портал позволяет:
 централизованно управлять пользователями и паролями. Вследствие этого улучшается
безопасность приложений, повышается удобство работы пользователей (так как для всех
приложений используется один и тот же логин и пароль);
 произвести унификацию приложений. Как следствие снижаются расходы на поддержку и обучение
пользователей;
 вести разработку с использованием самых современных решений в области информационных
технологий;
 производить настройку рабочего пространства пользователя в соответствии с его
предпочтениями.
Портлет является важнейшей частью портала. Термин портлет обозначает приложение портала,
которое отображается в виде прямоугольника. Через портлет осуществляется доступ HTML-страницам,
Web-сервисам и другим приложениям.
Однажды разработанный портлет может быть использован повторно, при построении различных
приложений на основе портала. Портлет разрабатывается, развертывается и управляется независимо от
остальных портлетов. Эта особенность улучшает повторное использование кода и даже целых
фрагментов приложения.
На данный момент практически каждый поставщик серверов приложений имеет портальное
решение. Как правило, портальные решения строятся с использованием Java и спецификации J2EE. На
данный момент заметными игроками на рынке портальных приложений являются IBM, Sun, PeopleSoft,
Microsoft, Oracle, WebLogic. Решения этих фирм, как правило, включают помимо собственно портала
сервер приложений, серверы каталогов, Web-серверы, систему управления контентом и в различные
варианты поставок, включается большое количество портлетов, ориентированных на взаимодействие с
различными информационными системами. Иногда в комплект поставки входит СУБД. Стоимость такого
97
рода решений обычно высока и может составлять десятки, а то и сотни тысяч долларов. Отдельного
упоминания заслуживает открытый проект JetSpeed. Это свободно распространяемый продукт,
обеспечивающий контейнер для выполнения портлетов.
В настоящее время не выработаны единые требования к интерфейсу портлетов. Однако
деятельность в этом направлении ведется и уже сейчас существует возможность выполнения портлетов
в контейнере различных порталов.
На сегодняшний день существует большое количество решений, основанных на портальных
технологиях. В частности, портал использовался при построении информационных систем AO
“Российские железные дороги”, правительством Москвы, Пенсионным фондом РФ, Сберегательным
Банком, ЦБ РФ. Выбор решения от конкретного поставщика зависит от многих факторов – таких как
стоимость, наличие технических специалистов, владеющих той или иной технологией, совместимость с
имеющимися информационными системами, наличия партнерских отношений и много другого. На
данный момент можно отметить, что лидерами рынка в РФ стали решения предлагаемые фирмами IBM
и Sun. Существуют различные варианты поставок порталов этих фирм. В целом, при схожей цене,
включается примерно одинаковый набор ПО в поставке. Существенным отличием портала от IBM
является возможность включения в поставку СУБД DB2 и лучшая интеграция с продуктами IBM, такими
как Tivoli и Lotus. В то же время, если в организации уже эксплуатируется СУБД, например Oracle, либо
портал предполагается использовать преимущественно как средство интеграции и приложений и
идентификации пользователей, решение от Sun, выглядит более предпочтительным.
ТЕХНОЛОГИИ ПОСТРОЕНИЯ ЭЛЕКТРОННОГО ПРЕДСТАВИТЕЛЬСТВА
ОРГАНОВ ВЛАСТИ
Е.Ю.Жилин
Московский физико-технический институт (государственный университет),
Долгопрудный
Тел.: (095) 408-63-36, e-mail: [email protected]
Технологии Интернет давно завоевали популярность в современном обществе в качестве наиболее
удобного средства обмена информацией. По некоторым оценкам 60% пользователей Интернета
используют его для получения информации с сайтов различных органов государственной власти.
Исследования показывают, что люди с большей охотой будут пользоваться электронными средствами
для получения услуг федеральных и местных органов власти.
Электронные представительства ориентируются на обеспечение взаимодействия органов власти с
населением, бизнес-структурами, другими органами власти, с наемными работниками.
Оказание услуг населению с использованием электронных представительства органов власти имеют
ряд важных преимуществ перед классической схемой. К ним можно отнести: высокую оперативность
оказания услуг, снижение издержек на поддержание бюрократического аппарата, снижение уровня
коррупции и др.
Проблема формирования электронного представительства решается во многих странах мира.
Используются различные подходы для оценки доступности услуг органов власти в электронном виде.
В Евросоюзе отмечают 4 уровня: первый – когда основная информация (распорядок работы,
контактная информация, документы и т.д.) доступны через Web-сайт, второй – существует возможность
взаимодействия между гражданами и органами власти (например с помощью электронной почты,
телефона и т.д.), третий – интегрированы в единое целое различные внутренние приложения и Webчасть, доступная пользователям, обеспечена возможность совершения электронных транзакций с
кредитными картами, четвертый – произведена полная интеграция всех систем, документооборот
осуществляется в электронной форме.
По рекомендациям ООН, выделяют пять уровней внедрения электронных услуг органов власти:
начальный – представительства имеют один или несколько сайтов предоставляющих справочную
информацию общего характера; расширенный – позволяет пользователям получать постоянно
обновляемую информацию, внедрены поисковые системы, опубликована контактная информация,
имеется возможность вести электронную переписку; интерактивное взаимодействие – на этом этапе
появляются Web-порталы, пользователь может получать специализированные данные, загружать
различные формы и бланки, используя механизмы аутентификации; проведение транзакций – в этом
случае Web позволяет осуществлять прямой доступ к различным документам и услугам. В этом случае
граждане имеют возможность напрямую оплачивать сборы и получать различные документы, такие как
визы, паспорта, свидетельства о рождении и т.д.; бесшовное взаимодействие – полностью
интегрированная система Web присутствия. В этом случае внедряется система электронного
документооборота и пользователь имеет возможность получать все услуги, а правительство
взаимодействовать с пользователем через Web-портал.
В настоящий момент из 190 государств членов ООН, национальные правительства 169 стран, так
или иначе использовали Интернет для предоставления услуг населению. Однако степень охвата в
различных странах разная. Российская Федерация согласно рейтингам, в которых учитываются
различные параметры, занимает только 99 место. Так как во всем мире этому вопросу уделяется самое
серьезное влияние, то весьма существенным является улучшение данного показателя с целью
98
улучшения как взаимодействия с собственными гражданами, так и с целью формирования
привлекательного имиджа в глазах инвесторов. В последнее время этому вопросу уделяется большое
внимание, как на уровне правительства, так и на уровне местных органов власти. В частности в Москве,
широко обсуждается программа «Сервисов одного окна», в которой предусматривается предоставление
населению услуг местными органами власти, в электронном виде.
Предлагаемое к рассмотрению решение разработано с использованием последних достижений в ITотрасли и может быть использовано как Министерством образования, так и территориальными органами
управления образования и образовательными учреждениями.
При построении информационной системы за основу были взяты технологии с использованием
языка Java, удовлетворяющие требованиям спецификации J2EE. Основой системы служит сервер
приложений Sun ONE Application Server. Информация о пользователях хранится в Sun ONE Directory
Server и управляется с помощью Sun ONE Identity Server. Интерфейс пользователей строится с
использованием Sun ONE Portal Server. В качестве хранилища данных используется реляционная СУБД
Oracle.
Приложение строится по трехуровневой схеме. Бизнес-логика реализована с использованием EJB.
Интерфейс пользователей построен с использованием портлетов. Электронные формы генерируются с
использованием пакета Chiba (спецификация XForms 1.0). Отчеты строятся в формате HTML и PDF.
Начальная настройка системы осуществляется с помощью четырех XML-файлов. Каждый из которых
описывает: структуру организации, классификатор сервисов, описание сервисов, реализация сервисов.
Структура организации описывается в виде виртуальных кабинетов и должностных лиц,
располагающихся в этих кабинетах. Там же помещается информация о реальной организации
оказывающей услуги в электронном виде, т.е. указывается распорядок работы, Ф.И.О должностных лиц и
их контактные телефоны.
Классификатор сервисов описывает сервисы, предоставляемые организацией. Там же помещается
информация, по которой будет осуществляться поиск сервиса. Например, если оказывается услуга по
регистрации граждан, то необходимо сначала определить какой именно организацией (паспортным
столом) будет реализовываться данный сервис.
Описание сервисов определяет, по какой схеме данный сервис предоставляется. Т.е. папка с делом
гражданина, не может, например, перемещаться хаотично, и чиновник должен осуществлять только
определенные запросы в связи с данным делом и предавать папку только в определенные кабинеты для
дальнейшего производства.
Файл, описывающий реализацию сервисов, фактически закрепляет конкретных лиц организации за
определенными должностями и предоставляет персонам возможность для доступа к очередям
документов для данной должности права на принятие решений
Одним из важнейших требований при построении ИС была возможность взаимодействия с уже
имеющимися информационными системами. Такое взаимодействие строится с использованием Web
сервисов. Т.е. внешние системы могут делать вызовы с использованием SOAP. В случае необходимости
обеспечения получения информации из внешних систем, необходимо будет реализовать
соответствующий адаптер.
ПРОБЛЕМЫ ОЦЕНКИ ЭКОНОМИЧЕСКОЙ ЭФФЕКТИВНОСТИ
АВТОМАТИЗИРОВАННЫХ СИСТЕМ УПРАВЛЕНИЯ
С.А.Зинин
Уральский государственный лесотехнический университет, Екатеринбург
Тел.: (343) 213-50-89, e-mail: [email protected]
Оценка и повышение эффективности в процессе осуществления хозяйственной деятельности
является одной из главных задач для предприятия. Для уменьшения трудоемкости обработки ресурса
используются средства автоматизации. Но ни один руководитель не будет заниматься информатизацией
своего производства без расчета прямых выгод от ее внедрения и эксплуатации. В свою очередь расчет
прямых выгод невозможно определить без тщательного анализа их экономической эффективности и
целесообразности. Вследствие чего, руководители приходят к мысли о необходимости оптимизации
расходов в сфере информационных технологий.
Под совокупной стоимостью владения (ССВ) понимаются полностью учтенные ежегодные расходы
предприятия, связанные с приобретением и использованием информационных технологий в бизнесе.
Цель расчета стоимости владения – выявление избыточных статей расхода и оценка возможности
возврата затраченных на информационные технологии средств.
При расчете затрат на компьютеризацию необходимо учитывать не только первоначальные затраты,
но и затраты, возникающие в процессе эксплуатации вычислительной техники. В общей стоимости
владения компьютером первоначальные затраты, как правило, составляют менее трети.
Автоматизированные системы управления (АСУ) обеспечивают высокую эффективность
деятельности за счет:
 высокого уровня использования входной информации и уменьшения времени, затрачиваемого на
ее обработку, на ЭВМ;
99
 проведения расчетов оптимизации и имитационного моделирования с применением ЭВМ;
 принятие оптимальных решений с помощью экспертных систем (систем поддержки и принятия
решения).
Основным показателем эффективности применения АСУ является коэффициент экономической
эффективности. Его расчеты ведутся на этапах планирования и создания АСУ; на стадии технического и
рабочего проектов АСУ; после внедрения АСУ.
Экономическая эффективность АСУ определяется коэффициентом годовой прибыли (его
приростом), который определяется как:
ПАСУ=((А2-А1)/А1)*П1+((С1-С2)/100)*А2, где
А1, А2 – годовые объемы производства продукции до внедрения и после внедрения соответственно;
С1, С2 – затраты на 1 руб. произведенной продукции до и после внедрения АСУ;
П1 – прибыль до внедрения АСУ на единицу продукции.
Или
ЭФ = ДП – ССВ
ЭФ – экономический эффект;
ДП – дополнительная прибыль;
ССВ – совокупная стоимость вложения.
Количественная оценка эффективности АСУ рассчитывается при помощи показателей, но, следует
учитывать, что при выборе того или иного показателя организации в качестве критерия в расчетах, из
виду могут быть упущены другие факторы. Например, если в качестве критерия выбран показатель
производительности, то большее внимание будет уделяться факторам, способствующим увеличению
производительности, в то время как факторы: качество изделий, расход сырья, энергии, величина фонда
заработной платы и предотвращение износа оборудования, – могут остаться нерассмотренными.
При проектировании информационной системы необходимо ориентироваться на детализацию
выполняемых работниками функций, и осуществлять подбор техники, исходя из индивидуальных
потребностей в ИТ, а не из усредненных показателей.
Ни одна из существующих методик определения экономической эффективности от внедрения новых
ИТ не позволяет выявить подлинного эффекта от их внедрения в управленческую деятельность, в то же
время методики достаточно полно определяют экономическую эффективность внедрения
вычислительной техники в материальное производство.
Причины, не позволяющие точно определить ССВ:
1. Чувствительность ССВ к структуре затрат на предприятиях различных сфер деятельности.
2. Трудность четкого определения объекта затрат, т.е. границ информационной системы.
ИНТЕРФЕЙС ДОСТУПА К УПРАВЛЯЮЩЕЙ ИНФОРМАЦИИ
КОММУТАТОРОВ
М.Л.Гольдштейн, Н.В.Закурдаев, Д.Д.Кайкы, А.В.Меркульев
Институт математики и механики УрО РАН, Екатеринбург
Тел.: (343) 375-35-17, e-mail: [email protected], [email protected]
Неотъемлемой частью современного вычислительного центра на базе многопроцессорных
вычислительных систем семейства МВС является система коллективного удаленного доступа (СКУД).
Развитие инфраструктуры СКУД к вычислительным ресурсам (ВР) и информационным ресурсам (ИР)
требует непрерывного совершенствования, как транспортной системы, так и внедрения новых
технологий управления потоками в ней. По мере увеличения количества ВР, ИР, числа пользователей и
появление новых мультимедийных технологий, требования к пропускной способности СКУД возрастают.
Применение технологий QoS – одно из эффективных и достаточно недорогих средств достижения
поставленных целей. Поскольку по ряду причин [1] в качестве массового сетеобразующего оборудования
СКУД выбрано оборудование фирмы 3Com, была поставлена задача разработки интерфейса,
позволяющего в полной мере использовать интеллектуальные возможности коммутаторов 3Com.
Существующие средства управления и мониторинга не позволяют в полной мере реализовать
технологии QoS по целому ряду причин. Например, 3Com Network Supervisor (3NS) поддерживает только
три уровня приоритетов обслуживания из пяти возможных, осуществляет поддержку только
оборудования 3Com, имеет сложную настройку уровней обслуживания и мониторинг только общей
загрузки порта; редакторы баз данных управляющей информации Management Information Base (MIB)
также обладают сложной настройкой уровней обслуживания, и в них отсутствует мониторинг.
Исходя из этого, был разработан собственный интерфейс. Для этого была рассмотрена MIB
коммутатора 3Com Super Stack 3 4400 (как наиболее массового в сети ИММ), отвечающая за установку
уровней обслуживания, протокол SNMP, программный интерфейс пакета net-snmp из состава ОС Linux,
СУБД Postgres.
Выяснили, что коммутатор хранит настройки об управлении трафиком в MIB qosProfiles. База данных
qosProfiles состоит из следующих таблиц:
100
 qosProfilesAllClassifierTable, все классификаторы трафика;
 qosProfilesProfileTable, профили коммутатора;
 qosProfilesTrafficAggregateTable, уровни обслуживания;
 qosProfilesMapTable, карта правил управления трафиком;
 qosProfilesPortTable, таблица соответствия интерфейсов коммутатора и профилей;
 qosProfilesCounterTable, таблица счетчиков кадров.
Для изменения и добавления записей в таблицы были разработаны следующие функции:
 set_profile записывает профиль в коммутатор;
 set_classifier записывает классификатор трафика в коммутаторе;
 set_aggregate создает уровень приоритета для трафика в коммутаторе;
 set_map создает карту правила в MIB qosProfiles коммутатора;
 set_port назначает порту коммутатора используемый профиль;
 view_system просмотр системной информации коммутатора;
 view_stat просмотр статистической информации коммутатора;
 view_graph просмотр графика загрузки порта (общая загрузка и загрузка порта трафиком
определенного типа).
Таблица qosProfilesCounterTable доступна только для чтения. Порядок вызова функций
регламентируется описанием MIB.
По описанию MIB qosProfiles составлена схема базы данных по стандарту IDEF1. Для хранения
вновь создаваемых уровней обслуживания (правил) было разработано хранилище. Для создания
хранилища была использована модифицированная схема базы данных qosProfiles, которая позволяет
хранить правила в том виде, как они записаны в qosProfiles для различных коммутаторов.
Модификация позволяет хранить:
 краткое описание ситуации в сети;
 несколько профилей коммутатора, назначенных одному сетевому интерфейсу.
База данных “QoSProfiles” реализована по этой схеме на СУБД Postgres v7.4, которая функционирует
под управлением ОС Linux.
При разработке интерфейса, представляющего собой HTML-страницу, использовались webтехнологии и несколько языков программирования, таких как Java, Perl, JavaScript.
Основным навигационным элементом интерфейса является статическое древовидное меню,
реализованное в виде модуля написанного на языке Java. На этапе проектирования рассматривалось
несколько вариантов реализации данного модуля. Основные критерии выбора языка программирования
для разработки меню:
 удобство создания меню;
 легкость программной модификации дерева меню, необходимая для легкой интеграции модуля и
интерфейса;
 простота получаемого программного кода.
В ходе анализа в качестве языка реализации древовидного меню был выбран язык Java, а средой
разработки пакет NetBeans IDE 3.5.1 фирмы Sun Microsystems. Решение было принято исходя из того,
что интерфейс реализован на языке HTML и для его просмотра может использоваться любой
стандартный браузер, следовательно, интеграция меню означает то, что оно будет работать под
управлением браузера. Из существующих вариантов реализации подобного рода меню нами выбрано
средство разработки меню – язык программирования Java, т.к. он является машинно-независимым.
Элементы или апплеты, разработанные с использованием Java, ограничены в правах использования
ресурсов машины, на которой исполняются, и чаще всего не отключаются пользователями. Java
поддерживается большинством браузеров.
В качестве языка программирования для CGI был выбран Perl, исходя из необходимости поддержки
ОС Linux, наличия развитых средств работы языка с базами данных, SNMP, интерпретируемости языка,
доступности языка и библиотек.
Интерфейс пользователя, разработанный на языке HTML, ориентирован для функционирования во
всех web-браузерах.
Разработанный интерфейс является частью развиваемой в ИММ УрО РАН системы управления
трафиком в среде доступа к ВР и ИР СКЦ [2].
Работа выполняется при поддержке РФФИ, грант № 04-07-90120, № 04-07-90138.
Литература
1. Гольдштейн М.Л., Закурдаев Н.В., Ротанов В.Т. Об использовании перспективных сетевых
технологий при развитии локальной сети суперкомпьютерного вычислительного центра // Алгоритмы и
програм. средства парал. вычислений: Сб. науч. тр. / ИММ УрО РАН. – Екатеринбург,2000. – Вып.4.–С.7685. – Библиогр.: 3 назв.
2. М.Л.Гольдштейн, Н.В.Закурдаев, А.В.Меркульев. Некоторые вопросы построения системы
управления трафиком в среде теледоступа к ресурсам СКЦ // Алгоритмы и программные средства
параллельных вычислений. Вып. 7. Екатеринбург, 2004.
101
СИСТЕМА КАРТОГРАФИРОВАНИЯ И МОНИТОРИНГА СЕТИ
Е.Е.Иванко, Д.А.Шемякин
Институт математики и механики Уральского отделения РАН, Екатеринбург
Тел.: (343) 375-34-38, e-mail: [email protected]
В связи с ростом и усложнением сетей передачи данных в последнее время особенно актуальными
становятся системы централизованного мониторинга и управления сетью. Обычно крупные сети состоят
из оборудования различных типов и разных фирм производителей, что значительно усложняет задачу
централизации управления. В данной статье рассматривается система картографирования сети на
втором и третьем уровне OSI в объединенных TCP/IP сетях, создаваемая в настоящее время на
центральном узле академической сети Уральского отделения РАН.
Система разрабатывается на основе ОС FreeBSD c использованием языков программирования perl
и php, что позволяет пользоваться всеми преимуществами Open Source software и опираться на
универсальный web-интерфейс. Обмен информацией между управляющим сервером и опрашиваемым
оборудованием реализован на базе протокола SNMP и структур данных MIB.
В настоящее время система отлажена для сетей, базирующихся на маршрутизирующем и
коммутирующем оборудовании Cisco и серверном оборудовании платформы ix86 под управлением ОС
Unix. Подобная специализация позволяет использовать Cisco-протокол обмена данными о соседних
устройствах (CDP), поддерживаемый как собственно Cisco-устройствами, так и Unix-серверами.
Используя этот протокол, указанные совместимые устройства периодически обмениваются
информацией о том, какое оборудование подключено к их интерфейсам, по каким портам, какой IP-адрес
оно имеет, как названо администратором и множеством другой полезной информации.
Сбор данных, накопленных в результате обмена, начинается с указанного в конфигурации системы
устройства (корень) и далее осуществляется лавинообразно на основе ранее собранных данных. Такой
метод сбора данных позволяет, зная только одно устройство, получить схему всего доступного сегмента
сети целиком и варьировать вид схемы в зависимости от выбранного корня. Полученная по SNMP
информация о связях между оборудованием и статусе интерфейсов декодируется и сохраняется в
таблицах MySQL, откуда и предоставляется по запросу пользователя:
Пользуясь списками смежности, сформированными на основе полученных таблиц, и несложными
алгоритмами на графах можно строить различные визуализации сети. Собранная информация кроме
самих взаимосвязей позволяет отображать на схемах множество дополнительных свойств. В
простейшем случае это имена, IP-адреса и функциональные типы оборудования. В последней версии
системы реализованы функции отображения схемы сети на втором уровне модели OSI в виде кольца и
дерева.
Схема сети в виде кольца является универсальной, так как способна отображать строение любой
сети. Однако при увеличении числа устройств и связей между ними схема становится неудобочитаемой.
Схема в виде дерева наиболее удобна и привычна для восприятия, но ее использование ограничено
сетями, которые не содержат циклов. Еще две схемы, охватывающие важные частные случаи топологии
сети находятся в стадии тестирования.
Первая из них – схема «кольцо колец», в которой тесно связанные
между собой устройства объединяются в небольшие группы, и уже эти
группы размещаются по схеме кольца. Такая схема полезна в случае
отображения
сети,
состоящей
из
нескольких
равноправных
нетривиальных узлов.
Вторая схема – «дерево колец». В этом случае происходит
аналогичная группировка с тем учетом, чтобы между группами не было
циклов. Далее группы располагаются в виде дерева. Эта схема может
оказаться полезной в случае иерархической организации нескольких
нетривиальных узлов.
Кроме внедрения новых видов схем авторы планируют
реализовать схему сети на 3 уровне модели OSI. Новая схема не
будет загромождаться транспортным оборудованием, будет
отражать информацию связанную только с логической средой
передачи данных (IP-адреса, маршруты и т.д.), что значительно
облегчит понимание логического функционала сети.
Многие переменные базы MIB можно не только считывать, но и
редактировать, что дает возможность однотипно управлять
параметрами сетевого оборудования с удаленной станции (при
помощи протокола SNMP). Объединение в одной системе функций
картографирования, мониторинга и управления позволит создать
удобную систему доступа к информации о сети, способствующую
быстрому принятию решений и эффективной их реализации.
102
СИСТЕМА ЭЛЕКТРОННЫХ БИБЛИОТЕК УРО РАН: ОПЫТ РАЗРАБОТКИ,
ПЛАНЫ РАЗВИТИЯ
И.В.Кириллов, И.А.Хохлов
Институт математики и механики Уральского отделения РАН, Екатеринбург
Тел.: (343) 375-34-38, e-mail: [email protected]
В последние годы становится все более востребован библиотеками и их читателями сервис поиска
информации по каталогам. В перспективе спрос на информационное обслуживание библиотек еще
более возрастет за счет возрождения исследовательской работы, роста промышленности, что повышает
спрос на техническую литературу, причем в немалой степени на литературу прежних лет издания.
Существующее библиотечное программное обеспечение ориентировано не на вузовские или
академические, а на массовые публичные библиотеки. Библиотечных программ, решающих
специфические задачи вузовских и академических библиотек, учитывающих российские условия, пока не
создано и создание таких программных продуктов в ближайшее время маловероятно в силу малой
емкости рынка (крупных вузовских библиотек – мало и финансовые их ресурсы невелики). Специфика
исторического развития каждой библиотеки также порождает массу проблем. Единственный приемлемый
путь решения – создание заказного программного обеспечения.
Как правило, академические библиотеки не могут выделить финансовые ресурсы, необходимые для
заказа ПО в сторонней организации. Собственные службы, занимающиеся информатизацией, по
причине недофинансирования либо отсутствия политической воли не желают создавать подобные
продукты.
Институт математики и механики УрО РАН долгое время выполняет работу по созданию
программного обеспечения электронных каталогов для научных библиотек институтов УрО РАН и
накоплению соответствующих баз данных. Работа началась еще в середине 80-х годов на ЕС ЭВМ,
затем в начале 90-х базы данных были перенесены в локальную систему на ПЭПМ в ИС, построенную на
основе СУБД FoxPro. С некоторой периодичностью DBF-файлы каталогов конвертировались в формат
HTML и размещались на сервере института в Интернет. С 1997 г. проводится работа по созданию
программного обеспечения в среде UNIX для публикации и сопровождения библиографических баз
данных в Интернет. Два года назад были проведены работы по адаптации системы к стандарту
USMARC.
Целью данного доклада ставится задача осветить работы, проводимые ИММ УрО РАН по созданию
библиотечного ПО. В настоящее время ведется разработка по двум направлениям: ПО для
каталогизации фондов библиотек и ПО по обслуживанию Абонемента.
Основные характеристики разрабатываемой системы:
1. Пакет программ “Электронная библиотека УрО РАН” реализован на принципах OpenSource, с
использованием свободно распространяемых программных продуктов и распространяется свободно и
бесплатно на основе лицензии GPL с открытым исходным кодом.
2. Пакет работает в среде свободно распространяемых системных программных средств и
разрабатывается с помощью бесплатно распространяемых инструментальных средств, за счет чего
достигается его низкая стоимость.
3. Пакет программ “Электронная библиотека УрО РАН” – расширяемая система, т.е. состав
информационных систем в ней может дополняться с соблюдением единых принципов организации.
Расширение системы может осуществляться как разработчиками, так и другими коллективами.
4. Структура библиографических данных должна соответствовать международному стандарту
USMARC.
5. Все функции системы – административные и пользователей должны выполняться через Интернет.
Доступ к этой системе – через стандартный браузер Интернет.
В настоящее время распространяется вторая версия системы. В качестве базовых инструментов для
ее разработки используются: операционная система FreeBSD (http://www.freebsd.org.ru/), Web-сервер
Apache (http://apache.lexa.ru/), СУБД MySQL (http://www.mysql.com), языки программирования PHP
(http://www.php.net), Perl (http://www.cpan.org).
Система распространяется в двух вариантах – сетевом и локальном. В сетевом режиме каталоги
библиотек и другие файлы размещаются на региональном специализированном библиотечном сервере
(сейчас их пять), а все работы по сопровождению и администрированию ведутся через Интернет. В
локальном режиме на рабочей станции администратора (или библиотекаря) устанавливается система,
работающая под любой версией Windows, начиная с NT4.0 SP3 или 95, и все работы по сопровождению
и наполнению каталогов ведутся на этой машине без выхода в Интернет, а затем, по мере накопления,
данные передаются по электронной почте на ближайший сервер.
На данный момент создано пять специализированных Web-серверов в научных центрах городов:
Екатеринбурге (http://lib.uran.ru), Перми (http://elib.icmm.ru/lib), Ижевске (http://fti.udm.ru/lib),
Челябинске (http://elib.urc.ac.ru) и Сыктывкаре (http://library.komisc.ru), на которых ведутся работы по
переводу каталогов библиотек региональных научных центров в электронный формат. В настоящее
время в системе содержится около 140 тыс. записей в электронных каталогах научных библиотек
институтов УрО РАН.
103
Кроме того, начата работа по разработке третьей версии системы. Основными задачами при
разработке третьей версии являются:
1. Разработка подсистемы “Абонемент”. Разработка третьей версии системы ведется на основе
объектно-ориентированного подхода. Объектно-ориентированный подход основан на систематическом
использовании моделей для языково-независимой разработки программной системы, на основе из ее
прагматики.
2. Внедрение в систему протокола Z39.50 – протокол типа клиент/сервер для информационного
поиска. Он включает процедуры и структуры для поиска в разнородных базах данных для клиентов,
обеспечиваемых сервером. Поддерживается контроль доступа, удаленное обслуживание и средства
помощи. Разработана программа конвертирования БД Системы электронных библиотек в формат
USMARC на языке Perl. Созданные файлы с помощью этого модуля будут загружаться в Zebra-сервер,
тем самым, создавая возможность выполнения поиска и извлечения каталожной информации по
протоколу Z39.50.
В дальнейшем планируется:
1. Данные библиотечных описаний полностью перевести на хранение в Zebra-сервер, тем самым,
обеспечив хранение информации в формате USMARC.
2. ПО системы электронных библиотек переработать с использованием PHP/YAZ для работы с Zсервером напрямую по протоколу Z39.50, оставив хранение данных в СУБД MySQL только для
временных документов (в качестве подготовительного буфера).
Таким образом, в результате система должна приобрести поддержку протокола Z39.50, избавиться
от недостатков, связанных с хранением библиографической информации в реляционной СУБД и должны
остаться все ее плюсы: свободно распространяемое ПО, удобный Web-интерфейс для работы
библиотек.
ОРГАНИЗАЦИЯ ОБМЕНА ДАННЫМИ В РАЗНОРОДНЫХ
ИНФОРМАЦИОННЫХ СИСТЕМАХ В БАЗИСЕ ТЕХНОЛОГИЙ ВЕБСЕРВИСОВ
В.А.Старых1, С.Б.Дунаев2, С.Д.Коровкин2
1) Российский государственный университет инноваций и технологий
предпринимательства, Москва
2) Ивановский государственный энергетический университет, Иваново
Тел.: (095) 208-15-48, e-mail: [email protected]
В задачах построения сложных информационных систем одной из главных проблем является обмен
данными между различными подсистемами. Нередко самая простая задача импорта/экспорта данных из
одной системы в другую приводит к необходимости серьезных разработок модулей на стыке подсистем.
Задача существенно облегчается, если данные определенного класса будут перемещаться между
подсистемами, при условии, что в этих подсистемах будет заложена технологически реализованная
возможность воспринимать извне и отдавать наружу данные в стандартном формате импорта/экспорта.
Данный подход является основой для разработки метаданных и интерфейсов для обмена регулярными
данными для различных унаследованных разноформатных систем. На этапе построения инфологических
моделей документарного обеспечения управления и создания спецификаций протокола взаимодействия
разноформатных систем используются технологии XML.
Для решения этой задачи необходимо:
 разработать формат документа обмена, основанный на языке XML, и спецификации на создание
программных средств обмена между различными информационными системами и/или
подсистемами, как уже созданными, так и, по возможности, теми, что будут созданы в будущем.
 разработать спецификации на различные слои метаданных, которые будут описывать данные в
каждой из подсистем, вовлеченные в процессы информационного обмена. Сам по себе стандарт
XML является обобщенным форматом данных, и необходимо дополнить язык XML семантикой,
которая существует в области разработки информационных систем, основанных на понятии
"документ", таких как: электронные архивы, системы документооборота и делопроизводства,
генераторы отчетов из различных ERP-систем и т.д.
 разработать сценарии информационного обмена, которые будут включать в себя и использовать
подмножество XML-схем, что обеспечивает с одной стороны возможность работы с файлами в
едином универсальном формате стандартным XML-инструментарием, а с другой стороны
упрощает разрабатываемые программы для импорта/экспорта структурированных данных в XMLформате.
В общем случае процесс обмена осуществляется с использованием сценариев загрузки/выгрузки
автоматически, или с возможностью административного интерфейса через веб-приложение: “Выгрузить
из системы X данные по схеме выгрузки N и загрузить в систему Y по схеме загрузки M”.
Можно рассматривать один из двух способов организации административного интерфейса в
варианте регулярного периодического обмена:
104
1. Централизованное администрирование репозитария сценариев загрузки/выгрузки данных. Этот
вариант предполагает создание единого репозитария схем загрузки/выгрузки для всех систем
участвующих в обмене данными и средства его администрирования.
2. Распределенное администрирование локальных репозитариев для каждой системы в
отдельности. Этот вариант предполагает создание отдельных репозитариев схем загрузки/выгрузки для
каждой из систем и развертывания локальных средств их администрирования.
В варианте динамического обмена ключевым звеном является единый универсальный формат
документа обмена и протокол SOAP, по которому передаются динамически запрашиваемые данные.
Этот формат представляет собой подмножество XML-схем, дополненный XML семантикой,
существующей в области разработки информационных систем.
Предполагается, что каждая из информационных систем имеет внутреннее хранилище (например,
базу данных). Связь между системами осуществляется по принципу «точка-точка» через канал передачи:
отправитель экспортирует внутренние данные в формат, а получатель импортирует данные из формата
в свое внутреннее хранилище. В этом случае данные находятся в родном формате системы, к которой
обращаются по запросу и каждая из запрашивающих клиентских SOAP-программ имеет доступ только к
метаданным, но не к методам извлечения этих данных. Методы извлечения нужных данных,
дефинированных в метаописаниях, реализуют специальные программные компоненты Plug-Ins,
написанные средствами той системы, к которой обращаются по запросу. Plug-Ins должны уметь
извлекать данные и формировать документ в соответствии с форматом передачи данных. Для этого
plug-ins должны реализовывать в полном объеме интерфейсы взаимодействия с SOAP-сервером обмена
и снабжаться необходимыми библиотеками для непосредственного доступа к источнику данных. В свою
очередь SOAP-сервер должен реализовывать механизм взаимодействия с клиентами посредством
SOAP-сообщений, в соответствии с разрабатываемой спецификацией, которая определяет четыре
стандартных подтипа передаваемых сообщений:
 команды для управления действиями систем;
 метаданные (описания) предоставляемых ресурсов;
 передаваемые данные;
 результат обработки запроса системой.
При этом спецификация никак не ограничивает возможности передачи нескольких документов в
одном SOAP-сообщении.
Собственно процесс обмена динамическими данными между разноформатными системами,
представляет собой взаимодействие SOAP-клиента и SOAP-сервера, обменивающихся SOAPсообщениями. После процесса установления соединения, SOAP-клиент запрашивает у удаленного
SOAP-сервера блок метаданных, где описана структура предоставляемой для экспорта информации. На
данном этапе происходит SOAP-обмен управляющими блоками (пакеты данных еще не передаются).
После получения метаданных, клиент формирует специальный запрос на получение определенного
пакета данных в едином универсальном формате. SOAP-сервер принимает запрос клиента, вызывает
необходимый модуль выгрузки (plug-in), который выгружает нужные данные из источника данных в
единый формат передачи. SOAP-сервер формирует SOAP-сообщение, проверяет его на целостность и
передает по линии связи (протокол HTTP) в принимающую систему. На принимающей стороне начинает
работу импортирующая программа (соответствующий plug-in), который обеспечивает импорт данных,
конвертируя XML-представление во внутреннее представление источника данных. Для различных ERPсистем существуют готовые XML-конвертеры, которые могут быть использованы при необходимости.
В данном подходе предлагается унифицированное решение, которое базируется на едином
представлении документа. Необходимо сделать так, чтобы на всех этапах жизненного цикла работа с
документом велась единообразно. Это позволит выделить часто встречающиеся преобразования для
повторного использования в других информационных системах.
Предлагаются следующие требования к унифицированной XML-схеме, описывающей документы
обмена.
Схема может рассматриваться как коллекция (словарь) определений типов и объявлений элементов,
имена которых принадлежат определенному пространству имен, которое называется целевым
пространством имен. Целевые пространства имен дают возможность видеть различия между
определениями и объявлениями из различных словарей. Например, целевое пространство имен дает
возможность
различить
между
объявлением
для
element
(http://gberman.narod.ru/xmlarticles/schema0/E.html#element-element) в словаре языка XML Schema, и
объявлением для element в гипотетическом словаре языка по химии. Первый – часть целевого
пространства имен http://www.w3.org/2001/XMLSchema, а второй – часть другого целевого пространства
имен.
Если нужно проверить документ примера на соответствие одной или нескольким схемам
(посредством процесса, называемого проверкой правильности схемы), то для проверки элементов и
атрибутов в документе примера, необходимо определить нужные объявления элементов и атрибутов и
определения типов в схемах. Целевое пространство имен играет важную роль в процессе
идентификации.
Все разрабатываемые схемы должны удовлетворять требованиям комитета W3C в соответствии с
XML Schema Requirements, описанными в документе http://www.w3.org/TR/2003/WD-xmlschema-11-req20030121/.
105
Основные требования
1. Схема не должна иметь ориентации на конкретное предприятие или фрагментов,
ориентированных на конкретного потребителя.
2. Схема должна быть документирована. Программные продукты, работающие со схемой не должны
использовать недокументированные возможности схемы.
3. Объекты метаданных должны иметь осмысленные идентификаторы, а в случае, если они длинные
или сложные, еще и синонимы. Объекты метаданных, идентификаторы которых могут использоваться
при работе схемы (например, параметры подключения к источнику данных), должны иметь комментарии
Структурные требования
XML-схема должна определять:
 механизмы для разграничения структуры (пространства имен, элементы, атрибуты) и содержания
(типы данных, сущности(объекты), примечания);
 механизмы, обеспечивающие возможности наследования для элементов, атрибутов и типов
данных;
 механизмы для встраивания документов.
Требования к типам данных
XML-схема должна:
 обеспечивать набор примитивных типов, включая: byte, date, integer, sequence, SQL & Java
primitive data types, etc.;
 определять тип системы, которая адекватна операциям импорта/экспорта из СУБД (к примеру,
реляционная, объектная, OLAP (http://www.olapcouncil.org/);
 различать требования по отношению к лексическому представлению данных и управлению
основным информационным набором;
 позволять создание пользовательских типов данных, которые могут быть получены из
существующих типов данных и ограничивать некоторые их свойства (например, диапазон
значений, точность, длина, маски и т.д.).
Требования по согласованию
XML-схема должна:
 определять отношения между схемами и XML документами;
 определять отношения между достоверностью (validity) схемы и достоверностью XML;
 определять отношения между схемами, XML DTDs, и их информационными наборами.
Метаданные в процессе обмена данными между разноформатными системами также могут быть
описаны на двух уровнях:
 схемы метаданных для регулярного периодического обмена;
 схемы метаданных для динамического обмена данными по запросам через протокол SOAP.
Загружаемые документы XML могут поступать из другого приложения, из внешнего источника
данных (база данных или файл) или из формы ввода данных. Для загрузки/выгрузки данных XML в
реляционные БД и документоориентированных БД типа Lotus Notes, разработаны специальные
программные средства. Данные программные средства представляют собой набор библиотек,
позволяющих осуществлять загрузку и выгрузку данных в формате XML произвольной структуры.
Настройка под конкретную структуру осуществляется при помощи т.н. карт загрузки/выгрузки, которые
представляют из себя XML-документы, описывающие сценарий преобразования данных. В свою очередь
описание работы с источником данных содержится в XML-документах, включающих в себя информацию
о метаданных источника (информация о типах, параметры подключения и т.д.).
Для того чтобы разнородные системы могли динамически обмениваться информацией,
спецификация предусматривает разработку форматов двух типов универсальных документов:
 Формат документа, являющегося сообщением, передаваемым от одной системы к другой (Схема
описания сообщений message.xsd).
 Формат документа, описывающий хранящиеся на данной системе ресурсы (Схема описания
метаданных resources.xsd).
При этом в схему документа, описывающего сообщения обмена, импортирована схема,
описывающая хранящиеся в данной системе ресурсы. Это обосновывается тем, что желательно:
 избежать дублирования при хранении схем;
 хранить метаописания каждого из предоставляемых ресурсов совместно со списком всех ресурсов
системы, для более эффективного управления списком.
Предлагаемая реализация в разрабатываемой спецификации предусматривает использование
команд для управления системами. На каждой из систем команды обрабатываются SOAP-сервером,
принявшим SOAP-сообщение. SOAP-сервер, получивший команду, вызывает методы соответствующего
native plug-in, в соответствии с разрабатываемыми интерфейсами взаимодействия между SOAPсервером и native plug-ins.
При передаче данных между системами необходимо передавать также и метаописания сущностей и
атрибутов, которым соответствуют данные, для того чтобы соответствующий plug-in на принимающей
106
системе мог загрузить принятые данные в источник данных и, при необходимости обновить данные в
списке предоставляемых ресурсов. На текущий момент спецификация не предусматривает создания
средств для автоматической генерации метаописания конкретного ресурса.
Программный продукт типа SOAP-сервер, должен соответствовать стандарту обмена данными, в
соответствии с данной спецификацией. Любой SOAP-сервер в любой информационной системе должен
обеспечивать:
 доступ по протоколу HTTP;
 обработку сообщений, описываемых в спецификации на сообщения обмена между системами;
 хранение и предоставление в формате, определенном в данной спецификации, метаописаний
предоставляемых ресурсов;
 механизм взаимодействия с native plug-ins при необходимости получения или загрузки данных.
SOAP-сервер должен обеспечивать работу с plug-in, соответствующим требуемому метаописанию
ресурса. Для этого в списке метаописаний ресурсов включен элемент pluginInfo, описывающий
параметры работы с plug-in. Логику обработки параметров должен реализовывать SOAP-сервер.
Например, если SOAP-сервер и plug-in взаимодействуют в соответствии с технологией COM (Component
Object Model), то параметры должны содержать уникальный идентификатор COM-объекта,
реализующего plug-in и другую необходимую информацию.
В настоящей спецификации Plug-Ins определены как специальные программные компоненты,
написанные средствами той системы, к которой обращаются по запросу. Plug-Ins должны уметь
извлекать данные и формировать документ в соответствии с форматом передачи данных. Для этого
plug-ins должны реализовывать в полном объеме интерфейсы взаимодействия с SOAP-сервером обмена
и снабжаться необходимыми библиотеками для непосредственного доступа к источнику данных.
Интерфейсы взаимодействия Plug-Ins c SOAP-сервером должны определяться в терминах любой
объектной реализации COM, DCOM, EJB, CORBA. Возможны несколько реализаций SOAP-серверов,
отвечающих данной спецификации, для различных программно-технологических платформ.
Разрабатываемые plug-ins должны удовлетворять следующим требованиям:
 Учитывать особенности источника данных, с которым он работает (параметры подключения,
синтаксис языка общения с источником и др.);
 Уметь работать с метаописаниями ресурсов (создавать структуры в источнике данных по
метаописаниям, загружать данные;
 Формировать XML-документ с данными, содержащий метаописания данных ресурса, в
соответствии с разрабатываемой спецификацией;
 Полностью реализовывать интерфейс взаимодействия с SOAP-сервером.
ТРАНСЛЯЦИЯ МАТЕМАТИЧЕСКИХ ФОРМУЛ ИЗ ДОКУМЕНТОВ MS WORD В
СТАНДАРТНЫЙ ФОРМАТ
В.А.Липовченко, А.В.Манцивода
Иркутский государственный университет
Тел.: (3952) 33-21-78, e-mail: [email protected]
В исследовательской группе ЦНИТ ИГУ значительное внимание уделяется задачам обработки
естественнонаучных текстов и, в частности, работе с математическими формулами. Эта работа
включает в себя создание конвертеров из разнообразных представлений математических формул – TeX,
Equation, MathType в канонический формат XML/MathML [4]. Данные конвертеры формируются в виде
онлайновых сервисов, доступных как пользователям, так и системам, работающим с математическими
формулами, например, [2, 3]. В докладе рассматривается один из аспектов данного проекта – работа с
математическими формулами, представленными в форматах Equation Editor и MathType, и используемых
в редакторе MS Word.
В последнее время для создания математических текстов стал активно использоваться редактор MS
Word, включающий специальные возможности для порождения формул. Подход, реализованный в этом
редакторе, более привычен массовому пользователю, чем, например, в классической системе работы с
математическими текстами (La)TeX, он не требует установки дополнительного программного
обеспечения. Минусы также очевидны. Во-первых, полиграфическое качество математических формул в
Word'е значительно ниже, чем то, которое генерирует система ТеХ. Второй проблемой является
закрытость форматов Microsoft. Из этого, в частности, следует низкая пригодность word-форматов для
публикации информации в Интернете – приходится конвертировать текст в html, причем на сегодняшний
день MS Word при конвертации в html-формат использует устаревший метод перевода формул в
растровую графику (например. gif-формат). Есть и другие довольно существенные недостатки. Вообще, с
точки зрения современного понимания того, как работать со структурированной текстовой информацией,
идеология, заложенная в редакторе Word, является более «древней», чем в появившейся раньше
системе TeX.
Здесь можно говорить и о другой проблеме. Наличие нескольких стандартов представления
математических и естественнонаучных текстов вносит очень серьезную путаницу. Например, уже
107
сегодня многие сталкиваются с той проблемой, что организаторы разных научных конференций требуют
тексты в разных форматах – кто-то в LaTeX’е, а кто-то в Word'е. Информационная среда заполняется
документами, представленными в несовместимых форматах. Результат – потеря целостности
информационной среды, постоянные проблемы с чтением, использованием и обработкой текстов в
разных представлениях.
Наиболее технологичным подходом к работе с естественнонаучными текстами является разработка
и использование специальных диалектов (словарей) XML. Стандартом публикации математических
формул в Web с 1998 г. считается базирующийся на XML язык математической разметки MathML [4].
Вместе со спецификациями, связанными со стандартизацией структуры текстов (например, DocBook
[5]), MathML способен сформировать канонический формат представления естественнонаучных текстов,
который, во-первых, основан на разметке логического уровня, и из которого возможна трансляция в
любой классический и новый формат, ориентированный на внешнее представление документов.
Однако язык MathML создавался с целью его использования, как основы коммуникативной цепочки и
автоматической работы сервисов. Он не ориентирован на непосредственную работу с человеком в силу
своей громоздкости. Для генерирования MathML-кода необходимо использовать либо WYSIWYGредакторы, либо конвертеры из других систем набора математических текстов.
Работа, проводимая нами в этом направлении, заключалась в создании программы-конвертера
формул из документов Microsoft Word, созданных с использованием редактора формул Microsoft Equation
Editor 3.0 и MathType 5.0 в формат MathML с оптимизацией для просмотра в различных Интернетбраузерах. Реализация программы выполнена на языках VBA и Java и основана на извлечении структур
формул из RTF-файлов. Опора на язык Java позволяет производить трансляцию формул вне редактора
MS Word.
Результаты работы позволяют использовать редактор формул Equation Editor в качестве WYSIWYGредактора, генерирующего MathML-код, а также позволяют транслировать в стандартный формат ранее
созданные математические тексты.
Разработанная технология трансляции математических формул на основе обработки RTF-файлов
может быть без труда применена для трансляции формул из документов Microsoft Office в различные
форматы, в том числе и в TeX.
Данная разработка будет доступна широкому кругу пользователей в качестве онлайнового вебсервиса, размещаемого на минипортале нашей исследовательской группы.
Литература
1. Профессиональный редактор формул MathType. http://www.mathtype.com.
2. Д.С.Нартов, О.А.Романова, Н.О.Стукушин. Онлайновая консультация по математике. Труды
Всероссийской конференции Телематика'2003, СПб, 2003, с.203.
3. А.А.Малых, А.В.Манцивода, О.А.Романова, Н.О.Стукушин. QTI-плейер: онлайновый сервис
поддержки тестирования. Труды Всероссийской конференции Телематика'2004.
4. Спецификации XML/MathML. http://www.w3.org/Math/.
5. Словарь для форматирования текстовых публикаций XML/DocBook. http://www.docbook.org.
RTF, LaTeX И ЛОГИЧЕСКАЯ РАЗМЕТКА ДОКУМЕНТОВ
А.В.Манцивода, В.А.Петухин, М.И.Шивторов
Иркутский государственный университет
Тел.: (3952) 33-21-78, e-mail: [email protected]
Основным средством подготовки текстовых материалов сегодня является редактор Microsoft Word.
Как следствие, большое число документов хранятся в форматах, поддерживаемых этим текстовым
процессором. Эти форматы обладают рядом негативных черт. Основные из них – их закрытость (DOC), и
ориентация на полиграфическую разметку текста в ущерб логической (DOC, RTF). Эти характеристики
ставят серьезные барьеры автоматической обработке документов. RTF [3] (Rich Text Format) имеет
открытую спецификацию. Тем не менее, полиграфическая направленность делает невозможным
реализацию «интеллектуальных» сервисов, работающих с документами. Они порождают то, что СентЛорейн в 1999 г. назвал WYSIWYG-кошмаром (WYSIWYG disaster). «Простой текст, пусть и слишком
примитивный, обрабатывается намного легче, чем результат работы среднего редактора текстов, либо
настольной издательской системы. На практике девиз WYSIWYG превращается в WYSIAYG – “What you
see is ALL you get” («получишь только то, что видишь»). Текст настолько перегружен форматирующими
тегами, что совершенно не остается места для семантики и прагматики документа» [4]. К RTF это
относится в полной мере.
Кроме word-документов, большой объем научных и образовательных ресурсов разработан в
формате издательской системы TeX/LaTeX. С точки зрения системы разметки текста, LaTeX организован
не в пример лучше DOC и RTF. Он содержит большое количество примитивов, позволяющих
структурировать документ на логическом уровне. Это не мешает генерировать высококачественную
полиграфию документа, особенно в части математических формул. Здесь у LaTeX’а конкурентов нет.
108
Широкими возможностями по автоматизированной машинной обработке обладает расширяемый
язык разметки XML. Однако, в силу его ориентированности на компьютер, человеку весьма неудобно
напрямую работать с XML-документами, как на этапе создания, так и на этапах их обработки и
использования. Язык XML можно использовать для структурированной разметки произвольной
информации. Для представления естественнонаучных текстов нужны его диалекты (словари) как
минимум двух типов – структурирование повествовательного («обычного») текста, и представление
математических формул. Например, в качестве первого можно взять разумное подмножество стандарта
DocBook [2], а в качестве второго – язык MathML [1]. При необходимости всегда можно подключить
другие словари, работающие в собственных пространствах имен (например, для представления
химических формул, векторной графики, иных внешних объектов и, в принципе, любого формата,
реализуемого как диалект XML). В силу своей огромной гибкости, данное представление текстовых
документов может служить в качестве канонического, поскольку:
 в минимальной степени теряет логическую структуру документа, как ее видит автор;
 допускает конвертацию в любой полиграфический формат, например, DOC, RTF, LaTeX, HTML;
 как комбинация диалектов XML обладает большим количеством разнообразных сервисов и
методов, с помощью которых может обрабатываться;
 является комбинацией языков, обладающих открытыми спецификациями.
Этот список можно продолжать. XML-формат очень хорош для хранения и автоматической
обработки документов. Полиграфические форматы более удобны для человека.
В связи с этим нами реализуется набор сервисов, позволяющих объединить лучшие стороны
каждого из подходов через конвертацию документов, представленных в различных полиграфических
форматах, в канонический формат – комбинацию XML-диалектов. На данном этапе реализуются два
сервиса, позволяющие переводить в XML-формат RTF-документы и документы, подготовленные в
системе LaTeX. Отметим, что если во втором случае практически вся работа по конвертации может
осуществляться автоматически, то в первом случае для получения качественного результата
необходимо произвести дополнительную разметку RTF-документа (что можно сделать, например, в
рамках MS Word, расширенного небольшим количеством дополнительных средств).
В настоящее время на мини-портале нашей исследовательской группы создается набор онлайновых
сервисов, реализующий вышеописанную схему. На вход ему подается документ в полиграфическом
формате (LaTeX, RTF), на выходе имеем документ формата DocBook/XML с включениями других XMLдиалектов (например, MathML), определенных в собственных пространствах имен. Заметим, что эти
сервисы эффективно взаимодействуют с разработанным нами ранее сервисом трансляции TeX-формул
в MathML (для LaTeX-документов), и с разрабатываемым сегодня сервисе по трансляции
математических формул в «word-форматах» [5] (в RTF-документах).
Подчеркнем, что XML-форматы разметки текстов не обязательно должны быть основой для
распространения документов. XML-формат открыт и доступен, что не всегда согласуется с системой
защиты авторских прав. Основным форматом для распространения текстовых документов на
сегодняшний день является PDF. С другой стороны, XML-формат очень удобен при обмене данных
между автоматическими сервисами систем образования, например, внутри электронной библиотеки.
Незаменим XML-формат как базовый формат для «авторского» экземпляра текста, поскольку в
минимальной степени теряет логическую структуру документа, задуманную разработчиком. Хорошо
известны случаи, когда у авторов сохранялись только электронные экземпляры в PDF, что приносило
множество проблем при корректировках текста или подготовке новых изданий (например, если текст
содержал большое количество математических формул). Можно привести множество других приложений
канонических форматов представления документов в научно-образовательной среде.
Литература
1. Спецификации XML/MathML. http://www.w3.org/Math/.
2. http://www.docbook.org/specs/cs-docbook-docbook-4.2.html – The DocBook Document Type.
3. Rich Text Format (RTF) Version 1.5 Specification. http://www.biblioscape.com/rtf15_spec.htm.
4. St. Laurent, Simon (1999) XML: A Primer, second edition, M & T Books, Foster City, CA.
5. В.А.Липовченко, А.В.Манцивода. Трансляция математических формул из документов MS Word в
стандартный формат. Телематика’2004.
ИЗОБРАЖЕНИЕ МАТЕМАТИЧЕСКИХ ФОРМУЛ В ФОРМАТЕ MathML
А.А.Куроптев, А.В.Манцивода
Иркутский государственный университет
Тел.: (3952) 33-21-78, e-mail: [email protected]
Сервис отрисовки математических формул является важной составляющей обработки
естественнонаучных текстов. Начиная с системы TeX, в которой отрисовка формул имеет
непревзойденное качество, было реализовано несколько серьезных проектов, связанных с их внешним
представлением. С появлением стандарта описания формул XML/MathML [1], содержащего достаточно
строгие и четкие правила внешнего представления формул, появилось несколько новых проектов
109
«отрисовщиков». Сегодня математические формулы «понимает» часть браузеров, есть и независимые
проекты, самым известным из которых является, пожалуй, проект фирмы Design Science (MathType и
MathPlayer [2]).
MathML состоит из множества элементов XML, предназначенных для разметки математических
систем. Элементы делятся на три группы: презентационные, содержательные и интерфейсные. С
помощью презентационных элементов задается визуально-ориентированное описание математических
формул. Для разметки визуального представления математических формул в MathML используется
около 30 элементов и 50 атрибутов. Большинство элементов относятся к схемам расположения в
двумерном пространстве.
Отрисовщик формул является важнейшим сервисом, ответственным за внешнее представление
математических формул. Необходимость разработки собственного отрисовщика в рамках нашей
исследовательской группы была обусловлена тем, что спецификации, интерфейсы и условия
использования уже разработанных систем не позволили нам интегрировать имеющееся на рынке
программное обеспечение в систему сервисов, развиваемую в ЦНИТ ИГУ.
В нашей исследовательской группе работа по отрисовке математических формул ведется уже
несколько лет. Сегодня работает драфт-версия сервиса, генерирующая внешний вид не очень высокого
качества, но, тем не менее, активно используемая в разнообразных приложениях, в частности, в
реализации онлайновой конференции по математике. В настоящее время нами разрабатывается
«чистовой» сервис отрисовки математических формул. Сервис строится на разработанной нами
объектной модели MathML. Основные свойства объектной модели:
 Каждому элементу MathML соответствует отдельный класс Java.
 Каждый такой класс реализует общий для всех элементов MathML набор интерфейсов и
выполняет отрисовку соответствующего элемента MathML.
 Структура хранения информации в виде объектов Java – древовидная, как и в MathML.
Иерархия элементов MathML демонстрирует, что все классы для математических элементов могут
иметь общий интерфейс и абстрактных «родителей», необходимых для реализации общей
функциональности, например, правил расположения в пространстве.
Важной идеей оказалась реализация работы с абстрактным устройством вывода. Абстрактное
устройство задает фиксированный набор команд для создания изображения (пример такой команды:
нарисовать линию от точки A до точки B). В дальнейшем реальные устройства вывода, получая такие
стандартные команды, создают изображение. По сути дела речь идет о компиляции математических
формул в программу на языке графических векторных команд, которая в дальнейшем интерпретируется
при работе с реальными устройствами. Это обеспечивает необходимую гибкость сервиса и возможность
получать картинку в разных графических форматах.
Данный проект реализуется на языке Java. В настоящее время (апрель 2004 г) экспериментальная
версия сервиса отрисовки (с ограниченными возможностями) эксплуатируется в тестовом режиме как
онлайновый сервис мини-портала нашей исследовательской группы.
Литература
1. Спецификации XML/MathML. http://www.w3.org/Math/.
2. Пакеты MathType и MathPlayer. Компания Design Science. http://www.mathtype.com.
ПРОГРАММНАЯ ИНЖЕНЕРИЯ: ПРОБЛЕМЫ ОБУЧЕНИЯ
Н.К.Нуриев, Л.Н.Абуталипова, Р.Х.Фатыхов
Казанский государственный технологический университет
Тел.: (8432) 72-52-44, e-mail: [email protected]
Внедрение результатов программной инженерии в разнообразные сферы человеческой
деятельности привело к необходимости поддержки в актуальном состоянии больших и сложных
программных систем. От «дидактической машины» по программной инженерии требуют все больше
информационно-интеллектуальных ресурсов для поддержки и создания все усложняющихся
информационных систем. Все это приводит к дисбалансу между потребностями в специалистах в
обществе и дебиторскими возможностями этой машины. Это противоречие создает дидактическую
проблему оптимизации подготовки и переподготовки кадров в области программной инженерии.
Основные трудности, возникающие при решении этой проблемы, вызываются следующими причинами:
темпы роста количества информации, требуемой для поддержки профессиональной деятельности в
области программная инженерия, плохо совместимы в системе реального времени с физически
возможными темпами интериоризации информации по технологиям с опорой на старые методологии.
Традиционные формы обучения (как правило, из-за своей статичности и ресурсозатратности) уже не
могут поддержать ни темп, ни качество образования специалиста в области программной инженерии и
сами вынуждены находиться в состоянии постоянной (близко к стохастичной) модернизации.
Деятельность по обучению в области программной инженерии должна быть организована оптимально по
следующим основным критериям: эффективности формирования структуры и содержания
информационно-интеллектуальных ресурсов, методов их использования на практике, темпов развития
110
показателей креативности специалиста, широты образованности его во многих предметных областях.
Оптимизация по каждому из этих критериев в отдельности приведет к необходимости выполнения
противоречивых действий при организации обучения. Оптимальное решение, т.е. оптимальный вариант
обучения (ОВО) в области программной инженерии поддерживается, в целом, методологией обучения,
учитывающей совместное, гармоничное, компромиссное влияние всех критериев оптимизации на синтез
этой методологии. Таким образом, полученная методология, поддерживающая ОВО, оказывается
экстремальной в области программной инженерии. Разумеется, что экстремальная методология
концептуального уровня должна быть поддержана всеми ресурсами и методиками дидактики
программной инженерии на любом иерархическом уровне обучения. Это касается печатных учебнометодических курсов, методики организации структуры и содержания ресурсов учебно-методического
портала кафедры (www.ipm.kstu.ru), т.е. всех объектов виртуального и физического уровней
существования и форм представления.
Для роста информационно-интеллектуального потенциала обучаемых и поддерживаемых их
информационных ресурсов необходимо организовать систему трансформации информационных
ресурсов дидактической системы в информационно-интеллектуальные ресурсы обучаемых. На рисунке
показана общая схема трансформации информационных ресурсов (I-ресурсов) дидактической системы в
информационно-интеллектуальные ресурсы (II-ресурсы) обучаемых.
Под трансформацией I-ресурсов в II-ресурсы будем понимать процесс освоения (интериоризации ) Iресурсов с последующем их преобразованием в способности обучаемого. Двигателем такой
трансформации является определенным образом организованная в дидактическом пространстве
деятельность, направленная на достижения определенной цели, под управлением системы методов,
поддерживаемых определенной методологией. Эта трансформация происходит во времени (при разных
формах обучения за разное количество времени) с различными показателями эффективности. В
результате провиденного системного анализа можно сделать вывод: в области дивергентности
дидактической системы существует дидактическая система, которая будет иметь более высокие
показатели эффективности (коэффициент трансформации) в системе сформированных критериев (в
шкале ценностей). В самом общем виде, проблему поиска оптимальной дидактической системы в
области дивергентности дидактических систем можно сформулировать так: Необходимо сформировать
(спроектировать) дидактическую систему, которая имела бы наибольший показатель
эффективности по трансформации I-ресурсов дидактической системы в II-ресурсы обучаемых, т.е.
имела бы наибольший коэффициент трансформации. Дидактическую систему с наибольшим
коэффициентом трансформации будем называть экстремальной дидактической системой или
дидактическим пространством программной инженерии (ДПИ). Разумеется, функционирование ДПИ
происходит под управляющим воздействием определенной методологии, которую будем называть
методологией творческой аналогии (МТА).
111
ИНТЕГРАЦИЯ WEB-САЙТОВ С ПОМОЩЬЮ ПРОКСИ-СЕРВЕРА
М.В.Булгаков, С.С.Внотченко
Государственный научно-исследовательский институт информационных
технологий и телекоммуникаций “Информика”, Москва
Тел.: (095) 237-56-13, e-mail: [email protected]
При разработке нового Web-сайта или портала часто возникает необходимость заимствования
(повторного использования) раздела уже существующего сайта. В дальнейшем сайт, раздел с которого
мы заимствуем материалы, будем называть исходным или контентным, а новый – разрабатываемым,
или основным. Обычно разделы сайта являются динамическими и/или имеют некоторые связанные с
ними динамические подсистемы. Например, раздел может заполняться через Web-интерфейс
администратора или иметь специализированный интерфейс поиска, реализованный на основе
реляционной базы данных.
Как правило, использованная операционная система, база данных и/или язык программирования на
исходном и разрабатываемом сайтах будут отличаться. Например, в портале “Российское образование”
исходный сервер, предоставляющий доступ к базам данных, был реализован на ОС Windows 2000, языке
Perl и БД MS SQL Server, а вновь разрабатываемый – на ОС Linux, MySQL и PHP.
В случае, когда языки отличаются, перенос динамического раздела эквивалентен повторной
реализации раздела в рамках нового сервера или переводу ряда модулей с одного языка
программирования на другой. Оба варианта являются достаточно трудозатратными. Хорошим решением
этих проблем было бы использование нужных данных прямо оттуда, где они формируются, без
дополнительных затрат на их перенесение.
К сожалению, в языке HTML [1] не предусмотрено специальных средств для повторного
использования данных. Шаги в этом направлении ведутся в рамках стандартов XML [2] – Xlink [3]. Однако
практическое использование этих спецификаций – вопрос будущего, так как общепринятым стандартом
Web по-прежнему остается язык HTML. Кроме того, современные браузеры не поддерживают
спецификацию Xlink в достаточном для практического использования объеме.
Постановка задачи
В настоящее время, для того чтобы взять данные оттуда, где они формируются, можно
воспользоваться прокси-сервером. Он обладает всей необходимой информацией для обеспечения
прозрачного доступа пользователя к Web-серверу. Хотя стандартный прокси-сервер не обладает
средствами для пост-обработки HTML и в таком виде мало пригоден для задач интеграции, на его основе
можно построить сервер, выполняющий такую обработку.
Обработчик HTML прокси-сервера загрузит указанный HTML-документ с контентного сервера, а
также несколько дополнительных документов с разрабатываемого сервера. Затем из исходных
документов по некоторому формализованному алгоритму может быть получен результирующий, который
будет оформлен в стиле разрабатываемого сервера.
Прокси-сервер, имеющий такой обработчик, будем называть интегрирующим. Его вариант был
реализован на языке Си в виде модуля mod_proxy_mix для Web-сервера Apache 1.3.x [4] и используется
на федеральном портале “Российское образование” [5]. Правомочность такой операции допускается
лицензией [6] сервера Apache.
Модель Web-страницы
Для того чтобы упростить процедуру построения результирующего HTML-документа, была выбрана
модель Web-страницы, состоящей из трех частей. Эти части – верхний заголовок, основное содержание
(контент) и нижний заголовок. При этом страницы заголовков формируются разрабатываемым сервером,
а содержательная часть контентным. Заголовки могут и не быть корректными HTML-документами, однако
объединение их секций <BODY> должно давать корректный HTML-документ. Под корректностью HTMLдокумента понимается, что в нем нет тэгов, которые были бы открыты, но не были бы закрыты.
Современные Web-страницы, как правило, имеют следующий вид:
Верхний заголовок
[Логотип] [Меню навигации по сайту]
[Меню навигации по разделу
сайта (опционально)]
Содержательная часть
(Контент)
Нижний заголовок
[Copyrights и контактные данные]
При описании такой страницы в рамках предложенной модели возможны два подхода:
 Меню навигации раздела формируется контентным сервером.
В этом случае разбивка тривиальна: все три части могут быть реализованы с помощью трех
независимых открытых таблиц;
112
 Меню навигации раздела формируется разрабатываемым сервером.
В этом случае используется одна общая таблица, начало которой открывается в верхнем
заголовке, а закрывается в нижнем. Приведем фрагменты HTML-кода.
Фрагмент секции <body> верхнего заголовка:
<TABLE><TR><TD COLSPAN=’2’>Верхний заголовок
</TD></TR><TR><TD>
Фрагмент секции <body> контента:
Содержательная часть (контент)
Фрагмент секции <body> нижнего заголовка:
<TD></TR><TR><TD COLSPAN=’2’>Нижний заголовок
</TD></TR><TABLE>
Выбор конкретного подхода будет зависеть от того, каким именно способом удобней представить
переносимый раздел.
Заключение
При разработке новых Web-сайтов техническая реализация повторного использования материалов,
расположенных на других сайтах одной организации, является актуальной задачей. Предложенное в
настоящей статье решение с использованием интегрирующего прокси-сервера позволяет значительно
упростить решение поставленной задачи. Хотя в некоторых случаях нельзя обойтись без модификации
скриптов на исходных серверах, можно минимизировать такие изменения. При этом задачи повторной
реализации разделов и преобразования данных снимаются. Практически интегрирующий прокси-сервер
был применен в рамках портала “Российское образование”. Накопленный опыт позволяет рекомендовать
описанный подход для решения аналогичных задач.
Литература
1.
2.
3.
4.
5.
6.
HyperText Markup Language (HTML). // http://www.w3.org/MarkUp/
Extensible Markup Language (XML). // http://www.w3.org/XML/
XML Linking Language (Xlink). // http://www.w3.org/XML/Linking
Apache HTTP Server Version 1.3. // http://httpd.apache.org/docs/
Портал “Российское образование”. // http://www.edu.ru/
The Apache Software License, Version 1.1 // http://www.apache.org/LICENSE.txt
СИСТЕМА УПРАВЛЕНИЯ САЙТОМ IPHPORTAL
В.П.Носов
Государственный научно-исследовательский институт информационных
технологий и телекоммуникаций "Информика", Москва
Тел.: (095) 237-57-52, e-mail: [email protected]
Система управления динамическим сайтом iPHPortal™ (http://phportal.informika.ru) представляет
дистрибутивный набор (оболочку) для создания информационных динамических сайтов и порталов
образовательного профиля. В состав дистрибутива входит набор PHP-скриптов и утилит,
функционирующих вместе со свободно распространяемыми продуктами Apache, PHP, MySQL,
mnoGoSearch в среде UNIX (Linux, FreeBSD) или Microsoft Windows Me/2000/XP. Система относится к
классу свободно распространяемого программного обеспечения c открытым исходным кодом.
Возможности системы
iPHPortal включает ядро, реализующее базовый набор функциональных возможностей, и
подключаемые
модули,
реализующие
дополнительные
функциональные
возможности.
Пользовательский интерфейс системы реализуется с использованием шаблонов.
Важной особенностью является возможность формирования библиотеки дополнительных
функциональных модулей, взаимодействующих с ядром системы по определенным интерфейсам. В
составе системы имеются утилиты, обеспечивающие возможность выгрузки и подключения
библиотечных модулей. При этом библиотечные модули хранятся в виде XML-файлов, архивированных
в формате ZIP. Каждый модуль реализует определенную функциональность, административный
(редакторский) и пользовательский интерфейс с соответствующим набором шаблонов для
формирования HTML-страниц.
Основные возможности:
 создание и редактирование групп пользователей, назначение прав для групп пользователей;
 аутентификация пользователей;
 формирование и редактирование иерархической системы рубрик (разделов) сайта;
 формирование и редактирование одностраничных и многостраничных гипертекстовых материалов
в HTML-формате (книги, статьи, новости, вопросы и ответы) c помощью визуального или
113
текстового редактора, передача на сервер (upload) сопутствующих файлов (иллюстрации,
документы и т.п.), автоматическое и интерактивное формирование атрибутов материалов (дата,
автор, название, анонс, сопутствующие файлы иллюстраций, отнесение к рубрикам, позиции
рубрикаторов и т.д.);
 администрирование и редактирование интерактивов (отзывы, голосования, гостевые книги);
 формирование статических страниц материалов по контенту и шаблонам; выгрузка и загрузка
дополнительных модулей.
Архитектура системы
В системе сайт представляется в виде дерева рубрик, при создании рубрики информация о ней
записывается в БД и создается директория на веб-сервере. Затем в этой рубрике можно разместить
материалы или модули (пользуясь административным интерфейсом), либо скопировать туда сторонние
скрипты. Для ускорения работы системы используется “блочное” кэширование.
”Блочное” кэширование заключается в том, что при каждом обращении страница сайта собирается
динамически из статических и динамических фрагментов. Материал предгенерируется в файл на
сервере, в котором блоки собираются и выводятся пользователю. В докладе рассмотрены принципы
кэширования, применяющиеся в других CMS.
Такой принцип кэширования позволяет снизить нагрузку на сервер и уменьшить время отклика.
Количество и организация блоков на странице зависит от шаблона, по которому генерируется материал
и может изменяться в зависимости от дизайна сайта.
Модули системы
Система имеет модульную структуру. Модуль представляет собой код, предназначенный для работы
с определенной сущностью. Модуль может использоваться в каком-то одном разделе (модуль “Каталог
образовательных ресурсов”) или в нескольких разделах (модуль “Форумы” может быть размещен в
нескольких разделах).
Модуль поставляется в виде одного XML-файла, файл создается автоматически при
“экспортировании” модуля. В XML-файл прописываются не только описания других файлов (классов,
обработчиков, шаблонов и т.д.), но и содержание файлов, закодированное в формате base64. Затем этот
файл автоматически архивируется для уменьшения размера. Модульная структура позволяет создать
библиотеку модулей для использования на сайтах системы образовательных порталов. Наличие готовых
решений позволяет значительно снизить время и затраты на создание новых сайтов.
Разделение внешнего представления и логики работы модуля реализуется c использованием
паттерна Model-View-Controller. Суть этого паттерна состоит в том, чтобы отделить представление
данных от доступа к ним. В паттерне выделяются три части системы: model (модель), являющаяся
абстрактным хранилищем данных, view (представление) – абстрактный способ отображения
информации клиенту и controller (контроллер) – часть, реализующая взаимодействие между моделью и
представлением (бизнес-логику).
Отражение специфики образовательного портала в iPHPortal
Неотъемлемым компонентом обеспечения современной образовательной системы являются
информационные ресурсы (ИР). Каталог ИР и служба каталогизации относятся к ключевым компонентам
образовательного портала.
Совокупность центрального образовательного портала и всех образовательных профильных
порталов будем называть федеральным образовательным порталом (ФОП) или просто
образовательным порталом. Разработанная система предназначена для развертывания профильных
порталов и важным ее качеством является возможность интеграции с центральным порталом.
Реализованы механизмы интеграции с центральным порталом посредством экспорта мета описаний
каталога информационно-образовательных ресурсов и экспорта новостей посредством RSS (Really
Simple Syndication).
АРХИВ НОРМАТИВНЫХ ДОКУМЕНТОВ МИНИСТЕРСТВА ОБРАЗОВАНИЯ
РОССИЙСКОЙ ФЕДЕРАЦИИ
М.В.Булгаков, С.В.Кудрявцев
Государственный научно-исследовательский институт информационных
технологий и телекоммуникаций "Информика", Москва
Тел.: (095) 237-56-13, 237-57-52, 237-57-73, факс: (095) 237-28-33, e-mail:
[email protected]
Задача формирования архива нормативных документов состояла в создании системы хранения
документов, позволяющей осуществлять быстрый атрибутно-контекстный поиск в тексте документа, а
также поиск по определенным реквизитам. Одной из особенностей задачи являлось то, что хранилище
документов и система поиска должны были размещаться на разных серверах. Еще одна особенность это
то, что помещение документов в архив и подключение их к системе поиска должны быть независимыми
114
друг от друга. Доступ пользователей к архиву должен осуществляться через два сайта: сайт
Министерства образования и «Российский образовательный портал».
Основным сервером, на котором размещается система поиска, стал сервер «Российского
образовательного портала». В связи с этим, инструментарием решения данной задачи выбраны
средства разработки данного портала, это интерпретатор PHP и СУБД MySQL. Хранилищем документов
на момент создания системы уже был сервер на базе ОС MS Windows 2000, MS IIS. Инструментарием
обработки со стороны сервера хранения выбран интерпретатор Perl.
Документы в архиве представлены в формате HTML. Помимо документов, в архиве содержатся
приложения к ним. Приложения могут быть в формате HTML, MS Word, MS Excel. Каждый документ и
приложение описаны с помощью нескольких реквизитов.
Реквизиты, описывающие документ:
 номер документа;
 тип документа (приказ, инструктивное письмо и т.д.);
 список номеров разделов, к которым относится документ;
 законодательный орган принявший документ;
 дата принятия документа законодательным органом;
 название документа.
Реквизиты, описывающие приложение:
 номер приложения;
 название приложения;
 номер документа, к которому оно относится;
 дата принятия документа, к которому относится приложение.
Для соответствия формату HTML каждый реквизит обозначен meta-тэгом. Для описания документов
в формате MS Word и MS Excel используется файл описания в формате HTML, который в свою очередь
содержит ссылку на приложение и реквизиты в виде meta-тэгов. В базе данных документы и приложения
содержатся в одной таблице, где документ от приложения отличается наличием записей в полях «номер
приложения» и «название приложения».
Система атрибутно-контекстного поиска осуществляет выбор имен файлов, содержащих документы,
которые соответствуют атрибутам, указанным в форме поиска. Наряду с реквизитами документа, в базе
хранятся тексты документов, приведенные к «нормализованному» виду. При указании в форме поиска
набора слов, которые должны содержаться в нужном тексте, формируется SQL-запрос, осуществляющий
выборку документов. При этом выбираются документы, содержащие любое слово из данного набора. В
запрос входят слова из формы, обработанные функцией «нормализации», что позволяет вести поиск,
невзирая на склонение и падеж.
Рассмотрим технологию подготовки и размещения документов в электронном архиве. Процесс
происходит в два этапа. На первом этапе редактор размещает документы на сервере-хранилище,
осуществляется это по протоколу ftp. Затем редактор с помощью формы в интерфейсе администратора
на сервере Российского образовательного портала дает команду серверу обновить базу данных. По
команде запускается программа обновления, которая обращается к скрипту, размещенному на серверехранилище, для того чтобы он произвел аудит документов и выдал список всех документов, начиная с
даты последнего обновления. После этого программа сверяет список хранилища с данными в своей
базе, если файл в базе не найден, то происходит считывание его с сервера-хранилища по протоколу http
и занесение реквизитов в базу. Как уже упоминалось ранее, в базу помимо реквизитов заносится и текст
документа, обработанный функцией «нормализации».
ПРИНЦИПЫ ПОСТРОЕНИЯ МЕХАНИЗМА ПОИСКА ОБРАЗОВАТЕЛЬНЫХ
РЕСУРСОВ НА ОБРАЗОВАТЕЛЬНЫХ САЙТАХ
Т.Л.Седова
Государственный научно-исследовательский институт информационных
технологий и телекоммуникаций «Информика», Москва
Тел.: (095) 229-45-34, e-mail: [email protected]
Сегодня в России востребованность в образовании очень высока. Отечественная система
образования – многоступенчатая, она делится на следующие уровни:
 дошкольное образование;
 общее образование;
 высшее образование;
 послевузовское образование;
 дополнительное образование.
Сейчас с развитием Интернета, каждый человек может выбрать себе нужную ступень образования
не выходя из дома, но для этого нужно, чтобы образовательные интернет-ресурсы были хорошо
освещены, чтобы пользователь тратил как можно меньше времени на поиск нужного ресурса.
115
Образовательные ресурсы можно найти посредством самых распространенных в России поисковых
машин: Rambler, Яндекс, Апорт, Google и др., а также можно выйти на портал «Российское образование»
и, задав определенные фильтры для нахождения нужной информации, начать поиск.
Каждый i-й образовательный портал (i=1, 2, . . . , m) можно характеризовать множеством
покрываемых им предметных областей M(i), причем о качестве отображения j-й предметной области в
первом приближении можно судить по объему K(i, j) соответствующей ей информации.
Если всё множество предметных областей образовательных порталов обозначить N, то каждому
такому порталу можно поставить в соответствие точку в n-мерном пространстве (n=N), причем число
ненулевых компонентов i-го портала равно M(i), а расстояние соответствующей ему точки от начала
координат равно L(i):
i n
K
L(i) 
2
(i)
(1)
i 1
Пусть индексу d соответствует некий фиктивный портал, характеристики которого K(d, j) определены
следующим образом:
j , K (d , j )  max K (i, j )
(2)
i
Так как такой портал в рамках принятых допущений можно считать идеальным, качество остальных
порталов можно определить, как расстояние S(i, d), (i=1, 2, . . . , m) между соответствующими им точками
в n-мерном пространстве и точкой с координатами K(d, j), j = 1, 2, . . . n :
S (i, d ) 
n
[ K (i, j)  K (d , j)]
2
(3)
i 1
K(i,3)
L(i)
K(i,1)
K(i,2)
Рис. 1. Величина n = 3
Очевидно, что i-й портал тем «лучше», чем меньше величина S(i, d) (рис. 2).
116
j =3
i
S(i,d)
d
j =1
j =2
Рис. 2. Расстояние S(i,d) определяет качество портала,
соответствующего точке i
Можно показать, что оптимальной стратегии просмотра порталов отвечает последовательность, в
которой первыми просматриваются наиболее перспективные порталы. В рамках принятых допущений им
соответствуют порталы, для которых расстояние, определяемое выражением (3), минимально. Таким
образом, поиск оптимальной стратегии анализа порталов соответствует определению перестановки  =
(i1 , i2 ,.......im ) , для которой справедливо:  j < k:
S (i j , d )  S (ik , d )
(4)
Поскольку поиск перестановки, удовлетворяющей условию (4), не вызывает затруднений,
предложенный выше подход представляется достаточно конструктивным.
Литература
1. Н.Г.Загоруйко. Прикладные методы анализа данных и знаний. Новосибирск, 1999.
СПЕЦИФИКА ОРГАНИЗАЦИИ ПОИСКА ИНФОРМАЦИИ ПО БОЛЬШИМ
КОЛЛЕКЦИЯМ ДОКУМЕНТОВ. ПОИСКОВАЯ СИСТЕМА AIYA
Г.В.Репин, А.И.Федосеев
Государственный НИИ информационных технологий и телекоммуникаций
"Информика", Москва
Тел.: (095) 954-17-75, e-mail: [email protected]
Основная идея. Для поиска по большому числу документов требуются специализированные
высокопроизводительные решения. Доступных систем такого класса существует мало. Здесь
рассматриваются основные компоненты такой системы.
Современное развитие сети Интернет характеризуется резким ростом объема представленной в
сети информации. Это усложняет поиск информации с использованием глобальных поисковых систем
(ввиду редкого и несвоевременного обновления, отсутствия структурирования и т.п.). Возникает
необходимость в построении специализированного решения для поиска по большому объёму данных в
пределах рассматриваемой информационной системы.
Стандартным решением является использование баз данных в качестве структурированного
информационного хранилища. Но предоставляемые БД средства поиска являются неэффективными для
операций над большим числом документов. Как правило, для повышения производительности подобных
систем используют "железные" решения: увеличение мощности и числа серверов, балансировка
нагрузки и т.п. Очевидным недостатком подобного подхода является необходимость регулярного
обновления имеющегося аппаратного обеспечения, что влечёт за собой высокие эксплуатационные
затраты.
Другим
подходом
является
создание
специализированного
программного
решения,
обеспечивающего должную производительность поиска и индексирования информации портала.
117
Использование подобных систем обеспечивает, при тех же аппаратных средствах, более высокую
производительность и масштабируемость, что достигается за счёт реализации специальных
оптимизированных алгоритмических решений.
В качестве примера будем рассматривать поисковую систему Aiya, созданную для решения
подобных задач.
Поисковую систему можно условно разделить на две части: индексирующую и непосредственно
поисковую. Первая служит для организации внутреннего представления данных с целью обеспечения
наиболее эффективного поиска по ним. Вторая обрабатывает поисковые запросы и осуществляет
соответствующую выборку документов. Обе используют набор базовых компонентов, таких как
хранилище индексированных документов, морфологический модуль, модуль подсчёта релевантности,
парсеры различных форматов исходных данных.
Очевидно, что при работе с большими объёмами информации необходимо обеспечить высокую
скорость не только поиска, но и индексации для своевременного обновления поисковой базы. При этом
требуется соблюсти баланс между скоростью работы процедур вставки и извлечения данных. Подобным
требованиям удовлетворяют такие алгоритмы и структуры данных, как инвертированные файлы с
использованием B-деревьев для хранения индекса и параллельная обработка поисковых запросов и
индексации. Для обеспечения высокой скорости и качества обработки документов в системе Aiya
используются также модели на базе конечных автоматов и частичный семантический анализ на основе
формальной логики.
Aiya является полнофункциональным решением для организации поиска в рамках портала или
сайта. Интерфейсная часть системы представлена в виде web-сервера, позволяющего осуществлять
поиск и управление процедурой индексации. Существует возможность формировать запросы и получать
результаты в виде XML-документов, которые, по желанию пользователя, при помощи технологии XSLT
могут быть преобразованы к любому формату представления данных. Это позволяет произвести лёгкую
интеграцию поисковой системы в инфраструктуру существующих web-решений.
Для реализации системы был выбран язык Java, зарекомендовавший себя как эффективное
средство создания серьёзных web-решений.
В заключение стоит отметить, что построение поисковых решений подобного уровня – непростая
задача, требующая соблюдения баланса между качеством поиска, лёгкостью интеграции, стоимостью
эксплуатации и удобством интерфейса. Такой баланс и призвана обеспечить поисковая система Aiya,
что будет продемонстрировано в сравнительном анализе с другими как свободно распространяемыми,
так и коммерческими решениями в этой области.
Литература
1. Thomas H. Cormen, Charles E. Leiserson and Ronald L. Rivest Introduction to Algorithms.
2. Валиков А.Н. Технология XSLT. – СПб.: БХВ-Петербург, 2002. – 522 с.
3. Кнут Дональд Эрвин. Искусство программирования, т.3. – М.: Издательский дом "Вильямс", 2000. –
832 с.
4. Современный русский язык: Учебник для филол. спец. высших учебных заведений. – М.:
Азбуковик, 1997. – 928 с.
5. Чень Ч., Ли Р. Математическая логика и автоматическое доказательство теорем. – М.:Наука, 1983.
– 360 с.
СТАТИСТИЧЕСКИЙ АНАЛИЗ СЕТЕВОГО ТРАФИКА С ИСПОЛЬЗОВАНИЕМ
ВЕЙВЛЕТ-ФУНКЦИЙ
В.Г.Домрачев, И.В.Ретинская, Э.В.Калинина, Д.С.Безрукавный, Ю.В.Гугель*
Государственный научно-исследовательский институт информационных
технологий и телекоммуникаций «Информика», Москва
*)Санкт-Петербургский филиал Государственного научно-исследовательского
института информационных технологий и телекоммуникаций «Информика»
Тел.: (095) 588-96-57, email: [email protected]
Для решения одной из задач сетевого администрирования – мониторинга компьютерного
оборудования магистральных сетей, необходимо проводить исследования сетевого трафика с целью
выявления аномального поведения (сбоев в работе) системы.
Информация о сетевом трафике имеет статистический характер и представляет собой временные
последовательности. Таким образом, речь идёт о статистическом анализе сетевого трафика как анализе
временных рядов, а анализируемая статистика может быть как текущей (с интервалом усреднения
информации от одной до десятков секунд), так и долговременной (с интервалом усреднения
информации от минут до нескольких часов или суток).
Одной из составляющих классической модели сетевого ряда является периодическая составляющая
гармонического типа, которая может быть описана конечным рядом Фурье, построенным по
экспериментальным данным [1]. В качестве альтернативы Фурье-анализу может использоваться
118
вейвлет-анализ [2] (анализ с помощью вейвлет-функций), позволяет узнать не только частотные
характеристики ряда, но и локальные выбросы.
Различают дискретный и непрерывный вейвлет-анализ, аппарат которых можно применять как для
непрерывных, так и для дискретных сигналов.
В общем случае вейвлет-преобразование функции f(t) выглядит так:

W ( x, s) 
1
t  x
 *
 f (t )dt

s 
 s 
где t – ось времени, x – момент времени, s – параметр, обратный частоте, а (*) – означает
комплексно-сопряженное. Вейвлет-функция обычно обозначается буквой ψ.
Вейвлет-функция, которая используется для преобразования исходного временного ряда, должна
удовлетворять двум условиям:
 среднее значение (интеграл по всей прямой) равен нулю;
 функция быстро убывает при t  0.
Наиболее часто встречающиеся вейвлет-функции – вейвлет Хаара, самый простой из используемых
вейвлетов, и вейвлет «сомбреро» (Mexican Hat), названный так благодаря своему внешнему виду.
В докладе рассмотрены результаты проведённых исследований сетевого трафика, которые
показали, что достоинства вейвлет-анализа проявляются особенно сильно, когда исходный ряд сильно
зашумлён.
При этом обработка результата вейвлет-анализа в виде графического изображения позволяет
отсечь все шумы. А последующее обратное вейвлет-преобразование показывает процессы, которые в
оригинальном ряде невозможно было наблюдать.
Работа выполняется при поддержке гранта РФФИ 02-07-90026.
Литература
1. Кендалл М. Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. М.: Наука,
1976.
2. Н.М.Астафьева. «Вейвлет-анализ: основы теории и примеры применения» М.: Наука,1996.
К РАЗВИТИЮ ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ РЕСУРСОВ И
ВЫЧИСЛЕНИЙ В НАУЧНО-ОБРАЗОВАТЕЛЬНОЙ СРЕДЕ
А.Н.Тихонов, А.К.Скуратов, В.Г.Домрачев, И.В.Ретинская
ГНИИ ИТТ «Информика», Москва
Параллельные вычисления являются современной и эффективной технологией научных
исследований, создания сложной техники и управления многомерными процессами в жизни общества.
Передовые страны мира продолжают энергично развивать это направление, предоставляя
пользователям все более высокие вычислительные, информационные и телекоммуникационные
возможности.
В нашей стране развитие высокопроизводительных вычислений в научно-образовательной среде
идет в тех же направлениях, но в существенно меньшем масштабе. На недостаточность
организационной и материальной поддержки этого направления многократно указывали специалисты на
всех научных конференциях и совещаниях, например, на последней общероссийской конференции по
параллельным вычислениям в Ижевске в конце 2003 г.
Представляется целесообразным, учитывая имеющуюся и развивающуюся кооперацию вузов и
научных и промышленных предприятий в стране в решении задач на основе технологии параллельных
вычислений, создать соответствующую Межведомственную научную программу в рамках Минпромнауки
и Минобразования России.
Основными задачами программы, как показывает анализ мнений многих специалистов,
целесообразно определить:
 развитие отечественной вычислительной среды высокопроизводительных вычислений в связи с
мировыми тенденциями и новыми техническими решениями;
 развитие телекоммуникационной связности вычислительной среды и обеспечение удаленного
доступа к вычислительным ресурсам;
 организация и проведение фундаментальных и прикладных исследований, требующих
параллельных вычислений, как базы для развития телекоммуникационной среды
высокопроизводительных вычислений, компьютерного параллельного моделирования и
подготовки и переподготовки кадров;
 организация и совершенствование подготовки и переподготовки специалистов по
высокопроизводительным вычислительным и телекоммуникационным средам, моделированию и
программированию в этих средах;
119
 мониторинг состояния и развития технологии высокопроизводительных вычислений и
формирование стратегии перманентного совершенствования программы в условиях высокой
динамики развития параллельных вычислений в мире.
Более конкретный перечень задач, которые целесообразно решать в рамках реализации названной
программы, может быть следующим:
 анализ потребностей вузовской науки в технологии параллельных вычислений;
 анализ развития технологии параллельных вычислений в научной и промышленной отраслях
страны;
 анализ мировых тенденций решения проблемы параллельных вычислений;
 развитие вычислительной базы высокопроизводительных вычислений в связи с мировыми
тенденциями и новыми техническими решениями;
 развитие телекоммуникационной связности вычислительной среды и обеспечение удаленного
доступа к вычислительным ресурсам;
 организация и проведение конкретных исследований, требующих параллельных вычислений,
например, в среде компьютерных технологий инженерного анализа, как базы для развития
телекоммуникационной среды высокопроизводительных вычислений, компьютерного
параллельного моделирования и подготовки и переподготовки кадров;
 создание библиотеки стандартных программ для решения различных классов задач, например,
линейной алгебры, решения систем нелинейных уравнений, поиска экстремумов функций многих
переменных, решения уравнений математической физики (2 и 3-мерные нестационарные
параболические и гиперболические уравнения, многомерные эллиптические уравнения),
статистики, методов вычисления интегралов по траекториям, молекулярной динамики,
стандартных методов Монте-Карло и других, а также приобретение необходимых зарубежных
программных пакетов по параллельным вычисления общего пользования;
 создание кластерной российской системы визуализации результатов, дешевой относительно
зарубежных систем и обладающей не меньшими возможностями;
 разработка системы обеспечения качества и альтернативного выбора аппаратных и программных
решений при создании интегрированной среды высокопроизводительных вычислений;
 создание комплекса нормативных документов, определяющих основные аспекты развития
параллельных вычислений в научно-образовательной среде во взаимосвязи с развитием других
компьютерных технологий;
 разработка технических и программных средств для создания из наличных ресурсов виртуальной
распределенной компьютерной системы (метакомпьютинг);
 организация и совершенствование системы подготовки и переподготовки специалистов по
высокопроизводительным вычислительным и телекоммуникационным средам, моделированию и
программированию в этих средах;
 организация подготовки, повышения квалификации и сертификации преподавательского корпуса
для реализации системы подготовки специалистов по высокопроизводительным вычислениям;
 планирование, координация и поддержка изданий научных, учебно-методических и учебных
материалов;
 мониторинг состояния и развития технологии высокопроизводительных вычислений и
формирование стратегии перманентного совершенствования этой технологии в условиях
постоянно возрастающих к ней требований;
 проведение маркетинговой и агитационной кампаний по целесообразности использования
технологии параллельных вычислений в народном хозяйстве;
 организация и проведение научно-технических конференций, семинаров, совещаний и круглых
столов по высокопроизводительным вычислениям;
 создание и поддержка информационно-справочного центра по всему спектру проблемы
высокопроизводительных вычислений;
 разработка стратегии и осуществление конкретных мероприятий по интеграции вузовской,
академической и отраслевой науки в области высокопроизводительных вычислений в стране;
 оценка эффективности выполнения вышеназванной программы и корректировка ее
стратегической направленности на каждом новом этапе;
 повышение роли специалистов научно-образовательной среды в реализации целевых отраслевых
программ в различных областях – программы моделирования проблем нефтегазового комплекса,
добычи ископаемых, геоинформационных региональных систем, прогнозирования климата,
моделирования электронных устройств, перспективных компьютеров, информационных систем
народонаселения, решения экологических и техногенных катастроф, решения проблем, связанных
с обороноспособностью страны, и многих других.
 формирование предложений по кооперации с другими заинтересованными отраслями страны в
развитии высокопроизводительных вычислений;
В заключение подчеркнем, что обсуждаемая программа ставит своей главной задачей вывести
технологию высокопроизводительных вычислений в научно-образовательной среде на современный
уровень и далее этот уровень поддерживать. Весь комплекс исследований с применением этой
технологии в каждой конкретной предметной области должен финансироваться из других источников.
120
МНОГОКРИТЕРИАЛЬНЫЙ АНАЛИЗ ВЫБОРА НАПРАВЛЕНИЯ
ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ
В.Г.Домрачев, И.А.Полещук, О.М.Полещук, И.В.Ретинская
ГНИИ ИТТ «Информика», Московский государственный университет леса
Тел.: (095) 229-45-34, e-mail: [email protected]
Одной из важнейших задач профессионального отбора является задача выявления кандидатов,
которые по уровню подготовки в рамках учебных дисциплин, а также по уровню развития личностных
качеств и познавательных психических процессов смогут в установленные сроки освоить конкретную
специальность и в дальнейшем эффективно выполнять свои профессиональные обязанности.
Решение этой задачи непосредственно связано с выбором представления (формализации) нечетких
данных процедур оценивания, определения на их основе рейтинговых оценок и ранжирований с учетом
нечетких предпочтений, например, типа «довольно важны показатели успеваемости, очень важны
интеллектуальные показатели и довольно неважны характерологические показатели».
Существенную роль играет выявление существенных показателей, влияющих на успешность
профессиональной деятельности выпускников [2]. Исследования на основе реальных данных (в рамках
конкретных специальностей) позволили выделить в качестве существенных показателей показатели
успеваемости, общих интеллектуальных способностей и характерологических особенностей.
Рассмотрим четыре направления профессиональной деятельности выпускников вуза, для которых
сформулированы следующие нечеткие требования.
X1
– Очень важны показатели успеваемости, очень важны показатели интеллекта и совсем
неважны характерологические показатели.
X2
– Не очень важны показатели успеваемости, довольно важны показатели интеллекта и очень
важны характерологические показатели.
X3
– Довольно неважны показатели успеваемости, важны показатели интеллекта и довольно
неважны характерологические показатели.
X4
– Совсем неважны показатели успеваемости, довольно важны показатели интеллекта и важны
характерологические показатели.
Воспользуемся построенными в [1] функциями принадлежности
l x , l  1,6
соответственно
лингвистических термов «совсем неважный», «довольно неважный», «не очень важный», «довольно
важный», «важный», «очень важный» относительных коэффициентов важности критериев:
1  x   0, 0, 0.2 , 2  x   0.2, 0.2, 0.2 ,
3  x   0.4, 0.2, 0.2 , 4  x   0.6, 0.2, 0.2 ,
5  x   0.8, 0.2, 0.2 , 6  x   1, 0.2, 0.
и

Обозначим функции принадлежности нечетких рейтинговых оценок успеваемости, интеллектуальных
характерологических
особенностей
[3]
пяти
выпускников
соответственно
через
1
2
3
j x , j x , j x , j  1,5 . Параметры этих функций занесены в таблицу 1.
     
Табл. 1. Параметры функций принадлежности рейтинговых оценок
2
3
4
5
0.487
0.519
0.674
0.709
x , j  1,5
0.568
0.686
0.747
0.839
0.109
0.106
0.088
0.132
0.058
0.113
0.128
0.145
0.271
0.341
0.498
0.613
2
0.342
0.396
0.539
0.698
j x , j  1,5
0.0 94
0.029
0.126
0.115
0.126
0.095
0.103
0.118
0.468
0.602
0.732
0.635
3
0.488
0.625
0.768
0.687
j x , j  1,5
0.112
0.109
0.096
0.116
0.142
0.134
0.094
0.211
Используя
метод
определим
функции
принадлежности
~i
I x , j  1,5, i  1,4 нечетких оценок пяти выпускников R j , j  1,5, i  1,4 в рамках четырех
R


J
 
1
j
 

 

 
1
0.426
0.532
0.113
0.097
0.312
0.376
0.114
0.204
0.574
0.598
0.104
0.136
ранжирования
[4],
сформулированных нечетких предпочтений следующим образом:
121
 R1  x   6  x    1j  x   6  x    2j  x   1  x    3j  x  ,
j
 R 2  x   3  x    1j  x   4  x    2j  x   6  x    3j  x  ,
j
 R 3  x   2  x    1j  x   5  x    2j  x   2  x    3j  x  ,
j
 R 4  x   1  x    1j  x   4  x    2j  x   5  x    3j  x , j  1,5
j
Сравним результаты пяти выпускников на основе
I i , i  1,4 ,
множества
принадлежности
заданные
~i , j  1,5, i  1,4 .
R
j
на множестве индексов
1, 2, 3, 4, 5.
Определим нечеткие
Значения функций
 I i  j  этих множеств интерпретируются как характеристики степени доминирования
j -го выпускника в рамках нечетких предпочтений X i , i  1,4, j  1,5 или характеристики степени
того, насколько
j -ый выпускник считается лучшим в рамках нечетких предпочтений
X i , i  1,4, j  1,5 .
k -ый выпускник считается лучшим в рамках нечеткого предпочтения X i с характеристикой 1, если
~ i  x  . Значения   j  при j  k вычисляются следующим
sup x :   x   1 принадлежит R
R ij
k
Ii
образом:
 I i  j   max min  R i x ,  R i x  .
k
x
 j

Характеристики  i  j  , j  1,5, i  1,4 занесены в таблицу 2.
I
Табл. 2. Характеристики степени доминирования выпускников по нечетким предпочтениям
1
2
3
4
1
0.53
0.61
0.77
0.79
2
0.45
0.76
0.68
0.66
3
0.73
0.85
0.82
0.83
4
0.96
1
1
1
5
1
1
0.98
1
На основании проведенного анализа выпускнику № 1 может быть рекомендовано распределение
X 4 , выпускнику № 2 рекомендовано распределение X 2 , выпускнику № 3 распределение X 2 , а
выпускникам № 4 и № 5 могут быть рекомендованы все распределения.
Таким образом, получено решение задачи профессионального отбора выпускников вуза на основе
различных показателей с учетом нечетких предпочтений.
Литература
1. Борисов А.Н., Крумберг О.А., Федоров И.П. Принятие решений на основе нечетких моделей:
Примеры использования. – Рига.: Зинатне, 1990. – 184 с.
2. Домрачев В.Г., Полещук О.М., Ретинская И.В. О выявлении существенных показателей, влияющих
на успешность профессиональной деятельности выпускников // Первая научная конференция «Качество.
Инновации. Образование». Материалы конференции. Судак, 2003. – С. 79-80.
3. Полещук О.М. О построении рейтинговых оценок на основе лингвистических переменных //
Вестник Московского государственного университета леса – Лесной вестник. – 2003. – №3 (28). – С. 169177.
4. Baas S.M., Kwakernaak H. Rating and ranking of multiple-aspect alternative using fuzzy sets //
Automatica. – 1977. – V. 3. - № 1. – P. 47-58.
122
УДАЛЕННЫЙ ПОИСК И ВВОД ДАННЫХ В РАМКАХ НАВИГАЦИОННОЙ
СИСТЕМЫ ПО ИНФОРМАЦИОННЫМ РЕСУРСАМ ГОСУДАРСТВЕННОЙ
СИСТЕМЫ НАУЧНО-ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ
М.Ю.Кузнецов
Государственный научно-исследовательский институт информационных
технологий и телекоммуникаций «Информика», Москва
Тел.: (095) 229-95-69, e-mail: [email protected]
Задача разрабатываемой системы – обеспечение мониторинга и эффективной навигации
пользователей в информационном пространстве российских информационных ресурсов (ИР) научнотехнического профиля. Изначально организационная структура системы предполагает создание
выделенных центров по ведомственному и региональному принципу. Поэтому задача удаленного
доступа становится основной.
Система должна обеспечивать выполнение следующих функций:
 сбор, ввод, хранение и поддержка в актуальном состоянии данных об ИР;
 сбор, ввод, хранение и поддержка в актуальном состоянии данных о субъектах научнотехнической деятельности (НТД);
 навигация и поиск информации в пространстве ИР;
 администрирование базы метаданных ИР;
 статистическая обработка данных об ИР и генерация отчетов;
В соответствии с функциями, программное обеспечение системы можно разбить на следующие
подсистемы: подсистема ввода, хранения, анализа, вывода информации, подсистема персонификации и
сбора статистики.
Подсистема ввода должна обеспечивать:
 интерактивный ввод и редактирование данных с использованием стандартных интернетбраузеров;
 полуавтоматический ввод из файлов стандарта XML;
 пакетный ввод данных из файлов формата XML.
Отражению в системе подлежат как объекты ИР (в виде баз данных, веб-сайтов и т.д.), так и
субъекты НИР – организации и физические лица.
К подсистеме ввода предъявляется требования проверки и обеспечения целостности
представляемых данных. Кроме того, к данной подсистеме предъявляются требование поддержки
статистических и динамических списков (например, регионов, населенных пунктов и вышестоящих
организаций).
Основой представления данных (на уровне хранения данных, а также для импорта и экспорта)
является единый формат описания ИР. Данный формат создан на основе XML и базируется на
международном стандарте описания ресурсов DUBLIN CORE.
Пакетный ввод XML предназначен для ввода значительных объемов данных в систему. Это может
использоваться для взаимодействия с существующими порталами и навигационными системами. В
состав пакета входят три файла – список описаний персон, организаций и ресурсов, со ссылками с
элемента одного списка на элемент другого.
В зависимости от уровня доступа пользователя, вводимые данные могут помещаться либо
напрямую в базу данных системы, либо во временный буфер. Временный буфер имеет несколько
разделов, разделение осуществляется условно, по ведомственному принципу. К конкретному разделу
прикрепляется «ответственная» организация из числа тех, кто участвует в разработке проекта.
Пользователь, имеющий уровень доступа «редактор раздела» могут оперировать только с данными
своего раздела. Такая организация предусматривает также и уровень редактора системы, имеющего
доступ во все разделы буфера. Как только карточка ИР (субъекта НТД) заносится в базу данных (или
изменяется уже существующая карточка) система обеспечивает автоматическую индексацию полей
карточки. В индексный файл заносятся нормальные формы слов, имена полей, в которых встретилось
слово, частота вхождения слова и другая необходимая для осуществления поиска информация. С
определенной периодичностью составляется список описаний, нуждающихся в актуализации.
Модуль поиска и навигации – основной модуль системы. Модуль предусматривает следующие виды
поиска:
 тематический (по графу каталога);
 атрибутный по текстовым полям;
 атрибутный по нормированным полям;
 полнотекстовый по содержимому ИР;
 комбинированный.
При поиске необходимо учитывать морфологию русского языка.
Доступ к системе может быть осуществлен не только посредством браузера. Все данные могут быть
выданы в XML-реализации формата DUBLIN-CORE. Кроме того, в связи с бурным развитием P2P
соединений, а также технологии WebServices имеется возможность получить результаты поиска в
формате XML-RPC. Также предполагается создание элементарных Web-сервисов для получения
123
результатов поиска, а также возможно включение системы в некую образовательную DATA GRID с
применением архитектуры JXTA.
Главная составная часть системы – модуль каталога. Данный модуль реализован в виде
поддеревьев, которые объединены в одну псевдовершину. Данное построение позволяет
идентифицировать атрибуты ИР с узлами дерева. Это позволяет обеспечить расширяемость системы, а
также функциональную полноту описания ИР. В существующем каталоге поддеревьями являются:
рубрикатор ГРНТИ, административно – территориальное деление, атрибуты ИР и организаций.
Модуль персонификации – разбиение пользователей на группы по уровню доступа, а также
настройка работы системы (в том числе и интерфейса) на конкретного пользователя. По уровню доступа
выделяются следующие уровни доступа:
 Незарегистрированный пользователь – обычный пользователь системы – ограниченные права по
поиску и невозможность ввода.
 Зарегистрированный пользователь – возможность ввода информации об тех ИР и организациях, в
которых фигурирует (в качестве, например, автора ИР или директора организации) данный
пользователь во временный буфер системы.
 Редактор. Имеет возможность заносить любые данные. Редактирует раздел временного буфера
системы.
 Редактор системы – общий контроль за целостностью данных.
 Администратор системы.
Данная система разработана на основе Java (сервлетов и JSP) – технологии, хранение данных
осуществляется в базе данных MySQL, временный буфер реализован на основе объектной базы данных
PsePro. Проверка валидности XML-кода осуществляется с учетом свободно распространяемого
валидатора.
Система создается совместно с ФГУП НТЦ "Информрегистр", БЕН РАН, ГУП "Информэлектро" и
ВИНИТИ.
ИНТЕГРИРОВАННОЕ УПРАВЛЕНИЕ КАЧЕСТВОМ И ИНФОРМАЦИОННОЙ
ПОДДЕРЖКОЙ В ЖИЗНЕННОМ ЦИКЛЕ ИЗДЕЛИЙ
А.Н.Тихонов1, Б.М.Позднеев2
1)ГосНИИ информационных технологий и телекоммуникаций «Информика»,
2)Московский государственный технологический университет «Станкин»
Тел.: (095) 229-45-34, 973-11-51, e-mail: [email protected], [email protected]
Устный доклад.
АНАЛИЗ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ СИНХРОНИЗАЦИИ
МУЛЬТИМЕДИЙНОЙ ИНФОРМАЦИИ МЕТОДАМИ ТАКСОНОМИИ
Г.И.Воробьева
Министерство образования и науки Российской Федерации, Москва
Тел.: (095) 237-91-83, e-mail: [email protected]
Все существующие методы синхронизации мультимедийной информации (изображения, звук, текст)
основаны на использовании для этих целей части ресурсов ЭВМ [1], что, естественно, сокращает
ресурсы (тактовая частота процессора, объем свободной оперативной памяти, пропускная способность
шины и т.п.), выделяемые для решения основной задачи, заключающейся в предоставлении
пользователю собственно мультимедийных данных. Таким образом, часть ресурсов компьютера
неизбежно тратится на “самообслуживание”, что может привести к снижению качества мультимедийных
данных, поставляемых пользователю. С другой стороны, сокращение ресурсов ЭВМ, выделяемых для
синхронизации (например, увеличение скважности синхроимпульсов), может привести к искажению
данных. Примером может служить отставание или опережение звукового сопровождения по отношению к
визуальному ряду, воспроизводимого компьютером фильма [2]. Целью настоящей работы является
попытка, исходя из самых общих соображений, использовать методы таксономии для построения и
анализа математической модели синхронизации мультимедийной информации.
Определения, допущения и обозначения
Будем ниже исходить из следующих допущений:
1. Качество синхронизации, равно, как и качество мультимедийной информации, в первом
приближении линейно зависит от используемых ресурсов.
2. Все ресурсы ЭВМ выделяются только на решение двух задач: передачу пользователю
мультимедийных данных и их синхронизацию.
В описываемых ниже формальных постановках используются следующие обозначения:
124
xi , j  величина j - го ресурса, используемого для решения i - й задачи
(i  1 соответствует синхронизации, i  2 отвечает передаче мультимеди йной
информации);
Х j - объем j - го ресурса, которым обладает используемая ЭВМ;
a i, j - коэффициен т пропорциональности, определяющий влияние единицы j - го ресурса
затрачиваемого на решение i - ой задачи, на качество отображаемой информации.
Формальные постановки задачи
Если допустить, что обе задачи независимо влияют на качество поставляемой пользователю
информации, то получим многокритериальную модель вида:
i: Fi  a 0,i   a i,j x i , j  max;

j

j:  x i,j  X j ;
i

i,j:x i,j  0.

(1)
Физический смысл коэффициентов a 0 ,i очевиден – они представляют собой нижние границы
значений соответствующих целевых функций. Легко убедиться, что верхняя граница значений каждой
целевой функции определяется выражением:
i : Fi  a 0,i   a i, j .
(2)
j
Одним из подходов, используемых для решения такого рода задач, является переход от системы (1)
к однокритериальной модели, для чего можно, введя для каждого i-го критерия коэффициенты важности
b i и суммируя их, получить один критерий. В результате система (1) может быть преобразована к виду:
 F   b i [a 0,i   a i,j x i , j ]  max;

i
j

j:  x i,j  X j ;
i

i,j:x i,j  0.

(3)
Решение системы (3) не вызывает затруднений [1,2], интерес, однако, вызывает поиск решения
собственно системы (1), которое бы максимально приближалось к “наилучшему”. Последним можно
считать точку на плоскости, отвечающую максимальным значениям критериев системы (1),
определяемым правыми частями неравенств (2):
Fi max  a 0,i   a i, j , i  1, 2.
(4)
j
Графически это можно представить неким прямоугольником в координатах, определяемых
целевыми функциями системы (1), стороны которого определены правыми частями равенств (4). На
приводимом ниже рисунке стороны “серого” прямоугольника
F2
F2 max
.
.
.
..
.
.
0
0
F1 max
F1
Рис.1. Прямоугольник, отвечающий
наибольшим значениям критериев
125
определяются именно таким образом, а точки внутри прямоугольника соответствуют сочетаниям
различных значений целевых функций системы (1), определяемых векторами переменных этой системы,
удовлетворяющих её ограничениям. Качество каждого такого решения можно оценить его близостью к
“идеальному”, причем последнее соответствует вершине прямоугольника, наиболее удаленной от
начала координат. В силу того, что критерии измеряются в разных шкалах, расстояние между каждой
парой точек должно измеряться в λ–пространстве [3].
Литература
1. Воробьева Г.И., Клебанова И.В. Регулярные методы поиска оптимальной стратегии обработки
кортежей изображений при решении задач нефтегазовой промышленности. Нефтегазовые технологии,
1999, №3, с.32-35.
2. Воробьева Г.И. Анализ линейных математических моделей синхронизации мультимедийной
информации. Тр. межд. научно-технич. конф. «Информационные технологии и системы: новые
информационные технологии в науке, образовании, экономике», Владикавказ, 2003, т.2, с.74-77.
3. Н.Г.Загоруйко. Прикладные методы анализа данных и знаний. Новосибирск, 1999.
РЕСУРСЫ МНОГОПРОЦЕССОРНОГО УЧЕБНОГО ЦЕНТРА И ПОДГОТОВКА
СПЕЦИАЛИСТОВ ПО ВЫСОКОПРОИЗВОДИТЕЛЬНЫМ ВЫЧИСЛЕНИЯМ
А.А.Пярнпуу
Московский авиационный институт (государственный технический университет),
Москва
Тел.: (095) 158-40-90, e-mail: [email protected]
На предыдущей конференции «Телематика`2003» была высказана озабоченность тем, что несмотря
на интерес многих исследователей в области разработки современных высокоточных численных схем,
остается проблематичным их эффективное применение в высокопроизводительных ЭВМ
многопроцессорной и кластерной архитектуры [1]. Не до конца еще проработаны и вопросы оптимальной
реализации программных средств с активным распараллеливанием ресурсоемких алгоритмов
повышенной точности на сетках нерегулярной структуры. Дальнейшее повышение производительности
суперЭВМ и использование лишь "пассивных" методов распараллеливания (в том числе и векторизации)
не сопровождается столь же существенным увеличением эффективности прикладных программ.
Причина этого кроется в несогласованности структур традиционных последовательных алгоритмов и
программ с операционной средой параллельных архитектур, а также в приверженности к сложившимся
стереотипам программирования.
Устранение этих противоречий обеспечивается "активным" распараллеливанием алгоритмов и
программ, выделением и прецизионным программированием вычислительных ядер, целенаправленной
ориентацией схем алгоритмов и программ на конкретную вычислительную архитектуру.
В свете сказанного весьма актуальным становится задача подготовки специалистов по
высокопроизводительным и параллельным вычислениям, высококвалифицированных системных и
проблемных
программистов,
кадров
по
созданию
телекоммуникационной
среды
высокопроизводительных технологий, персонала по обслуживанию и обновлению локальных и
глобальных компьютерных сетей. На современном этапе развития и совершенствования системы
открытого и дистанционного образования в связи с ростом контингента обучаемых и увеличением
количества читаемых курсов, требующих практической реализации на высокопроизводительной
вычислительной технике, возникает проблема расширения возможностей и увеличения ресурсов.
Созданный в Московском авиационном институте в соответствии с Федеральной целевой
программой «Интеграция» центр высокопроизводительных вычислений в полной мере используется в
процессе подготовки специалистов по указанным направлениям [2, 3]. В настоящее время в учебном
процессе задействованы все три созданные кластеры центра, компьютерные классы, оснащенные
практически всеми современными программными средствами.
Состояние высокопроизводительных вычислительных ресурсов центра характеризуется тем, что за
2003 г. создан единый мультимедийный программно-аппаратный комплекс, укомплектованный
профессиональным и полупрофессиональным высокотехнологичным оборудованием, позволяющий
решить ряд научно-исследовательских (в рамках вычислительных и натурных экспериментов) и учебнометодических мультимедийных задач, включающих в себя вопросы обработки цифровой аудио и видео
информации.
Расширен институтский кластер вычислительных машин на базе РС IВМ и ОС Linux с целью:
 организации базы для проведения практических занятий учебных курсов по распараллеливанию
вычислений и программированию параллельных вычислений;
 предоставления промежуточного по производительности (по сравнению с кластером МАИ806 и
ЭВМ МВС-100, МВС-1000) вычислительного комплекса для выполнения научноисследовательских работ, требующих достаточно больших вычислительных мощностей;
126
 предоставления научно-исследовательским и учебным подразделениям института
вычислительного отладочного кластера, работающего в среде интенсивно развивающейся в
настоящее ОС Linux.
На базе кластера МАИ806 создан многопроцессорный кластер МАИ8. Предполагается его развитие
на Alpha- и Xeon-платформах до 32 процессоров, существенное увеличение производительности,
дальнейшее оснащение современным оборудованием мультимедийного центра и расширение
институтского кластера вычислительных машин на базе РС IВМ и ОС Linux до 48 узлов.
Пополнились телекоммуникационные ресурсы, в результате чего осуществлено эффективное
подключение по локальной сети института к кластерам имеющихся программно-технических комплексов
и компьютерных классов обучения программированию параллельных вычислений. Повышена пропускная
способность сети на всех участках до 100 Mb/s, тестовое подключение серверов на 1Gb/s.
Планируется дальнейшее развитие и совершенствование локальной сети института с целью
обеспечения оперативного обмена информацией как внутри институтской вычислительной сети, так и
при работе с внешними вычислительными комплексами, а также совершенствование системы
обеспечения надежной информационной безопасности использования удаленных вычислительных
систем и кластеров и обеспечение гарантированной полосы пропускания (QoS) для передачи аудиовидеосигналов, проведение видеоконференций, широковещательных передач.
Продолжалось создание концепции многоуровневой информационной базы, содержащей методы и
результаты моделирования и проектирования, интерактивные учебные курсы.
Выполнен ряд фундаментальных и прикладных исследований задач физической газовой динамики –
проведен вычислительный эксперимент на высокопроизводительных ЭВМ.
Поставлен новый учебный спецкурс «Цифровое видео»; обновлены части курсов «Технологии
MultiMedia» и «Программирование игр»; организован сервер потокового вещания «video-on-demand»
(видео по запросу) в условиях высокой загрузки пропускных каналов; реализованы новые лабораторные
работы по курсу «Технологии MultiMedia», посвященные фильтрации и микшированию цифрового звука;
проведены практические занятия (с бакалаврами), посвященные линейному и нелинейному
видеомонтажу, в том числе в масштабе реального времени; разработаны новые курсовые и
лабораторные работы по курсу «Цифровое видео», посвященные компрессии данных, совмещению
реальных и синтезированных видеорядов, методикам оценки потерь качества.
Доказана эффективность использования высокопроизводительных вычислительных ресурсов в
учебном процессе, так что планируется по указанным выше специальностям обучить до 20 человек по
заказам предприятий. Осуществляется обслуживание комплексного дипломного проектирования,
дистанционного обучения, открытого образования, обеспечение распределенных разработок.
Пока, к сожалению, некоторые трудности в развертывании применения высокопроизводительных
вычислений остаются, главным образом, из-за недостаточности высокопроизводительных программноаппаратных комплексов для реализации технологической цепочки обмена данными при ведении
распределенных проектов в образовательной и научной сферах. Имеется также нехватка как
преподавательских, так и научных кадров, что еще раз подтверждает необходимость интенсивной
подготовки кадров для работы на высокопроизводительной вычислительной технике. Ресурсы
имеющейся в МАИ вычислительной среды с учетом ожидаемого пополнения в рамках ФЦП
«Интеграция» позволяют с оптимизмом относиться к возможности решения обозначенной выше
глобальной проблемы подготовки кадров.
Литература
1. Пярнпуу А.А. Подготовка специалистов по современным информационным технологиям на базе
центров высокопроизводительных вычислений. Труды Х Всероссийской научн.-методич. конф.
«Телематика`2003» 14-17 апреля 2003 г., СПб. Т.1. 2003, с. 238-239.
2. Пярнпуу А.А. Научно-методическая концепция преподавания математики, физики и механики в
системе открытого образования. XXVIII International Conference and Scientifical Discussion Club
IT+SE’2001, Украина, Крым, Ялта-Гурзуф, 20-29 мая 2001 г. // Труды конференции. –Запорожье: Изд-во
ЗГУ, 2001, с. 224-225.
3. Пярнпуу А.А., Шебеко Ю.А. Использование ресурсов центра высокопроизводительных вычислений
в учебном процессе. Российская конференция «Высокопроизводительные вычисления и технологии»
(ВВТ-2003), Ижевск, 27-30 октября 2003 г. – Ижевск: УдГУ, 2003.
ВВЕДЕНИЕ В ОПЫТНУЮ ЭКСПЛУАТАЦИЮ ВЫЧИСЛИТЕЛЬНОЙ ФЕРМЫ,
ПОСТРОЕННОЙ ПО ТЕХНОЛОГИИ GRID
В.И.Метечко, С.Ю.Смирнов, Ю.А.Чернышев, В.А.Шурыгин
Московский инженерно-физический институт (государственный университет)
Тел.: (095) 324-45-41, 324-77-78, e-mail: [email protected]
В настоящее время в МИФИ в рамках программы изучения и отработки технологий построения
распределенных вычислительных сетей (технологии GRID) создана компьютерная ферма общего
назначения для проведения высокопроизводительных вычислений в различных областях науки и техники
127
[1]. Ферма состоит из шести двухпроцессорных машин класса Pentium-III с суммарной дисковой памятью
около 500 Гбайт [2].
К настоящему времени был проведен комплекс работ по интеграции компьютерной фермы в
Информационно-Вычислительную Сеть (ИВС) МИФИ и осуществлено подключение фермы по каналу
связи с пропускной способностью 100 Мбит/с [3]. Кроме этого, ключевым вопросом ввода фермы в
опытную эксплуатацию являлось создание, адаптация и настройка необходимого математического
обеспечения фермы. Для этого, прежде всего, ферма была подключена к единой мировой дисковой
системе AFS [4]. Эта система (Andrew File System) была разработана в середине 90-х годов в
университете Карнеги-Меллон (Питтсбург, США) и получила широкое распространение в научном
секторе Интернета. Эту систему отличает удобство использования с одной стороны, и надежность и
безопасность с другой. Система AFS осуществляет прозрачный доступ пользователя из любой точки
Интернет-пространства к своим файлам, как если бы они находились на его локальном компьютере, на
котором он в данный момент работает, в то время как на самом деле физически эти файлы
расположены на специальных AFS-серверах. Быстрый доступ к пользовательским файлам
осуществляется за счет многоуровневой промежуточной буферизации файлов. Надежность и
безопасность этой системы обеспечиваются наличием шифрованных паролей с ограниченным временем
жизни, а также ежесуточным автоматическим резервным копированием всех пользовательских файлов
на магнитную ленту с возможностью быстрого восстановления случайно утраченной информации.
Вычислительная ферма МИФИ подключена в качестве клиента к AFS-серверам ЦЕРН (Европейская
Организация Ядерных Исследований – Женева) в связи с тем, что основное сотрудничество и по линии
исследования фундаментальных свойств материи и по линии развития GRID-технологий МИФИ ведет
именно с ЦЕРНом.
Другим необходимым программным компонентом для начала опытной эксплуатации вычислительной
фермы является система поддержания очереди заданий, управления ресурсами и распределения задач
на процессоры фермы. В качестве такой системы был выбран программный пакет OpenPBS [5],
свободно распространяемый фирмой Veridian Systems и позволяющий решать все необходимые задачи
взаимодействия пользователей с системой управления заданиями. Этот пакет выполняет следующие
функции: принимает сформированное задание пользователя со всеми необходимыми атрибутами
управления, сохраняет и защищает задание во время его выполнения, а по завершению задания –
доставляет выходные данные и результаты обратно пользователю.
Таким образом, адаптация, настройка и отладка описанных выше программных систем позволила
запустить вычислительную ферму в опытную эксплуатацию с возможностью приема и обработки
пакетных заданий от любых пользователей ИВС МИФИ. Ферма включена и эксплуатируется в
круглосуточном режиме с 1 августа 2003 г. без заметных сбоев, при этом средняя загрузка всех
процессоров фермы задачами пользователей составила 97%.
Опытная эксплуатация вычислительной фермы продемонстрировала большую заинтересованность
различных научных групп МИФИ в проведении такого рода высокопроизводительных вычислений.
Поэтому было принято решение о дальнейшем наращивании процессорных мощностей фермы. Причем
это увеличение решено производить по методу максимально эффективного использования уже
имеющегося в институте вычислительного оборудования. Действительно, МИФИ имеет целый ряд
современных компьютерных классов, которые используются в учебном процессе в интерактивном
режиме. Вне рамок учебного расписания эта мощная вычислительная техника не используется,
простаивая таким образом до 50% всего времени. Технологии GRID позволяют полностью использовать
эти незадействованные вычислительные мощности: установив в дополнении к программному
обеспечению, имеющемуся на компьютерах, описанные выше операционную систему Linux и систему
поддержания очереди заданий OpenPBS, ежедневно по окончании учебного дня, эти ЭВМ, загрузив ОС
Linux, автоматически подключаются к ферме и начинают обработку заданий, ожидающих выполнение в
очереди. При этом конфигурация системы управления очередью может быть настроена как на пересылку
этим дополнительным компьютерам только коротких по времени вычисления заданий, чтобы эти
машины заведомо освобождались к началу следующего учебного дня, так и на максимальную,
практически 100%-ную эффективность загрузки процессора. В последнем случае не завершившаяся к
началу следующего учебного дня задача сохраняется на жестком диске компьютера, с тем, чтобы
продолжить выполнение при следующем переключении компьютера из интерактивного режима для
учебного процесса в режим пакетной обработки заданий. Другим возможным способом достижения
максимальной эффективности использования процессоров, который в настоящее время интенсивно
изучается, является использование для учебных занятий в дисплейных классах свободно
распространяемого эмулятора Wine [6] для Linux. В этом случае компьютеры остаются постоянно
загруженными под Linux, продолжая выполнять вычислительные задания из очереди на более низком
приоритете, а все учебные интерактивные задачи, которые должны работать под ОС Windows,
выполняются на более высоком приоритете под эмулятором.
Таким образом достигается резкое наращивание вычислительных мощностей фермы МИФИ при
минимальных затратах путем повышения эффективности использования имеющейся компьютерной
техники, что позволяет наиболее полно удовлетворить потребности научных групп института в
высокопроизводительных вычислительных системах.
Литература
1. Смирнов С.Ю. Интернет следующего поколения – всемирная сеть распределенных вычислений
GRID. //Научная сессия МИФИ-2002. Сб. науч. тр. В 14 т. М.: МИФИ, 2003, Т.10.
128
2. Метечко В.И., Смирнов С.Ю. Создание многопроцессорной вычислительной фермы в рамках
концепции распределенной сети GRID. //Научная сессия МИФИ-2003. Сб. науч. тр. В 14 т. М.: МИФИ,
2003, Т.10.
3. Воронина Р.Я., Метечко В.И. и др. Создание Gigabit-Ethernet опорной сети МИФИ в рамках
концепции распределенной сети GRID. Сб. тр. X Всеросс. научно-метод. конф. «Телематика-2003». СПб,
2003.
4. http://www.openafs.org.
5. http://pbspro.com.
6. http://www.winehq.com.
GIGABIT ETHERNET ОПОРНАЯ СЕТЬ МИФИ
Р.Я.Воронина, Е.Н.Лагунцов, В.И.Метечко, Н.Н.Романов, С.Ю.Смирнов,
Ю.А.Чернышев, В.А.Шурыгин
Московский инженерно-физический институт (государственный университет)
Тел.: (095) 324-77-78, e-mail: [email protected]
Информационно-вычислительная сеть (ИВС) МИФИ является корпоративной сетью передачи
данных, в состав которой входит базовая вычислительная сеть (БВС), функционирование которой
обеспечивается Центром новых информационных технологий (ЦНИТ) МИФИ, и локальные
вычислительные сети (ЛВС) абонентов в виде абонентских узлов (АУ) подразделений и организаций
университета.
В настоящее время БВС МИФИ построена на оптоволоконных линиях связи, суммарная длина
которых составляет более 25000 м. Центральный, базовый и корпусные узлы содержат 30 единиц
активного телекоммуникационного оборудования (маршрутизаторы, коммутаторы). К БВС подключено
более 2000 компьютеров, включая 500 компьютеров общежития, 100 компьютеров лицея. Общий трафик
составляет более 150 Гбайт в сутки.
ИВС МИФИ – это основа, фундамент, на котором строится информационно-образовательная среда
университета, в рамках которой функционируют все информационные службы университета.
Компьютерная сеть МИФИ (MephiNet) начала свое функционирование в 1995 г. Первоначально для
выхода в Интернет использовался низкоскоростной канал связи по цифровой коммутируемой
телефонной линии (28,8 Кбит/с), обеспечивший связь с НИИЯФ МГУ (сеть RuHEP). НИИЯФ МГУ имел
спутниковый канал DESY (Германия) и обеспечивал транзит трафика в мировые сети.
В 1997 г. институтом был проложен по территории Москвы оптический кабель (10 км), который дал
возможность подключиться к Южной Московской Опорной Сети (ЮМОС), построенной по технологии
FDDI (Fiber Distributed Data Interface). Тогда же был создан базовый узел сети МИФИ, который являлся
одновременно узлом ЮМОСа, и обеспечил пользователям МИФИ доступ в Интернет со скоростью
100 Мбит/с.
В рамках федеральной целевой программы «Электронная Россия» был выполнен проект «Создание
телекоммуникационных узлов и опорной сети МИФИ на основе высокопроизводительных технологий
Gigabit Ethernet». По проекту были проложены недостающие оптоволоконные сегменты между корпусами
института, проложен оптический кабель по территории Москвы до ММТС-9 (общая длина 19 км), который
обеспечил связь базового узла МИФИ с узлом сети RUNNet со скоростью 1 Гбит/с. До лицея №1511 был
проложен оптический кабель (длина 2 км), который соединил базовый узел МИФИ с узлом лицея,
обеспечив связь базового узла МИФИ с узлом лицея со скоростью 1 Гбит/с.
Во всех узлах опорной сети МИФИ установлены высокопроизводительные сетевые коммутаторы
фирмы Cisco серии 2950, 3550, которые обеспечивают скорость передачи данных до 1 Гбит/с.
В Базовом узле ИВС МИФИ установлено высокопроизводительное оборудование Cisco Catalyst
6506, Cisco Catalyst 3550-24, которые объединяют узлы основных корпусов по оптоволоконным линиям
связи и витой паре 1 Гбит/с.
В сети предусмотрено резервное подключение узлов по оптическим линиям связи и витым парам со
скоростью передачи данных 100 Мбит/с.
На сегодня вся инфраструктура опорной сети МИФИ работает по технологии Gigabit Ethernet,
включая лицей 1511 и внешний канал МИФИ – RUNNet (ММТС-9). В перспективе планируется по
технологии Gigabit Ethernet подключить новый корпус студенческого общежития.
Выход по оптоволоконной линии связи до узла RUNNet с пропускной способностью 1 Гбит/с позволит
МИФИ интегрироваться в московский сегмент GRIDа.
Значимость ИВС для учебного и научно-исследовательских процессов, а также для
административной деятельности университета предъявляет высокие требования к обеспечению
надежности работы сети. В настоящее время приоритетной задачей ставится обеспечение
отказоустойчивой, надежной и бесперебойной работы сети, путем создания резервных каналов связи и
электропитания, создание схемы, позволяющей в "горячем" режиме резервировать основное
коммутационное оборудование.
129
Важным фактором обеспечения надежности работы информационно-вычислительной сети является
использование надежной и эффективной среды передачи данных – оптоволоконного кабеля,
позволяющего достичь высоких скоростей передачи данных и при этом свести к минимуму количество
ошибок и отказов, связанных со средой передачи.
Одним из основных факторов, определяющих надежность работы сети, является надежность
используемого сетевого и телекоммуникационного оборудования. Базовая сеть МИФИ построена на
оборудовании производства компании Cisco Systems – мирового лидера в области сетевых технологий и
сетевого оборудования, которое характеризуется достаточно высокой степенью надежности, и очень
хорошо зарекомендовало себя за время использования в сети МИФИ.
Для обеспечения отказоустойчивой, надежной и качественной работы абонентов ИВС МИФИ в сети
предусмотрены резервные подключения к внешним сетям. Так, выход в сеть Интернет осуществляется
посредством двух независимых провайдеров – RuHEP и RUNNet. Кроме того, внешнее подключение
зарезервировано на физическом и транспортном уровнях: для выхода вовне может использоваться как
прямое подключение к узлу М9 по собственному оптоволоконному кабелю, так и транспортную сеть
ЮМОС, подключение к которой также сохраняется в качестве вспомогательного и резервного.
Как и для любой другой сложной вычислительной сети, для ИВС МИФИ актуальны задачи,
связанные с управлением сетью и телекоммуникационным оборудованием. Кроме того, специфика
научного и образовательного учреждения, сложившаяся политика использования информационных и
вычислительных ресурсов накладывают определенные дополнительные требования на систему
управления и функции, реализуемые ею.
Для администрации сети важным и необходимым является четкое зафиксированное видение
строения и топологии сети, принятых правил адресации и именования, конфигураций оборудования и
системного сетевого программного обеспечения, основной информации о пользователях сети.
Необходимо наличие средств, предоставляющих информацию о реальном положении дел в сети,
существующей топологии, актуальных конфигурациях. В рамках работ по разработке системы
управления ИВС МИФИ разработано или находится в стадии разработки программное обеспечение,
позволяющее решать вышеупомянутые задачи.
Применение программных средств, разработанных в ЦНИТ, а также стандартных промышленных
продуктов управления и мониторинга сетей позволяет достаточно эффективно решать задачи
управления сетью, встающие в связи с ростом размера и сложности ИВС МИФИ, а также повышением ее
значимости для учебного и научно-исследовательских процессов.
СТРУКТУРНО-ОРГАНИЗАЦИОННЫЕ ВОЗМОЖНОСТИ НМЦ «ИНЖЕНЕРНОЕ
ОБРАЗОВАНИЕ» МГТУ ИМ. Н.Э.БАУМАНА ПО РАЗРАБОТКЕ И
ИСПОЛЬЗОВАНИЮ ЭЛЕКТРОННЫХ УЧЕБНО-МЕТОДИЧЕСКИХ
МАТЕРИАЛОВ
С.Б.Талдыкин, А.А.Волков
Московский государственный технический университет им. Н.Э.Баумана, Москва
Тел.: (095) 263-69-43, факс: (095) 261-67-19, e-mail: [email protected]
В МГТУ им. Н.Э.Баумана отмечено построение преподавателями авторских систем обучения с
использованием в процессе преподавания современных информационных технологий. Преподаватели
работают не только с использованием собственных электронных мультимедийных методических и
дидактических пособий, но и внедряют полномасштабные электронные мультимедийные монографии,
насыщенные уникальными видеоизображениями, анимациями, дополнительным справочным
материалом, высококачественными фотографиями, проверочно-тестовым контролем в учебный процесс.
К сожалению, этот процесс остается делом отдельных увлеченных энтузиастов-предметников
http://tm.ifmo.ru/tm2004/db/doc/get_thes.php?id=6. Анализ причин, тормозящих широкий процесс
использования электронных учебных материалов по инженерным специальностям в учебном процессе,
показал, что основным ограничением для поточного применения электронных учебных материалов
различного назначения, является не только необходимость хорошего владения материалом предметных
знаний, достаточно полных теоретических знаний в области информатики и опыта в применении
современных программных продуктов, но и практических навыков в использовании современных
технических средств обучения.
Естественным выходом из этого положения является создание условий, снимающих указанное
ограничение. Одним из шагов в этом направлении является создание в МГТУ в рамках НМЦ
«Инженерное образование» класса лекторского мастерства.
В МГТУ согласно приказу ректора, создана структура, позволяющая управлять процессом создания и
использования электронных учебных материалов по инженерным специальностям. Эта структура
включает в себя Лабораторию методики и дидактики открытого инженерного образования, Лабораторию
инструментальных средств учебно-методических материалов, Лабораторию программно-технического
обеспечения удаленного практикума, Лабораторию сопровождения портала.
130
Цели и задачи перечисленных структурных подразделений определяются Положениями каждой
структурной единицы, но основное направление работы – оказание методической, технической и
практической помощи профессорско-преподавательскому составу на всех стадиях создания и
применения электронных учебных материалов в МГТУ. Таким образом, совокупность лабораторий
позволяет компенсировать недостаток некоторых навыков преподавателей и пользователей
электронных учебных материалов по инженерным специальностям, путем оказания реальной
методической, технической и практической помощи на всех стадиях практической апробации и
внедрения электронных учебных материалов в учебный процесс МГТУ.
В частности, “Лаборатория методики и дидактики открытого инженерного образования”, созданная в
рамках НМЦ по приказу ректора за № 1-03/443 от 10.09.02, имеет основной целью методическое
обеспечение системы открытого инженерного образования в МГТУ.
Одна из целей “Лаборатории методики и дидактики открытого инженерного образования” –
разработка и научное обоснование рекомендаций по методическому и дидактическому обеспечению
системы открытого инженерного образования в МГТУ, является основной. Ключевой же является
создание при лаборатории практической школы педагогического мастерства.
Для практической реализации поставленной цели приказом ректора выделена аудитория 319
главного здания МГТУ и предусмотрен комплекс работ по оборудованию указанной аудитории
современными техническими средствами обучения. Окончательный проект переоборудования аудитории
319 выполнен ООО «КБ-Строй», имеющим лицензию на указанную деятельность.
Техническое обеспечение класса лекторского мастерства предусмотрено в двух вариантах.
1. Техническое обеспечение класса лекторского мастерства в стационарном варианте в помещении
319 предполагает использование современных технических средств обучения, включая возможности
получения аудио- видеоинформации по Интернет-сетям. Полученная информация доводится до
пользователя в различном виде: в виде проекции на экран лазерным проектором, в виде вывода на
жидкокристаллический плазменный монитор, оснащенный сенсорным интерактивным экраномнакладкой, в виде вывода на персональный монитор пользователя. Аудиосопровождение возможно в
виде громкой связи через систему динамиков и/или индивидуального прослушивания на микронаушник.
Последнее желательно для пользователей с дефектами органов слуха. Для демонстрации эскизов,
моделей, слайдов предусмотрена специальная техника в виде диаскопов, дипроекторов, кодоскопов и
современным визуализатором. Создание электронных курсов лекций возможно в этой же аудитории в
виде цифровой видеозаписи.
2. Мобильный вариант класса лекторского мастерства предусмотрен в связи с необходимостью
использовать технические средства обучения в иных учебных помещениях МГТУ. В минимальный
комплект мобильного варианта входит – переносной компьютер, лазерный проектор, проекционный
экран, лазерная указка. Мобильный вариант класса лекторского мастерства используется, в частности, в
аудитории 19 Приборостроительного факультета МГТУ.
Лаборатория методики и дидактики разработала программу и учебный план занятий преподавателей
в рамках Факультета повышения квалификации преподавателей МГТУ, в области Методических аспектов
создания и использования электронных средств обучения в учебном процессе. Особо следует
подчеркнуть наличие в учебном плане практической работы преподавателей в использование
оснащенного
техническими
средствами
класса
лекторского
мастерства
по
проведению
демонстрационных занятий.
РАЗВИТИЕ БАНКОВСКОЙ СИСТЕМЫ УПРАВЛЕНИЯ
ДОКУМЕНТООБОРОТОМ НА ОСНОВЕ МЕТОДОВ ОТКРЫТЫХ СИСТЕМ
А.Б.Петров, Р.Г.Сонис
Московский институт радиотехники электроники и автоматики (технический
университет)
Тел.: (095) 434-94-45, e-mail: [email protected]
Развитие информационных технологий в последние годы привело к внедрению электронного
документооборота практически во все сферы человеческой деятельности. Подобный всплеск активности
в сфере информационных технологий привел к появлению всевозможных систем управления
документооборотом.
Особенно необходимы системы управления документооборотом в банковской сфере, поскольку
внедрение системы управления документооборотом позволяет сократить затраты и повысить
оперативность обработки документов.
Системы управления документооборотом в ряде случаев не выполняют возложенных на них задач, а
именно эффективного управления документами. Основная причина этого – использование в системах
управления документооборотом различных, зачастую несовместимых форматов данных, различных
идентификаторов, правил регистрации и списания документов. Все это не позволяет на данный момент
внедрить и эффективно использовать системы управления документооборотом.
Решающим условием успешного внедрения системы документооборота в банке является гибкость и
адаптируемость системы при изменении окружающих факторов деловой активности, а также открытость
131
по отношению к обмену информационными сообщениями с другими системами (включая
международные), а, значит, совместимость с ними на основе международных стандартов. Таким
образом, становится ясно, что для успешного внедрения система управления документооборотом
должна являться открытой системой [1].
Под открытой системой управления банковским документооборотом подразумевается расширяемая
система управления документооборотом, открытость которой заключается в том, что система может
быть легко расширена для того, чтобы обеспечить дополнительные функциональные возможности, не
предусмотренные разработчиком системы, которые могут понадобиться для интеграции системы с
другими офисными системами. Для решения этой задачи необходимо наличие гармонизированного
набора стандартов – профиля, направленного на решение задач [2]:
 обеспечение мобильности (переносимости) банковской СУД;
 обеспечение интероперабельности банковской СУД;
 обеспечение масштабируемости СУД;
 обеспечение адаптируемости банковской СУД.
При разработке профиля открытой банковской СУД необходимо применить методы структурной
декомпозиции для создания профиля и определив архитектуру системы управления документооборотом.
Применение общепризнанных мировых стандартов позволит обеспечить единый формат данных,
идентификаторов, форм, полей записей и бесшовную интеграцию с другими системами, что делает
систему эффективной тиражируемой [3].
Профиль системы позволяет, по мнению разработчиков IEEE Std 1003.23, установить соответствие
между требованиями пользователя, информационными службами и информационными технологиями,
которые эти требования поддерживают, а также стандартами и спецификациями, которым они
соответствуют.
Как показывает мировой опыт, именно применение методов функциональной стандартизации для
разработки информационных систем позволяет получить независимость от поставщика, облегчает
интеграцию и функциональную совместимость с другими информационными системами, обеспечивает
максимальную отдачу от вложений инвестиций в новую информационную технологию [4].
Поскольку такая сложная система как система управлением документооборотом банка не может
быть реализована одномоментно и сразу во всех подразделениях, она должна иметь модульную
структуру, причем модули должны быть независимы друг от друга при сохранении бесшовной интеграции
друг с другом. Именно на этом этапе и становятся нужны такие важные свойства системы, как
масштабируемость, переносимость и адаптируемость. Для обеспечения этого первым этапом при
построении системы должно быть составление технического задания. В техническом задании на систему
должны быть определены требования к профилю системы, и на последующих стадиях реализации
системы управления документооборотом необходимо руководствоваться этим профилем, тогда система
будет обеспечивать выполнение минимальных усилий и затрат на адаптацию в процессе установки,
конфигурирования и обеспечения нормальной работы пользователей. Руководителю банковского
подразделения,
занимающегося
разработкой
и внедрением
новой системы
управления
документооборотом, придется выбирать, каким путем пойти: выбрать модернизацию имеющийся
системы (хранилищ данных, архивов, карточек документов), что позволит сравнительно безболезненно
перейти на новую систему при минимальных затратах. Но при этом система не будет являться в полной
мере открытой системой, поскольку будет всего лишь модернизированной системой сохранившей все
недостатки прежней системы, а именно недостаточною гибкость и адаптируемость системы. Второй путь
– это создание новой системы строго в соответствии с профилем. Это, с одной стороны, самый простой
путь, т.к. не требуется интеграция со старыми, устаревшими хранилищами данных, чья закрытая
архитектура не позволяет организовать работу со старыми документами без специально разработанного
шлюза, разработка которого будет дороже стоимости однократного переноса данных из старого
хранилища в новое, а с другой стороны придется разрабатывать новую систему, что займет
значительное время. Если руководитель выберет второй путь, то Банк получит новую систему, с
помощью которой он сможет эффективно управлять документами, что в конечном итоге окупит все
затраты на разработку и внедрение открытой системы документооборота.
Литература
1. IEEE Р1003.23-1998 “IEEE Guide for Developing User Organization Open System Environment (OSE)
Profiles”.
2. ISO/IEC DTR 14252 “Portable Operaring System Interface for Computer Environments – POSIX. (IEEE,
P1003.0 Draft 18, Draft Guide to the POSIX Open System Environment, February 1995)”.
3. ISO 10040:1992 “Information technology – Open Systems Interconnection – System management
overview”.
4. http://www.stq.ru.
132
НАБЛЮДЕНИЕ И КОНТРОЛЬ ЗА КОММУНИКАЦИОННЫМ
ОБОРУДОВАНИЕМ КОРПОРАТИВНОЙ МУЛЬТИСЕРВИСНОЙ СЕТИ
Д.В.Двоеглазов
Московский государственный институт радиотехники, электроники и автоматики
(технический университет), Москва
Тел.: (095) 131-27-35, e-mail: [email protected]
В Центре сетевого управления и телекоммуникаций МИРЭА разработана специализированная
информационная система для мониторинга и управления мультисервисной корпоративной сети.
Необходимость в такой системе возникла вследствие того, что существующие средства мониторинга
не обеспечивали нужной гибкости в отображении и компоновке данных, а также производили лишь
ограниченный их анализ.
В перечень наблюдаемого оборудования входят коммутаторы, маршрутизаторы, точки доступа Wi-Fi,
голосовые шлюзы, серверы, IP-телефоны и другое сетевое оборудование. Каждое устройство имеет
свои ограничения на объем предоставляемых данных, в зависимости от его характеристик и версии
установленного программного обеспечения.
Для поддержки мультиплатформенности программное обеспечение разработано на языке PHP с
применением объектно-ориентированного подхода. В качестве Web-сервера используется сервер
Apache, в качестве СУБД – MySQL-сервер. Основная система установлена на сервере под управлением
операционной системы FreeBSD 4.7. Дополнительная/отладочная копия системы установлена на
компьютере под управлением ОС Windows 2000. Сервер, на котором установлена система, защищен
межсетевым экраном, кроме того, для авторизации пользователей используется сервер корпоративной
директории МИРЭА.
Система обеспечивает следующие функции:
 предоставление детальной информации о состоянии устройства и его настройках;
 периодический сбор информации о трафике с интерфейсов коммутаторов и маршрутизаторов;
 анализ собранной информации, подсчет min/avg/max значений, фильтрация данных по различным
критериям;
 визуализация собранных данных (графики);
 динамическое построение топологической карты сети;мониторинг процессорной загрузки
коммутаторов и маршрутизаторов;ведение автоматического журнала событий;изменение настроек
устройств (включение/выключение интерфейсов);В основе системы мониторинга и управления
оборудованием лежит открытая технология – протокол управления сетью SNMP (Simple Network
Management Protocol).
Все данные об устройстве хранятся в так называемой управляющей информационной базе MIB
(Management Information Base). MIB базы представляют собой иерархические структуры, содержащие
переменные с информацией о различных параметрах оборудования. К каждой переменной можно
обратиться, используя уникальный идентификатор OID (object identifier).
Для подключения и получения информации с наблюдаемого устройства, на последнем должен быть
активизирован SNMP-агент. Такие агенты обычно реализуют все функции SNMP-протокола, заносят и
получают данные из базы управляющей информации (Management Informational Base – MIB).
Работа с системой организована через web-интерфейс, поэтому оператору достаточно обычного
Web-браузера. Список известных устройств хранится в базе данных. При работе с каким-либо
устройством система запрашивает его текущие данные по протоколу SNMP, общая информация и
статистические показатели берутся из базы данных. На сервере через регулярные промежутки времени
системой запускаются автоматические сценарии сбора статистики и анализа данных. Ряд некритичных
параметров устройства предоставляются пользователю в режиме «по требованию», это сделано для
уменьшения общего времени загрузки данных с устройства. В дальнейшем часть данных кэшируется в
памяти, чтобы не создавать излишнюю нагрузку на устройства, каждый раз считывая их заново.
Система позволяет определить текущее количество подключенных пользовательских машин, как во
всей сети, так и в каком-либо определенном логическом сегменте, настройки которого можно изменять.
В системе присутствует функция построения топологической карты сети, для чего используется
технология фирмы Cisco – протокол CDP (Cisco Discovery Protocol). Он позволяет определить соседние
устройства, которые подключены к текущему, используя его рекурсивно, можно получить информацию
обо всех маршрутизирующих и коммутирующих устройствах в сети, а также о ряде дополнительных
объектов, например, IP-телефонах. Это значительно упрощает процесс построения карты сети. Кроме
того, после анализа информации о МАС-адресах и виртуальных сетях, известных конкретному
устройству можно отобразить на карте пользовательские машины, а также хабы (повторители). Объекты
на карте представляют собой гиперссылки, по которым можно перемещаться, чтобы детальнее
ознакомиться с тем или иным участком сети. Конечные гиперссылки ведут на страницу с информацией о
выбранном устройстве.
В настоящее время система полностью функциональна и располагается на одном из серверов
рабочей группы ЦСУиТ МИРЭА. В дальнейшем планируется увеличить список поддерживаемого
оборудования и расширить перечень наблюдаемых параметров.
133
Литература
1. Дешко И.П., Серегин В.Н., Сигов А.С. Корпоративная сетевая инфраструктура МИРЭА: состояние
и перспективы. //Труды Всероссийской научно-методической конференции: Телематика’2002, СПб: 2002,
С. 54-55.
2. Двоеглазов Д.В. Система мониторинга и управления коммуникационным оборудованием
корпоративной сети МИРЭА. //Современные информационные технологии в управлении и образовании.
Сборник научных трудов. М: ФГУП НИИ “Восход”, МИРЭА, 2003. С.130.
СИСТЕМА ЦЕНТРАЛИЗОВАННОГО УПРАВЛЕНИЯ СЕТЕВЫМИ СЛУЖБАМИ
КОРПОРАТИВНОЙ СЕТИ МИРЭА
А.А.Тихонов
Московский государственный институт радиотехники, электроники и автоматики
(технический университет), Москва
Тел.: (095) 131-27-35, e-mail: [email protected]
По мере роста количества пользователей и предоставляемых им сервисов в корпоративных сетях
возникает необходимость в создании схемы централизованного управления всеми сервисами и
службами, как для отдельного пользователя, так и для групп пользователей. Возрастание числа
пользователей влечет за собой увеличение количества коммуникационного оборудования, что так же
требует реализации схемы централизованного управления и мониторинга сетевого оборудования и
общими сетевыми службами. В этих условиях возрастает актуальность создания системы
централизованного управления различными подсистемами на основе единого модельного подхода.
Решение этой задачи в МИРЭА вызвало необходимость интеграции всего имеющегося сетевого
оборудования, рабочих серверов и системы IP-телефонии с единым хранилищем данных,
представляющий собой кластер серверов директории на основе протокола LDAP. Сервера директории
содержат информацию обо всех функционирующих сервисах и предоставляющих ими службах,
персональную информацию о пользователях и подразделениях корпоративной сети МИРЭА [1]. Данный
подход обеспечил централизованную систему авторизации пользователей при доступе их к
персональной электронной почте, файловому серверу, удаленному доступу и позволил некоторым
серверам хранить профили настроек для своей работы.
Созданная и внедренная в эксплуатацию система управления сервером директории разработана на
платформонезависимом языке программирования PHP с использованием объектного метода
программирования и функционирует под Web-сервером Apache. Реализованные возможности
программного комплекса выполняют следующие основные функции: управление доменами различных
уровней, с присвоением каждому из домена своего системного администратора; управление
персональной информацией пользователей и подразделений в каждом домене; управление DNSсервером, файловым сервером, почтовым сервером, сервером динамической раздачи IP-адресов;
управление авторизацией администраторов на коммуникационном оборудовании.
Главной особенностью разработки является модульность системы и использование при ее создании
открытых технологий. Совокупность данных факторов позволяет расширять функциональные
возможности системы за счет написания дополнительных модулей и интеграции ее с другими
приложениями, серверами и программными продуктами, написанными сторонними разработчиками.
Система обладает масштабируемостью, простым и удобным в работе Web-интерфейсом, обеспечивает
централизованное управление всеми службами и сервисами корпоративной сети МИРЭА.
Одной из отличительной возможностей системы перед существующими аналогами является
управление доменами. Под этим подразумевается управление доменами любого уровня с назначением
каждого из них своего администратора. Данная особенность существенно расширяет возможности
комплекса за счет использования его не только для управления корпоративной сети МИРЭА, но и для
применения ее в организациях предоставляющих доступ во всемирную сеть Интернет, таких как ISP.
Заложенные решения при разработке системы обеспечивают возможность ее взаимодействия с
другими информационными системами МИРЭА. В дальнейшем планируется расширить возможности
системы и добавить пользовательскую часть для контроля использования персональных сетевых
ресурсов.
Литература
1. И.П.Дешко, А.А.Тихонов. Разработка централизованного сервера директории на основе LDAPсервера. // Труды Всероссийской научно-методической конференции: Телематика’2003, СПб: 2003, С.
242-243.
134
ПЕРСПЕКТИВНЫЕ ВОЗМОЖНОСТИ СИСТЕМ IP-ТЕЛЕФОНИИ В
УНИВЕРСИТЕТСКИХ СЕТЯХ
Е.В.Тартынская, М.В.Каминский, К.Г.Кряженков
Московский государственный институт радиотехники, электроники и автоматики
(технический университет), Москва
Тел.: (095) 131-27-35, e-mail: [email protected]
Технологии IP-телефонии продолжают наращивать масштабируемую функциональность, делая
доступными все новые виды сервисов. Это предопределяет их перспективность для использования в
университетских сетях не только корпоративного, но и регионального и межрегионального уровня.
Решения IP-телефонии позволяют организовать более экономически выгодную транспортную
инфраструктуру, объединяющую университеты, их филиалы и сотрудничающие организации в единую
систему, в которой предоставляются разнообразные сервисы, помогающие в решении широкого ряда
вопросов. Последние тенденции развития корпоративных IP-телефонных систем позволяют создавать
информационные сервисы доступные прямо с IP-телефонов. Тем самым, IP-телефон выступает в роли
терминала информационного доступа там, где не удобно или не выгодно устанавливать полноценный
терминал. Внедрение видеотелефонных функций представляется естественным шагом для развития
интерактивного дистанционного обучения. Использование видеотелефонии позволяет решать как
вопросы административного, так и образовательного характера. Но если совсем недавно видеотехнологии являлись экономически труднодоступными для внедрения, то появление простых и
доступных способов должно способствовать распространению видеотелефонии и видеоконференцсвязи.
Первым подобным решением является Cisco VT Advantage. Оно позволяет использовать ПК с USBкамерой в роли видеотерминала, в то время как голос передается через традиционный IP-телефон. При
этом подобный комплект функционально не уступает более дорогостоящим специализированным
видеотерминалам и позволяет пользоваться всеми функциями IP-телефонной сети.
Особый интерес представляет внедрение в университетской сети RUNNet идей, заложенных в
мультисервисных сетях нового поколения (Next Generation Networks). Интеллектуальные системы
маршрутизации IP-телефонных вызовов способны обеспечить более выгодную и качественную связь
между вузами. Современные сервисные платформы предоставления услуг связи абонентам IPтелефонии могут быть использованы в крупных региональных вузах для предоставления необходимых
сервисов для остальных учебных заведений региона. Важной задачей представляется создание центров
обработки вызовов для информационной поддержки абитуриентов во время проведения набора. При
этом они могут быть построены как полностью автоматизированные информационные системы для
предоставления справочной информации, так и с участием территориально разнесенных операторов.
КАЧЕСТВО ОБСЛУЖИВАНИЯ В ПРЕДЕЛЬНО НАГРУЖЕННЫХ
КОММУТИРУЕМЫХ СЕТЯХ
С.В.Тулинов, Д.В.Двоеглазов
Московский государственный институт радиотехники, электроники и автоматики
(технический университет), Москва
Тел.: (095) 131-27-35, e-mail: [email protected]
По мере увеличения количества приложений и сервисов в сети, а также использования
беспроводных сетей передачи данных, все более увеличивается необходимость в обеспечении качества
обслуживания критичных приложений.
В рамках проекта РФФИ № 03-07-90070 в МИРЭА [1] проводится работа по исследованию взаимного
поведения транспортных протоколов в предельно нагруженных коммутируемых сетях. Также
исследуется возможные способы обеспечения качества обслуживания в рамках дифференциальной и
интегральной технологий. Дополнительно проводятся эксперименты по приоритезации критичных
приложений в радиосети 802.11b.
Исследования проводятся на экспериментальном полигоне, интегрированном в корпоративную сеть,
который образован следующим оборудованием: двумя коммутаторами Cisco Catalyst 3550;
генераторами/приёмниками искусственного и/или реального трафика, средством анализа структуры
кадров; группой абонентских устройств, в качестве которых выступают персональный компьютер, IPтелефон Cisco 7940, устройство отображения видеоинформации, подключенное через сеттопбокс Aminet
103; двухдиапазонная беспроводная точка доступа CiscoAiroNet 1200 для подключения мобильных
пользователей сети передачи данных и беспроводных IP-телефонов Cisco 7920.
В целом все проводимые эксперименты проводились следующим образом: генераторы трафика
были подключены к портам одного коммутатора, а приемник к порту другого коммутатора. Генераторы
имитировали нагрузку транкового соединения по разным транспортным протоколам – TCP и UDP.
Одновременно с этим передавались данные, требовательные к времени задержки, потерям и полосе
пропускания. Таким образом, экспериментально выясняется поведение критичных приложений в
предельно нагруженной коммутируемой сети.
135
Полученные результаты говорят о том, что наличие в протоколе ТСР механизмов
саморегулирования заставляет его “подстраиваться” под загрузку канала, создаваемую UDP-потоком.
Например, передаются данных по TCP и UDP со скоростью 60 Мбит/с для каждого протокола через
транковое соединение FastEthernet. В этом случае приложение, работающее по протоколу UDP, будет
занимать необходимую для него полосу пропускания, а приложению, работающему по TCP, останется
только свободная часть пропускной способности канала.
Но, тем не менее, существует возможность обеспечить какому-либо приложению необходимое
качество обслуживания в виде необходимой полосы пропускания, определенного времени задержки и
минимального процента потери пакетов. Для этого необходимо указать в поле CoS на 2 уровне или в
поле DSCP на 3 уровне значения битов для пакетов того приложения, которому необходимо обеспечить
качество обслуживания. В дальнейшем нужно организовать механизм обработки очередей.
Экспериментально опробованный механизм обработки очередей WRR [2] на примере двух
коммутаторов дал следующие результаты: в результате настройки параметров механизма можно гибко
обеспечивать нужным приложениям необходимое качество обслуживания.
При планировании внедрения качества обслуживания в корпоративной сети рационально иметь
представление об информационной картине происходящего в сети.
За неделю работы корпоративной сети МИРЭА в штатном режиме выстраивается следующая
ситуация: в среднем из одного миллиарда переданных пакетов – 80% транспортируется по TCP и 20% по
UDP. Процент данных переданных по UDP объясняется использованием таких сервисов, как IPтелефония, видео по запросу, а также ретрансляция спутниковых телевизионных каналов по сети.
Следует отметить, что сервис ретрансляции спутниковых телеканалов внедрен в эксплуатацию недавно
и находится в тестовом режиме. И как только сервис станет доступен всем пользователям
корпоративной сети – процент данных UDP в общей картине переданного трафика резко изменится, ведь
каждый канал, из 17 доступных на данный момент, ретранслируется со средней скоростью 6,5 Мбит/с.
Распределение IP-пакетов по размерам составляет соответственно: менее и равно 64 байт – 39%, от
64 до 256 байт – 5%, от 256 до 1024 байт – 5% и более 1024 байт – 51%.
Объясняется такое распределение следующим образом: процент пакетов минимальной длины в
основном составляют так называемые ACK пакеты – подтверждения доставки данных по TCP и пакеты
LLC – проверки состояния связи. Процент же пакетов максимальной длины приходится в основном на
передачу информации по TCP и UDP.
Также проводились эксперименты по исследованию транспортного потока UDP с различной длиной
поля данных – и как результат разной длиной самого кадра Ethernet. В результате установлено, что в
более выигрышной ситуации находятся пакеты большего размера. Эксперимент заключался в том, что
через предельно загруженное транковое соединение UDP-пакетами максимального размера
осуществлялись вызовы IP-телефонии. Субъективный результат был выражен пропаданием голоса
одной из сторон. Объективно были зафиксированы большие потери голосовых пакетов с помощью
модуля NAM-1, входящего в состав коммутатора Cisco Catalyst 6006.
В дальнейшем планируется исследовать работу механизма QoS на основе интегральной технологии
при маршрутизации, в том числе и с удаленных источников, доступ к которым возможен благодаря сети
RUNNet, а также по обеспечению сквозного качества обслуживания, как в коммутируемых сетях, так и в
радиосети 802.11b.
Литература
1. Дешко И.П., Серегин В.Н., Сигов А.С. Корпоративная сетевая инфраструктура МИРЭА: состояние
и перспективы. // Труды Всероссийской научно-методической конф. Телематика’2002, СПб, 2002, С. 5455.
2. http://www.cisco.com/en/US/customer/products/hw/switches/ps646/products_configuration_guide_chapte
r09186a0080115928.html#61665.
ОПЫТ ПОСТРОЕНИЯ КЛАСТЕРНЫХ СИСТЕМ ДЛЯ НАУЧНЫХ
ИССЛЕДОВАНИЙ В ОБЛАСТИ ХИМИИ, БИОЛОГИИ, МЕДИЦИНЫ
Л.В.Клюев, И.Ю.Чернин
ООО «ДАТА Технологии», Москва
Тел.: (095) 330-74-01, 771-01-24, e-mail: [email protected], http://www.datatec.ru
Компьютерные и информационные технологии являются уже неотъемлемым инструментом научных
исследований, обеспечивая функции фиксации, обработки, анализа, хранения информации, включая
проведение расчетов и визуального моделирования.
Особый класс задач в научных исследованиях, особенно в последнее время в области химии,
биологии, медицины, представляют так называемые вычислительные эксперименты, в ходе которых
«новые знания» получаются на основании объемных расчетов на математических моделях, что приводит
к существенному ускорению всего цикла исследований и разработок. Для вычислительных
экспериментов, в которых наряду с большими объемами вычислений возможна параллельная обработка
данных, существуют специализированные компьютерные системы – вычислительные кластеры.
136
Кластеры строятся путем объединения нескольких вычислительных узлов (nodes), обычно
двухпроцессорных, специальной высокоскоростной межпроцессорной коммуникационной средой,
решаемая задача распараллеливается на все имеющиеся (или заданные) узлы, а общий результат
собирается, например, на управляющей машине.
В работе представлен опыт сотрудничества авторов с научными центрами Российской академии
наук и Российской академии медицинских наук по построению кластерных систем для вычислительных
экспериментов, расчетов, поисков в базах данных в ходе научных исследований и разработок в области
химии, биологии, медицины.
Кластерные вычислительные комплексы характеризуются ключевыми компонентами, их функциями
в составе системы, общими особенностями всей системы, достоинствами и ограничениями применения.
Основные компоненты кластерного комплекса: вычислительные узлы, управляющая машина, среда
межпроцессорного обмена, управляющая сеть, операционная система, библиотеки параллельных
вычислений, прикладные программы, важным внешним компонентом всей системы является система
контроля климата или кондиционер.
Сравнение процессорных архитектур AMD и Intel и их тестирование для вычислительных и
параллельных задач дает возможность утверждать о преимуществе технологий AMD Athlon MP, Opteron
на данном этапе технологических разработок:
 для процессоров Athlon MP – это, прежде всего, лучшие показатели цена/производительность;
 для процессоров Opteron – это, в первую очередь, возможность работы как с 32-х, так и с 64битными приложениями.
Сравнение характеристик сред межпроцессорного обмена проведено для трех основных продуктов
как на уровне технических паспортных данных, так и на реальных тестах, собственном опыте установки и
эксплуатации оборудования, выяснении его влияния на процессы вычислений: Gigabit Ethernet, Myrinet,
SCI.
Очень важной составляющей построения кластерного комплекса является установка и тонкая
настройка операционной системы, библиотек параллельных вычислений и прикладного ПО для
конкретных пользовательских задач, проведение тестирования разных уровней производительности,
включая производительности коммуникационной среды, по тесту Linpack, при решении прикладных
задач. Для этого требуется высокий уровень специальной подготовки собственного специалиста, либо
поставщика кластерных систем. Такая работа обеспечивает оптимизацию работы вычислительной
системы в целом, повышает ее производительность, а, следовательно, дает дополнительные выигрыши
пользователю. В ряде случаев в ходе работы над проектами удается проводить тестирование
достаточно мелких компонентов кластера, например, сетевых карт разных производителей, однако и
такие затраты и усилия приносят свои плоды: было выяснено, что для задач института биоорганической
химии карты производителя SMC Networks дают лучшие и значимые результаты, чем карты более
известной и популярной компании 3Com.
Реализовав в 2003 году четыре кластерных проекта, проведя ряд тестовых экспертиз и выполнив
весь цикл работ для институтов РАН – институт биоорганической химии (24 и 32 AMD CPU) и центр по
химии лекарственных средств (8 AMD CPU), и РАМН – институт биомедицинской химии (32 AMD CPU),
компания “ДАТА Технологии” накопила опыт проектирования, установки, настройки и сопровождения
кластерных систем для научных исследований. В настоящее время этот опыт уже востребован на стадии
проектов еще для ряда научно-исследовательских институтов, в том числе в других регионах Российской
Федерации, наряду с Москвой.
Авторы, представляя собственный опыт построения кластеров, сопоставляют его с опытом других
российских организаций, представленных на сайте http://www.parallel.ru Лаборатории Параллельных
Информационных Технологий НИВЦ МГУ, и зарубежным опытом на основании TOP500 – самых мощных
суперкомпьютерных систем в мире.
С точки зрения авторов кластерные системы имеют хорошие перспективы развития и использования
для вычислительных и параллельных задач в научных, а также инженерных расчетах, что
подтверждается и мировым, и российским, и собственным опытом, как с точки зрения интересов и задач
пользователей, так и с точки зрения развития технологической базы таких систем.
Кластерные системы, являясь альтернативой более дорогим SMP-серверам, обладают рядом
конкурентных преимуществ: лучший показатель цена/производительность, высокая вычислительная
производительность, возможность параллельных вычислений, хорошая гибкость и масштабируемость
системы, возможность сочетания в системе узлов с разной частотой процессоров (что не допустимо в
SMP-системах). Стоимость кластерных систем может корректироваться с учетом финансовых ресурсов и
технических требований заказчика при работе с российскими компаниями, которые обладают
соответствующим опытом сборки, поставки, настройки и сопровождения таких комплексов, а также за
счет выбора альтернативных конкурентных компонентов.
137
ОСОБЕННОСТИ КОМПЬЮТЕРНОГО КОНТРОЛЯ УРОВНЯ ЗНАНИЙ
СТУДЕНТОВ
С.И.Чумаченко, В.М.Крылов
Московский государственный университет леса, Мытищи Московской обл.
Тел.: (095) 588 – 59-80, e-mail: [email protected]
Контроль уровня знаний студентов следует считать двуединым объектом приложения творческих
усилий преподавателя. С одной стороны, контроль – это объект практической деятельности лектора
дисциплины; с помощью контроля выявляются достоинства и недостатки выбранных методов обучения.
С другой стороны, контроль – это объект для научно-исследовательской деятельности
преподавателя, так как в процессе контроля устанавливается взаимосвязь между достигнутым и
планируемым уровнем знаний студентов, получается объективная информация для принятия решений
по управлению процессом образования; анализ результатов контроля в разных группах и различными
преподавателями позволяет усовершенствовать дидактическую систему тестирования обучаемых в
соответствии с особенностями циклов дисциплины.
Часто высказываемые преподавателями мнения о строгой необходимости при контроле знаний
непосредственного (очного) общения со студентами приводят к следующим рассуждениям.
Процесс формирования объективной с точки зрения преподавателя оценки уровня знаний студента
в действительности осуществляется очень индивидуализировано и, по сути, субъективно. При этом
критерии оценивания уровня знаний обучаемого у каждого преподавателя базируются на степени
компетентности в предметной области, на личном педагогическом опыте, владении методиками
психологической диагностики достигнутого уровня качества знаний и потенциальных творческих
способностей студентов.
Кроме того, каждый преподаватель вуза обладает индивидуальными представлениями таких
характеристик личности студентов, как дисциплинированность, требовательность, работоспособность,
исполнительность, ответственность, инициативность, активность, способность к НИР и техническому
творчеству.
На выставляемые преподавателями оценки влияют также эмоциональная стабильность
(нестабильность) тестируемых, сдержанность (экспрессивность), уверенность в себе (неуверенность),
смелость (робость), развитое воображение (неразвитое), реалистичность суждений, стрессоустойчивость
(не уверенность в себе, тревога), умение ясно излагать мысли, критическая способность ума, гибкость и
оригинальность мышления, способность к анализу и синтезу знаний и др.
Не следует сбрасывать со счетов и эмоциональную составляющую процесса принятия решения
преподавателем об истинном уровне знаний. Она выражается в следующих факторах – внешний вид
тестируемых, предыдущий опыт общения с конкретными студентами, поведение при подготовке к сдаче
экзамена (зачета), степень коммуникабельности, культура речи, воспитанность, тактичность, скромность,
самокритичность.
При наличии перечисленных выше обстоятельств непосредственное общение преподавателей со
студентами затруднительно, практически невозможно рассчитывать на сопоставимость, объективность,
обоснованность, точность, и, следовательно, невысокое качество процесса оценивания уровня знаний
обучаемых гарантировано.
Указанные характеристики качества процесса оценивания уровня знаний студентов достигаются при
использовании новых технологий компьютеризированного контроля. Основой новых технологий
компьютеризированного контроля усвоения знаний являются специально создаваемые тестовые
программы, включаемые в мультимедийные автоматизированные обучающие системы (МАОС). МАОС
представляет собой программно-инструментальные средства предъявления студентам учебного
материала и различных видов дидактического контроля (текущего, тематического, рубежного, итогового).
Мультимедийный характер обучающих систем (комплексов, оболочек) позволяет в полной мере
использовать в учебном процессе познавательные возможности интерактивных компьютерных
графических образов (ИКГО) – трехмерных графических иллюстраций, видеосюжетов со звуковым
сопровождением, анимационных моделирующих программ.
Объективность оценивания уровня знаний с помощью тестирующих модулей МАОС или учебнометодических комплексов (УМК) гарантируется тем, что исключаются все упомянутые выше факторы,
порождающие субъективизм традиционных непосредственных технологий контроля знаний.
Обоснованность и точность тестирования достигается репрезентативным (представительным)
отображением требований государственных образовательных стандартов в содержании блоков
контрольных вопросов, заданий, упражнений. Объемы тестирующих модулей в несколько раз
превышают традиционные (очные) блоки контролирующих вопросов, так как не лимитируются
интервалами времени (0,5 час./чел. – экзамен; 0,2 час./чел. – зачет; 2,25 час./чел. – курсовая работа).
Кроме того, в ходе экзаменационной сессии сплошные вопросы и упражнения заменяются
выборочными, а тесты УМК и МАОС позволяют включать задания на все разделы курса.
Только профессионально спроектированные тестирующие модули обучающих комплексов дают
возможность осуществить корректную аттестацию уровня знаний студентов и качества учебных
процессов в разных учебных группах или образовательных учреждениях с разными преподавателями.
138
Использование в дистанционных образовательных технологиях автоматизированных обучающих
систем (АОС) с тестирующими программно-инструментальными средствами расширяет диапазон
функций дидактического контроля и существенно активизирует роль каждой из них.
К числу основных функций контроля знаний студентов заочной формы обучения традиционными
(неопосредованными ИКТ) способами относят контролирующую, обучающую, воспитательную,
развивающую.
Появление тестирующих программно-инструментальных средств расширяет перечень функций с 4
до 8 путем введения мотивирующей, диагностической, прогностической и аттестующей (внешней
проверяющей качество работы преподавателя).
Мотивирующая функция наиболее близко соприкасается с воспитывающей функцией контроля и
проявляется в развитии таких позитивных качеств личности студентов, как интерес к изучаемой
дисциплине, умение систематически усваивать требуемый объем знаний, совершенствовании навыков
самоконтроля и самооценки.
Каждая оценка, особенно неудовлетворительная, полученная при очном общении с
преподавателем, воспринимается студентом как выражение субъективного отношения к достигнутому
уровню знаний. Несправедливо низкие оценки, вероятность появления которых очень подробно
рассмотрена выше, приводят к нежеланию изучать данный предмет, к конфликту с преподавателем и,
естественным образом, снижают мотивацию к учебному процессу в целом. При тестировании знаний
методом дистанционных образовательных технологий (АОС, УМК) используются стандартные средства
проектирования тестирующих модулей, личное участие преподавателей сведено к нулю. В силу этого из
процесса контроля исключаются элементы субъективизма оценивания уровня знаний студентов и
создаются дополнительные стимулы у обучаемых к освоению профессиональных умений и навыков.
Активизация роли диагностической функции контроля при реализации ДОТ обусловлена
возможностью более глубокого и продолжительного текущего тестирования, своевременного выявления
пробелов в изучении дисциплины и оперативного принятия управляющих воздействий по изучению
данного предмета.
Перманентный текущий контроль (диагностика) уровня знаний студентов по отдельным дисциплинам
является важнейшим условием повышения качества всего учебного процесса.
Возможности детального анализа успешности и затруднений усвоения знаний по предлагаемым
преподавателями рабочим программам открывает перспективы индивидуализации учебных планов,
адаптации их к конкретным студентам и условиям разных форм обучения, что в итоге ведет к
дифференциации образовательных программ, сокращению сроков подготовки специалистов и
повышению качества учебного процесса.
Особенно эффективен диагностический контроль в заочной форме обучения. Из-за лимита времени
в традиционных методах диагностирования практически недоступной оказывается проверка всех трех
уровней усвоения содержания дисциплины: запоминание (воспроизведение) знаний, применение их в
типовой ситуации и использование знаний в нестандартных, незнакомых случаях.
Компьютеризованные обучающие диагностические системы, связывая воедино обучение и контроль,
производят своевременную коррекцию процесса усвоения студентами новых знаний с помощью
подсказки, предъявления образцов выполнения заданий, подробного повторения теоретического
материала, ссылок на разделы в смежных дисциплинах.
Участие преподавателей при такой технологии реализации учебного процесса полностью не
исключается. При возникновении неустранимых с помощью перечисленных выше способов коррекции
учебного процесса студент нуждается в консультации преподавателя и получает ее после обращения в
ЦДО МГУЛ в определенные расписанием строки.
Прогностическая функция контроля в комплексных сетевых кейсовых (КСК) технологиях позволяет
определить потенциальные возможности студентов при освоении нового материала дисциплины.
Косвенное подтверждение наличия способностей к усвоению нового материала содержится в
результатах произведенного контроля знаний. Однако точное прогнозирование вероятности успешного
усвоения нового знания традиционными методами контроля невозможно.
Для таких целей используются специальные тестирующие модули, прогностическая валидность
которых подтверждается специальными количественными методами. На обычном очном экзамене
преподаватель фактически сам оценивает качество своей работы. В подавляющем большинстве случаев
эта процедура осуществляется преподавателями вполне добросовестно и на высоком качественном
уровне.
Тестирующие компоненты проектируются под руководством и непосредственном участии самих
лекторов. Однако ответственность, которую они при этом обязаны проявить, несравненно выше.
Учебно-методические комплексы, содержащие тестирующие модули, предназначаются для
использования в информационно-образовательной среде открытого образования (ИОС ОО МГУЛеса) и
проходят многоступенчатую экспертизу (кафедра, учебно-методическое управление университета, УМО
по образованию в лесном деле).
На сайте лесотехнического виртуального университета (http://www.forest.openet.ru) представлен
интегральный каталог УМК, используемых преподавателями университета в учебных процессах всех
форм обучения, в том числе в рамках кейсовых и комплексных кейсово-сетевых технологий
применительно к полным (6-летним) и ускоренным (4-летним) учебным планам заочного обучения.
Среди входящих в каталог УМК высоким качеством отличается компьютерная обучающая система
«физические основы и технические средства дистанционного зондирования лесов» (авторы: Сухих В.И.,
139
Чумаченко С.И., Жирин В.М., Шаталов А.В., Мельников Ю.Н.), УМК по Дендрологии (Раздайводин А.Н.),
Систематика растений (Чернышенко О.В., Шкаринов С.Л., Загреева А.Б., Чумаченко С.И., Ульянов Е.В.,
Радаев А.Н., Маркеева Л.В.) и др. Отраслевым фондом алгоритмов и программ государственного
координационного центра информационных технологий выдан ряд авторских свидетельств на
программное обеспечение УМК. Авторами ПО УМК являются: Бурков В.Д., Потапов В.Т., Чумаченко С.И.,
Азаров А.В., Удалов М.Е., Мельников Ю.Н.
ОБ ОДНОМ МЕТОДЕ АНАЛИЗА И ОЦЕНКИ ЭФФЕКТИВНОСТИ
АЛГОРИТМОВ
В.С.Любченко
ООО Специальное конструкторское бюро "Локальные автоматизированные
системы", Новочеркасск
Тел.: (09244) 2-34-36, e-mail: [email protected]
Скорость – важная оценка эффективности алгоритма. Но, к сожалению, не всегда ее можно узнать.
Например, из-за длительной работы программы или, наоборот, из-за погрешности таймера. Но еще
больше проблем с ее расчетом, т.к. вывести формулу расчета времени порой много сложнее, чем
создать сам алгоритм.
Подобные проблемы и их решение наглядно и удобно показывать на примере алгоритмов
сортировок. Далее мы рассмотрим метод, позволяющий объективно оценить эффективность не только
любого алгоритма сортировки, но и вообще любого алгоритма любой сложности.
Расчетное время – это, как правило, работа алгоритма в некотором абстрактном времени. Его в
случае сортировок оценивают, например, числом операций сравнения или пересылок [1]. При этом связь
с реальным временем выражается коэффициентом, учитывающим быстродействие реальных
процессоров (среды реализации).
Для некоторых из хорошо изученных алгоритмов сортировок формулы для расчета времени
известны. В соответствии с ними алгоритмы классифицируют на простые – «квадратичные» и
усовершенствованные – «логарифмические».
Но расчет по формуле весьма приблизителен [1]. Далее мы рассмотрим, как можно получить
гораздо более точную оценку эффективности алгоритма (программы). В его основе модель, включающая
в себя модель реального времени. Последнее позволяет точно определить абстрактное (модельное)
время работы алгоритма. А уже оно – реальное время его работы.
Конечный автомат (КА) – модель, обладающая нужными качествами. Известна процедура
построения эквивалентного автомата для любой блок-схемы (БС). Она аналогична процедуре
построения эквивалентного автомата для любой граф-схемы алгоритма (ГСА) [2].
В табл. 1 представлены результаты тестирования наиболее известных сортировок – пузырьковой,
Шелла и быстрой сортировки. Сортировки представлены в двух формах, где первая форма – БС-модель,
представляющая собой их реализацию на языке С++ [3]. Вторая форма – КА-модель. Это эквивалентные
сортировки, реализованные в рамках КА-технологии [4,5].
Табл.1.
Пузырьковая
сортировка
Сортировка
Шелла
Быстрая
сортировка
N
N2
T (100)
dT(100)
N1.2
T(1000)
dT(1000)
n*log(n)
T(10000)
dT(10000)
10
100
141
747189
15.85
625
2973341
23,03
297
2854277
Ci
1.41
7471,9
39,4
187593
12,896
123937
30
900
1281
6717068
59.23
5500
26100850
102,04
969
8828246
расчет
%
1269
6724710
0,1
0,1
2334
11111133
135
135
1315,4
12646531
26
30
40
1600
2250
11955905
83.65
9765
45915073
147,56
1297
11922647
расчет
%
2256
11955040
0,3
0,0
3296
15692154
196
193
1902,9
18218739
32
35
Таблица включает стоимость вычислений, рассчитанную по формуле; реальное – T и абстрактное –
dT время работы алгоритмов. Размерность сортируемых массивов данных пропорциональна n
(коэффициент пропорциональности указан в скобках). В таблице приведен коэффициент Ci,
определяющий соотношение между реальным и модельным, т.е. автоматным временем. Он рассчитан
для n=10. Расчетное время представлено в колонке «расчет». Рядом приведен процент ошибки расчета.
Тестирование подтверждает, что эффективность, особенно усовершенствованных сортировок,
оценивается по формулам с ошибкой (см. табл. 1). Можно ли сделать расчет более точным?
Можно, если на некотором наборе данных знать точное абстрактное время работы эквивалентного
автоматного алгоритма и реальное время обычного. Это позволит рассчитать коэффициент,
характеризирующий среду реализации. А, зная его и абстрактное время работы алгоритма на другом
140
наборе данных, уже легко рассчитать и более точно соответствующее реальное время работы исходного
алгоритма.
Аналогично можно решить и обратную задачу: по реальному времени работы обычного алгоритма
рассчитать реальное время работы его модели. Это необходимо, если модель является базовой для
вычислений. Решить данную задачу можно, рассчитав реальную длительность единичного отрезка
модельного времени на основе абстрактного времени работы модели. Первое можно рассчитать, зная
реальное и абстрактное время работы автоматной модели на каком-то массиве данных, второе, – зная
коэффициент соотношения между реальным временем обычного алгоритма и абстрактным временем
модели. Все эти вопросы разрешаются в процессе тестирования.
В таблицах 2, 3 и 4 представлено реальное время и его расчет (строки, помеченные символом «р»)
для разных сортировок. Видно, что погрешность расчета не превышает единиц процентов. Причем
большая погрешность для быстрой сортировки объясняется погрешностью таймера при малом времени
работы алгоритма. Поэтому, например, использование массива размерностью 200000 элементов в
качестве эталона повысило бы точность расчетов.
Табл. 2. Пузырьковая сортировка
N
T
T(р)
dT
dT(р)
FSA
FSA (р)
1000
141
Ci
747189
5299,213
1734
12,29787
2000
578
568
3011070
3062945
7078
7108
%
3000
1281
1268
6717068
6788292
15578
15754
1,8
1,7
0,4
%
4000
2250
2256
11955905
11923229
27969
27670
1
1
1,1
%
0,3
0,3
1,1
Табл. 3. Сортировка Шелла
N
T
T(р)
DT
dT(р)
FSA
FSA (р)
10000
625
Ci
2973341
4757,3456
6828
10,9248
20000
2484
2470
11750467
11817246
27234
27137
%
0,6
1
0,4
30000
5547
5486
26100850
26388996
60078
60600
%
1,1
1
1
40000
9781
9651
45915073
46531597
106578
106855
%
1,3
1,3
0,3
Табл. 4. Быстрая сортировка
N
T
T(р)
dT
dT(р)
FSA
FSA (р)
100000
297
Ci
2854277
9610,360
10328
34,77441
200000
625
622
5980867
6006475
20922
21734
%
0,0
0,4
3,9
300000
953
919
8828246
9158673
30782
33140
%
3,7
3,6
7,1
400000
1297
1241
11922647
12464637
41360
45102,4
%
4,5
4,4
8,3
Мы рассмотрели метод расчета оценки эффективности алгоритмов, который точнее аналитического
метода (расчет по формулам). Аналитический расчет нагляден (ср. «квадратичные» и
«логарифмические» сортировки). С его помощью, хотя и грубо, но быстро, можно рассчитать
предполагаемую скорость вычислений (см. также [6]). «Модельный метод» не столь нагляден и,
возможно, не так быстр, но гораздо точнее. В то же время, его наглядность можно улучшить, построив по
результатам тестирования/расчета аналитическую зависимость.
Заметим, что применение автоматной модели не ограничивается рамками моделирования
алгоритмов с целью оценки их эффективности. Часто быстродействие виртуальной автоматной машины
не является преградой на пути решения задачи (например, для сортировки малых массивов). В
подобных случаях КА имеет самостоятельное значение в силу наличия множества преимуществ перед
БС. Например, возможно создание принципиально новых алгоритмов – параллельных. Эксперименты с
параллельными сортировками убеждают в возможности значительного роста эффективности
алгоритмов. Для тех же сортировок более чем на порядок (даже в сравнении с быстрой сортировкой).
Литература
1. Вирт Н. Алгоритмы и структуры данных: Пер с англ. – М.:Мир, 1989. – 360 с.
2. Баранов С.И. Синтез микропрограммных автоматов. -Л.: Энергия, 1979. -232с.
3. Шилдт Г. Теория и практика С++: Пер. с англ. – СПб.: BHV – Санкт-Петербург, 1999. – 416 с.
4. Любченко В.С. Автоматные схемы программ. http://www.softcraft.ru/auto/ka/ash/ash.shtml
5. Любченко В.С. Конечно-автоматная технология программирования.
http://www.softcraft.ru/design/katech.shtml.
6. Томас Ниман. Сортировка и поиск: Рецептурный справочник. / Перевод с английского: П.Н.Дубнер.
http://www.codenet.ru/progr/alg/sort_search.
141
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ: ПРОЕКТЫ И ПОДГОТОВКА
СПЕЦИАЛИСТОВ
Л.В.Городняя, Н.А.Калинина
Новосибирский государственный университет
Тел.: (3832) 34-14-70, 39-78-14, e-mail: [email protected], [email protected]
На сегодняшний день резко возрастает разнообразие, объем прикладных систем и потенциал
информационных технологий, способствующих повышению эффективности фундаментальных
исследований в разных областях науки.
В то же время многие крупные центры и университеты выражают обеспокоенность отрывом практики
разработки и применения информационных систем от результатов научных исследований в области
компьютерных наук и высокопроизводительных информационных систем (ИС). Возрастает
заинтересованность в исследовании и понимании эволюции парадигм информатики как со стороны
различных наук, связанных с применением компьютерных средств, так и со стороны образования.
В настоящей статье анализируются и предлагаются перспективные варианты эффективной
организации ряда ИС, направленных на поддержку фундаментальных исследований в таких
направлениях, как теория и практика системного программирования, средства и методы организации
вычислений и системы компьютерной алгебры.
Совершенно неудивительно, что существует достаточно много информационных систем [1-4], и
число их постоянно растет, предоставляющих полную техническую информацию по большинству
реально используемых компьютерных средств и их программному обеспечению. Основная трудность при
изучении такой информации – ее колоссальный объем. В качестве другой трудности следует отметить
тенденцию одноуровневого изложения технических подробностей, в котором трудно отделить основное
от второстепенного. Нередко и стиль изложения таких материалов оставляет желать лучшего. В
практике преподавания многие научные работники создают краткие материалы, представляющие
основные концепции и важные идеи в явной форме, доступной пониманию студентов и педагогов, что
можно назвать образовательным подходом к поддержке и развитию ИС. Анализ и упорядочение таких
материалов с последующей интеграцией в некотором общем информационном банке может
существенно повысить качество подготовки научных кадров.
В рамках данной статьи в понятие «проект» вкладывается следующий дополнительный смысл.
Понятие «проект» понимается и как метод организации работ, время выполнения которых существенно
превышает среднее время участия в них большинства разработчиков проекта.
Число исследователей, использующих компьютерные средства при проведении вычислительных
экспериментов, быстро растет. В первую очередь, информатики активно разрабатывают, исследуют и
совершенствуют
средства
и
методы
построения
новых
эффективных,
надежных
и
высокопроизводительных программных систем. Многие категории научных работников могут
существенно повысить эффективность фундаментальных исследований с помощью информационной
системы, приспособленной к накоплению и использованию знаний области теории программирования,
разработки и применения языков и систем программирования, средств и методов программирования и
разработки экспериментальных и учебных информационных систем по информатике.
В сравнении с известными близкими работами настоящий проект нацелен на преодоление
избыточной сложности освоения современных информационных комплексов посредством проявления
базовых идей и унификации средств манипулирования с разнородной информацией.
Информационные технологии дают уникальную, еще не освоенную возможность, интеграции
научного знания и организации новых форм научной работы. Мы полагаем, что будет целесообразно
провести ряд экспериментов такого рода на материале фундаментальных исследований в области
информатики.
Создание такой системы позволит обеспечить свободный доступ через Интернет к научным
ресурсам современных фундаментальных исследований на примере интеграции информационнообразовательных технологий, используемых при обучении информатике и программированию, включая
освоение теории программирования и обучение методам разработки экспериментальных программных
систем. В частности, возможно обеспечение консультационного сервиса и предоставление удаленного
доступа для учебных работ по методам применения и разработки информационных средств.
При разработке и применении системы используются средства и методы функционального и
трансформационного программирования и современные web-технологии, а также средства и методы
проектирования и конструирования открытых систем.
Основными источниками данных для системы являются проверенные временем научные
публикации, материалы конференций и экспериментальных проектов, а также разработка основных,
альтернативных и специальных курсов лекций, поставленные в рамках специализации по информатике
студентов, магистрантов и аспирантов. Подобные с технической точки зрения системы используются при
документировании и сопровождении свободно распространяемых программных средств для
международной кооперации квалифицированных программистов-любителей. Но в таких системах
практически отсутствует обучающий компонент.
Актуальность проекта связана с высоким темпом эволюции информационных систем, быстрым
ростом их производительности и объема справочной информации, опережающим возможности
традиционной системы образования. Достижение уверенного понимания их функционирования требует
142
большого труда, что усложняет формирование образовательного процесса в области информатики даже
для научных работников.
В последние годы многие специалисты отмечают кризисные явления на стыке теории и практики
совершенствования систем информатики. Многие задачи, подход к которым ранее требовал серьезного
знания теории, теперь допускают лобовые решения благодаря использованию сложных
информационных систем на базе мощных компьютеров. В результате провоцируется наращивание
мощностей без адекватного роста результатов. Используя информационные технологии, информатикиисследователи активно осваивают новые классы задач. В предлагаемой системе предполагается
накапливать представления алгоритмов и схем принятия решений, положенных в основу
функционирования компьютерных средств и информационных систем, а также приемы их реализации и
рецепты работы с конкретными информационными системами. Информационные технологии дают
уникальную, еще не освоенную возможность научной кооперации и организации новых форм
взаимообучения, а главное – встраивания этого знания в образовательный процесс.
Прикладные и фундаментальные аспекты информатики в комплексе с систематизацией научного
знания и обобщение сведений по применению информационных технологий в научной работе
составляют основу наполнения информационной среды ИНФ-ФАБУЛА. Основными источниками данных
для системы являются доступная через Интернет научная и техническая информация, научные
публикации, материалы конференций и экспериментальных проектов, а также основные,
альтернативные и специальные курсы лекций, поставленные в рамках специализации студентов,
магистрантов и аспирантов.
Существует много развитых информационных систем, поддерживающих фундаментальные
исследования в области точных наук. Почти любая идея повышения эффективности труда научных
работников имеет некоторую реализацию в ряде систем. Основная проблема применения таких систем –
колоссальный объем информации, которую необходимо изучить для того, чтобы рационально
организовать автоматизацию информационной обработки. Другая проблема – необходимость
формирования новых навыков работы при переходе к изучаемой системе без уверенности, что эти
навыки пригодятся. Большое внимание в среде ИНФ-ФАБУЛА уделяется компьютерной алгебре.
Наличие развитых систем компьютерной алгебры (СКА) требует значительной переориентации
учебного процесса. Преподавание многих учебных курсов может стать значительно эффективнее, если
активно использовать возможности автоматического проведения трудоемких алгебраических выкладок.
В мире существует определенное количество интернет-сайтов, посвященных символьным вычислениям.
Опыт Новосибирского государственного университета охватывает собой как использование СКА в
качестве инструмента обучения для профессиональной подготовки программистов, так и использование
СКА в общих математических курсах. На кафедре программирования НГУ читается спецкурс «Системы и
языки компьютерной алгебры». Он включает в себя рассмотрение архитектуры системы, организацию
внутренних структур данных и базовых алгебраических алгоритмов СКА. В этом курсе рассматриваются
также методы применения, реализации и определения языков и систем компьютерной алгебры, как
ранних, так и сложившихся в практике развития таких систем. Изучаются типовые конструкции языков
компьютерной алгебры и особенности их реализационной семантики. От студентов требуется общее
представление о средствах и методах определения языков программирования, например, из курса
методов трансляции или дискретной математики, знание более чем двух языков программирования.
И, наконец, к разработке активно привлекаются студенты, специализирующиеся в области
информатики. Участие в коллективных проектах поможет им приобрести базовые навыки в
конструировании современных информационных систем. Наличие подобных информационных систем
позволит внести ощутимый вклад в распространение в применение новых технологий, в том числе
использования СКА как в учебном процессе, так и в фундаментальных исследованиях. Работа с
подобными информационными системами будет способствовать совершенствованию информационных
технологий научной деятельности, в частности, выделению универсальных систем информатики для
фундаментальных исследований в различных областях знаний.
Работа поддерживается грантами РФФИ № 02-07-90431 и 04-07-90429.
№ 00-07-90322.
Литература
1. Foundations of Intelligent Systems.//LNCS 1325, Springer, 1997, 630 p.
2. Intelligent Tutoring Systems. //LNCS 1452, Springer, 1998, 629 p.
3. Городняя Л.В. Парадигмы программирования в профессиональной подготовке информатиков.
//Проблемы специализированного образования. Новосибирск, 1998. – с. 115-124.
4. Kalinina N.A.,Gorodnjaja L.V. Computer algebra and Functional programming in mathematics education.
In 6-th IMACS International IMACS Conference on applications of computer algebra. June 25-28, 2000, p.55.
143
МОДЕЛЬ ВЫЧИСЛЕНИЙ STILP
И.В.Кульков, О.С.Кулькова, В.С.Князьков
Пензенский государственный университет
Тел.: (8412) 40-64-42, e-mail: [email protected]
Долгое время рост производительности микропроцессоров достигался исключительно экстенсивным
способом: за счет увеличения тактовой частоты процессора и количества транзисторов на кристалле.
Однако по оценкам ведущих мировых производителей, в скором времени будет достигнут максимум
возможной производительности микропроцессоров при использовании современного технологического
процесса [6], что определяет задачу радикального изменения технологического процесса производства
микропроцессоров, и разработки новых, более эффективных архитектур [2].
Современные микропроцессорные архитектуры далеки от совершенства и оставляют широкие
возможности для улучшения за счет новых моделей вычислений. Основной парадигмой развития
микропроцессорных архитектур является параллелизм. В последнее время особо широкое
распространение приобрели архитектуры процессоров, обеспечивающие параллелизм на уровне
инструкций (ILP – Instruction Level Parallelism) или параллелизм на уровне потоков исполнения (TLP –
Thread Level Parallelism).
Модель вычислений ILP основана на параллельном исполнении отдельных процессорных операций.
Эта модель позволяет существенно увеличить производительность вычислений при исполнении
программ, насыщенных большим количеством разнообразных операций, равномерно распределенных
по коду программы. Типичными представителями этой модели являются архитектуры микропроцессоров
со сверхдлинным командным словом (VLIW – Very Long Instruction Word), процессоров с архитектурой
явного параллелизма команд и суперскалярная архитектура, постепенно сдающая свои позиции под
натиском VLIW [4].
Модель TLP предполагает, что для каждого из исполняемых потоков организуется отдельный
контекст исполнения на уровне микропроцессора. Таким образом, задержки в исполнении одного из
потоков сглаживаются за счет переключения микропроцессора на исполнение другого потока.
Разновидностью данного подхода является архитектура одновременной многопоточности (SMT –
Simultaneous MultiThreading). В соответствии с этой архитектурой один физический процессор
представляется как несколько функционально законченных логических процессоров [5].
Однако, несмотря на стройность каждой из упомянутых моделей, соответствующие им архитектуры
отличаются «непредсказуемостью поведения». Например, в зависимости от вида рабочей нагрузки
наблюдается значительное падение производительности микропроцессоров, реализованных на основе
архитектур VLIW и SMT. Так как архитектура VLIW нацелена на увеличение производительности одной
задачи и основывается на явном программировании параллелизма, показатель числа команд,
исполняемых за такт (IPC – Instructions Per Cycle), всецело зависит от возможности эффективного
распараллеливания задачи. Таким образом, задача, состоящая в выполнении операций одного типа,
сводит прирост эффективности VLIW-процессора к нулю [3].
При использовании архитектуры SMT можно наблюдать вырождение многопоточного исполнения к
исполнению одного потока, захватившего все ресурсы процессора. С этого момента производительность
процессора полностью зависит от полезности нагрузки потока. Для преодоления подобных трудностей в
реализации процессоров архитектуры SMT (например, процессоры фирмы Intel, поддерживающие
HyperThreading) вводятся специальные команды. Из-за этого данный подход теряет изначально
присущую ему гибкость [1].
В данной работе предлагается модель вычислений, позволяющая в большинстве случаев
преодолеть основные недостатки вышеприведенных архитектур. Предлагаемая модель одновременного
параллелизма потоков и параллелизма команд (STILP – Simultaneous Thread and Instruction Level
Parallelism) базируется на совместном использовании принципов ILP и TLP. Основная парадигма STILP
заключается в инкапсуляции параллелизма потоков внутри параллелизма команд. Как и в ILP, в каждый
момент времени одновременно исполняется несколько процессорных инструкций, но при этом эти
инструкции могут принадлежать различным потокам. Таким образом, модель STILP позволяет избежать
провалов производительности при исполнении плохо параллелизируемых задач и сводит вероятность
захвата ресурсов процессора одним потоком к минимуму.
Архитектуры, реализующие модель вычислений STILP, должны характеризоваться следующими
особенностями:
 Исполняемый код формируется специальным распараллеливающим компилятором и
представляет собой, в простейшем случае, последовательность блоков независимых, способных к
одновременному исполнению, инструкций. В отличие от VLIW не предполагается жесткого
формата командного слова, а формируются блоки переменной длины.
 Исполнение потоков происходит поблочно.
 Непосредственно исполняемые внутренние команды имеют ячеистую фиксированную структуру,
зависящую от номенклатуры и загрузки исполнительных устройств процессора.
 Формирование исполняемых команд выполняется специальным механизмом – генератором
внутреннего кода (ICG – Internal Code Generator).
 ICG формирует исполняемую команду на основе блоков независимых команд исполняемых
потоков. ICG стремится максимально эффективно заполнить слоги непосредственно исполняемой
команды.
144
 Исполнительная часть процессора представляется набором функциональных блоков, каждому из
которых в непосредственно исполняемой внутренней команде соответствует специальный слог
операции.
В зависимости от целей возможна разработка соответствующих данной модели архитектур,
предполагающих как полностью аппаратную, так и программно-аппаратную реализации.
Предполагается, что подобные реализации будут обладать следующими основными преимуществами
модели STILP:
 одновременная параллельность исполнения потоков и параллельность исполнения команд;
 минимальность простоя исполнительных блоков исполнительной части микропроцессора;
 скрытость особенностей конкретной реализации архитектуры от разработчиков программного
обеспечения;
 простота масштабируемости исполнительной части (изменение набора функциональных блоков),
за счет независимости исполняемого кода от структуры исполнительного механизма;
 простота структуры исполнительного механизма, за счет фиксированного формата внутренней
исполняемой команды.
При разработке архитектур, соответствующих модели STILP, необходимо решить вопросы,
связанные с построением эффективного распараллеливающего компилятора, механизма выборки
блоков независимых инструкций потоков и генератора внутреннего кода.
Литература
1. Баулин А. Как вьются нити. //«Мир ПК», №2, 2002.
2. Кузин А. Технологические планы Intel. http://www.3dnews.ru/cpu/intel-tech2003.
3. Кузьминский М. Многонитевая архитектура микропроцессоров. // «Открытые системы», №1, 2002.
4. Лень М. Вайцман И. VLIW старая архитектура нового поколения. http://www.ixbt.com/cpu/vliw.shtml.
5. Немнюгин С.А., Стесик О.Л. Параллельное программирование. – СПб.: БХВ-Петербург, 2002.
6. Ященко А. Производство CPU. Планы на 2003-2007-й год. http://www.3dnews.ru/cpu/cpuroadmap/index03.htm.
ПРИМЕНЕНИЕ ТЕХНОЛОГИИ СЕРВЛЕТОВ ДЛЯ АДМИНИСТРИРОВАНИЯ
РАСПРЕДЕЛЕННОЙ ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНОЙ СИСТЕМЫ
С.А.Кипрушкин, С.Ю.Курсков, Н.Г.Носович
Петрозаводский государственный университет
Тел.: (8142) 71-10-25, 71-10-00, e-mail: [email protected]
Целью данной работы является реализация механизма администрирования распределенной
информационно-измерительной системы, обеспечивающей удаленный доступ к информационным и
техническим ресурсам в сетях на базе стека протоколов TCP/IP и предназначенной для поддержки
научно-образовательного процесса в области оптической спектроскопии [1-3].
На аппаратном уровне система представляет собой комплекс автоматизированных рабочих мест,
объединенных компьютерной сетью. Ключевым звеном системы является коммуникационный сервер, в
задачи которого входит поддержка многопользовательского режима, корректное распределение
ресурсов между клиентами, мониторинг системы и обеспечение безопасности. Другими компонентами
системы являются серверы оборудования (КАМАК-сервер, сервер канала общего пользования (КОП),
сервер доступа к микроконтроллерам MCS-96) и программы-клиенты, осуществляющие сбор, накопление
и обработку информации, а также управляющие ходом эксперимента. Подчеркнем, что программы,
управляющие экспериментом, выполняются не на удаленном компьютере (как при использовании Webтехнологий), а на пользовательском, который связан с системой через глобальную сеть. Программное
обеспечение системы написано на языке Java. Обмен данными между элементами системы построен на
механизме потоковых сокетов TCP, предоставляемом пакетом java.net, входящим в стандартный Java
API.
В открытом режиме система работает следующим образом. После запуска коммуникационный
сервер считывает информацию о доступных серверах оборудования из конфигурационного файла (IPадрес, номер порта, псевдоним). Далее последовательно устанавливаются постоянные соединения с
серверами оборудования. Сервер, с которым соединение не было установлено, помечается как
недоступный в данный момент. Попытка установления связи с ним будет повторена при обращении к
нему любого клиента. После инициализации серверов оборудования коммуникационный сервер
переходит в режим ожидания связи с клиентами. При установлении связи сервер генерирует
параллельный процесс обслуживания клиента и присваивает этому процессу уникальный номер CID
(Client ID), не равный нулю. Обмен информацией с клиентом осуществляется в режиме запрос-ответ.
Доступ администратора к коммуникационному серверу осуществляется с помощью стандартного
браузера и Web-сервера. Взаимодействие Web-сервера с коммуникационным сервером реализовано
посредством сервлета. Сервлеты – это модули расширения для Web-серверов с поддержкой Java. В
данной работе сервлет используется для динамической генерации HTML-страниц и организации
145
сетевого обмена с коммуникационным сервером. Сервлет предоставляет администратору как средство
удаленного доступа к системе, так и механизм самого доступа. Отметим, что сервлеты не имеют
графического интерфейса, не зависят от программно-аппаратной платформы системы, обеспечивают
защиту данных (на основе механизмов Java) и реализуют упрощённый доступ к последним. Для
разработки сервлетов используется стандартное расширение Java – Java Servlet API.
Администратор подключается к серверу как обычный клиент, но с паролем в поле "данные" кадра
запроса и указанием длины пароля в поле "ключ", код команды передается в поле "функция". После
проверки пароля данному клиенту присваивается CID, равный нулю, по которому разрешается
выполнение дополнительных функций, таких, как просмотр информации о клиентах и используемых
ресурсах, удаление клиента из системы, а также освобождение ресурса. Отметим, что
коммуникационный сервер не запускает для администратора отдельный поток, а обслуживает его прямо
в классе StartСServer. Таким образом, команды администратора выполняются в основном потоке, что
позволяет управлять дочерними потоками клиентов.
После подключения администратора к коммуникационному серверу и при каждой перезагрузке
сервлета коммуникационный сервер посылает администратору информацию, содержащуюся в классах
MainClientInfo и MainServerInfo. Данные классы содержат методы для запаковки и передачи информации
о клиентах, используемых ресурсах и серверах оборудования. Эта информация, в частности, включает
адрес ресурса, IP-адрес клиента-владельца, уникальный идентификационный номер клиента-владельца
(CID), IP-адрес сервера оборудования; номер порта, на котором сервер оборудования ожидает связи с
клиентом, и его псевдоним. Информация, полученная администратором, выводится в виде таблицы, в
которой имеется форма для работы с клиентами. Форма, например, позволяет посылать команды на
отключение всех клиентов с освобождением ресурсов, приостановку и последующий запуск
работающего клиента, на освобождение занятого клиентом ресурса. После выполнения команды
информация о клиентах и серверах на HTML-странице администратора обновляется.
Отметим, что с помощью сервлетов на Java можно легко конструировать быстро работающие
приложения для серверов, полностью отказавшись от CGI и Perl. К достоинствам сервлетов следует
отнести то, что они могут выполняться на любой платформе без перекомпиляции или модификации.
Сервлеты загружаются только один раз, при этом Web-сервер запускает всего одну виртуальную Javaмашину. Сервлет постоянно находится в памяти и не требует повторной загрузки до тех пор, пока его
содержание не изменится. В случае модификации сервлет может перезагрузиться без перезагрузки
сервера.
Работа выполнена при поддержке Американского фонда гражданских исследований и развития
(CRDF) (проект PZ-013-02) и Министерства образования РФ.
Литература
1. Гаврилов С.Е., Жиганов Е.Д., Кипрушкин С.А., Курсков С.Ю. Архитектура программных средств
исследовательской сети для удаленного управления физическим экспериментом // Научный сервис в
сети Интернет: Тр. Всерос. науч. конф. М.: Изд-во Моск. ун-та, 2001.
2. Гаврилов С.Е., Жиганов Е.Д., Кипрушкин С.А., Курсков С.Ю. Распределенная информационноизмерительная система для удаленного управления экспериментом в области оптической спектроскопии
// Научный сервис в сети Интернет: Тр. Всерос. науч. конф. М.: Изд-во Моск. ун-та, 2002. С. 157-159.
3. Кипрушкин С.А., Королев Н.А., Курсков С.Ю., Хахаев А.Д. Безопасность данных в распределенной
информационно-измерительной системе // Научный сервис в сети Интернет: Тр. Всерос. науч. конф. М.:
Изд-во МГУ, 2003. С. 125-127.
МОДЕЛИРОВАНИЕ ПОЛНОТЫ ОБРАБОТКИ ТЕКСТОВЫХ СООБЩЕНИЙ В
РЕЖИМЕ РЕАЛЬНОГО ВРЕМЕНИ
Р.Э.Арутюнян, Б.А.Телеснин, И.П.Лазуренко
ГНУ НИИ «Спецвузавтоматика», Ростов-на-Дону
Тел.: (8632) 93-28-94, e-mail: [email protected]
Рассмотрим поток текстовых сообщений, поступающий от некоторого источника. Необходимо
производить обработку сообщений в реальном времени, не теряя их. Вместе с тем, аппаратные
возможности вычислительной системы, используемой для решения подобных задач, являются
ограниченными. Таким образом, необходимо с учетом специфики поступающих данных производить
оптимальное распределение вычислительных ресурсов для наиболее оптимальной работы.
Будем считать, что каждому сообщению, поступающему в систему, присвоен приоритет обработки.
Поскольку время и сложность обработки сообщений существенно зависит от их размера, будем далее
рассматривать поток сообщений как поток байтов. Пусть каждое сообщение может быть обработано со
степенями полноты
f1 , f1 ,..., f n , где f 1
– полная обработка, по мере увеличения индексов полнота
уменьшается. Будем считать входящий байтовый поток удовлетворяющим свойствам отсутствия
последействия и ординарности. Будем также полагать, что его интенсивность изменяется относительно
медленно, так что на участках длины очереди данный поток можно считать также и стационарным и, как
146
следствие, простейшим. Обозначим через

интенсивность входного байтового потока, а через
p
–
функцию распределения приоритетов на байтах. При этом считаем, что сами приоритеты принадлежат
сегменту [0,1]. Также пусть
j
Cj
– время обработки одного байта в режиме полноты
– интенсивность j-го потока обработки, соответствующего полноте
время обработки данных, поступивших за время
t , равно
fj.
f j , j  1...n , а
В таком случае среднее
n
  C t . Для оптимальной обработки
j 1
j
j
данных необходимо, чтобы это время не превосходило t , и в то же время было максимально для того,
чтобы обеспечить более полную обработку. Таким образом, имеем следующую задачу оптимизации
n
T    j C j t  max , T  t
или, что то же самое,

j 1
pj
– доля данных, попавшая в
j -ю
интенсивность потока обработки. Условие
категорию полноты,
 
1
n
p jC j

j 1

 max ,    ,
где
можно интерпретировать как
очевидно и означает, что системы должна
обрабатывать данные не медленнее, чем они поступают.
Для определения полноты обработки данных введем пороги полноты, разделяющие значения
приоритетов,
соответствующие
разным
значениям
полноты
обработки,
по
формуле
 j  1  e  aj , j  0..n . Здесь a – порог
p j  P( j 1     j ), j  1..n . Пусть
распределений полноты обработки. Таким образом,
в системе имеется очередь данных, ожидающих
N 0 . Очередь этого размера используется
для расчета статистики обработки. Пусть за время t размер очереди изменился и стал равным N .
Прирост очереди N  N  N 0 вычисляется по формуле N  (   )t . Соответственно, в
новых условиях изменилось и значение порога a . Его новое значение с точностью до малых более
N
высокого порядка равно a  a0  a  (   )  o(   )  a0  a 
. Производная a 
t
 a по формуле
может быть вычислена с условием отличия от нуля производной
обработки. Зададим базовый размер этой очереди, равный
2
 a  
 n

  p j C j 
 j 1


 p 
n
1
2
j 1
j
a
Cj .
Таким
образом
 n

  p j C j 
j 1
 N
a  a0   n
t

p j  a C j
.
Считая
j 1
значения приоритетов данных, хранящихся в очереди, распределенными по некоторому известному
закону (например, нормальному), мы можем рассчитать величины, входящие в формулу для a .
Литература
1. А.В. Аграновский, Р.Э. Арутюнян “Способы индексации и поиска документов в интернет-порталах”.
Труды X Всероссийской научно-методической конференция «Телематика '2003», т.1, с.204-206, СанктПетербург, 2003.
2. Р.Э.Арутюнян “Бинарная классификация документов”, Интеллектуальные и многопроцессорные
системы-2003. Материалы Международной конференции. Т.2. Таганрог: Изд-во ТРТУ, 2003, с. 262–264.
147
СОЗДАНИЕ ВЫЧИСЛИТЕЛЬНОГО КЛАСТЕРА ДЛЯ ПРОВЕДЕНИЯ
КВАНТОВО-ХИМИЧЕСКИХ РАСЧЕТОВ
В.В.Коваль, А.Г.Стариков
Институт физической и органической химии Ростовского государственного
университета, Ростов-на-Дону
Тел.: (8632) 43-44-88, e-mail: [email protected]
Представляемая работа посвящена созданию вычислительного кластера для решения задач в
области квантовой химии. Данная область является одним из научных направлений, в которых
требования к вычислительным ресурсам постоянно возрастают. Введение в эксплуатацию
рассматриваемого в докладе кластера позволило не только проводить вычислительные эксперименты за
более короткий срок, чем на имеющихся компьютерах, но и решать задачи прикладной области более
высокой размерности.
В 2003 г. в Институте физической и органической химии (НИИ ФОХ) создан вычислительный кластер,
состоящий из десяти персональных компьютеров, объединенных гигабитной сетью. В качестве
коммутатора работает свитч HP 2724. Узлы кластера имеют следующие характеристики: Pentium-4
2533 MHz; 1,5 Gb DDR333; 60 GB 7200 rpm, 2 MB Cache HDD; набор логики SiS648. Узлы работают под
управлением операционной системы Linux Redhat 9 с ядром 2.4.20-8.
На кластере и подмножествах его узлов достигнута следующая пиковая производительность по
тесту HPL (High Performance Computing Linpack Benchmark), откомпилированному посредством gcc 3.2.2
с использованием библиотек mpich-1.2.5.2 и ATLAS 3.4.1: на 1 узле – 3,18 Gflops, на 4 узлах – 10,60
Gflops, на 6 узлах – 15,27 Gflops, на 8 узлах – 21,04 Gflops и на всех 10 узлах – 25,73 Gflops.
В качестве прикладного программного обеспечения используются программы Gamess и Gaussian98.
Программа Gamess используется для проведения расчетов как на одиночных узлах, так и в
параллельном режиме. Gaussian98 в настоящее время доступен только для расчетов на одиночных
узлах, ввиду отсутствия в нашем распоряжении библиотек для получения параллельного кода.
При установке прикладного программного обеспечения Gaussian98 был проведен сравнительный
анализ компиляторов. Для этого были использованы следующие компиляторы с языка Фортран: g77 3.2.2
(GNU), PGI 4.1 (Portland Group), ifc 7.1 (Intel). По скорости исполнения бинарного кода последний
компилятор показывает результаты на 30-50% лучше первых двух на программе Gaussian98. Из-за
специфики исходного кода Gamess нам не удалось получить стабильно работающие версии программы
компиляторами PGI и Intel.
Для оценки производительности кластера решалась задача оптимизации геометрии и расчета
силовых констант молекулы сульфаминовой кислоты ограниченным методом Хартри-Фока. Расчеты
проводились в базисе 6-31g(d,p) с учетом энергии электронной корреляции по теории возмущений
Мёллера-Плессета второго порядка (MP2/6-31g(d,p)) и без него (RHF/6-31g(d,p)). Эта задача небольших
размеров (94 базисных функции) позволяет оценить производительность кластера без учета дисковых
операций. Следует отметить, что упомянутые выше методы расчетов используют различные алгоритмы
работы с оперативной памятью. В методе RHF/6-31g(d,p) главный узел кластера распараллеливает
расчет матриц по всем узлам, которые выполняют расчет автономно. При таком методе расчета объем
передаваемой по сети информации невелик. Для параллельного счета по методу MP2/6-31g(d,p) часть
оперативной памяти каждого узла кластера выделяется в общее пользование для создания так
называемой shared memory, что приводит к значительному увеличению загрузки сети и, как следствие, к
уменьшению эффективности использования процессора на каждом узле кластера.
Результаты расчетов и некоторые оценки производительности приведены в табл. 1, 2.
Количество
узлов
Время счета,
сек
1
2
4
6
8
10
343
187
112.5
78
62
54
Загрузка
процессора на
одном узле, %
99,7
95.8
87.1
86.2
87
85
Время счета
на одном узле
/ Время счета
1
1.83
3.05
4.40
5.53
6.35
Время счета
на двух узлах /
Время счета
1
1.66
2.40
3.02
3.46
Время счета на
четырех узлах
/ Время счета
1
1.44
1.81
2.08
Табл. 1. Результаты расчетов по методу RHF/6-31g(d,p) 94basis, Opt+Freq
Как и ожидалось, расчеты с применением этого метода проходят с незначительным падением
загрузки процессора при увеличении числа узлов. В то же время наблюдается снижение эффективности
счета при использовании большего числа узлов. Это может быть объяснено тем, что расчет силовых
констант осуществляется аналитически и плохо поддается распараллеливанию. При проведении
подобных расчетов наблюдается минимальная загрузка сети.
Количество
узлов
148
Время счета,
сек
Загрузка
процессора на
Время счета
на одном узле
Время счета
на двух узлах /
Время счета на
четырех узлах
1
2
4
6
8
10
2453
2039
1190
883
693
579
одном узле, %
/ Время счета
Время счета
/ Время счета
99.7
85.9
73.58
69.73
64.57
59.65
1
1.2
2.06
2.78
3.54
4.24
1
1.71
2.31
2.94
3.52
1
1.35
1.71
2.06
Табл. 2. Результаты расчетов по методу MP2/6-31g(d,p) 94basis, Opt+Freq
В расчетах по методу MP2 отчетливо прослеживается тенденция к уменьшению загрузки
центрального процессора при росте количества узлов. Это является прямым следствием увеличения
объема передаваемой по сети информации. Следует отметить незначительное повышение скорости
счета при переходе от одного процессора к двум. Вероятнее всего, это связано с особенностями
исходного кода.
Как видно из таблиц, использование всех узлов кластера для решения одной прикладной задачи
нерационально. Эффективнее использовать для решения задач малой и средней размерности несколько
подмножеств узлов кластера параллельно (например, производить расчет задач на 4-х и 6-ти узлах).
Вместе с тем, при росте размерности прикладной задачи увеличиваются ее требования к объему
доступной оперативной и дисковой памяти. В этом случае увеличение узлов позволяет решать
принципиально более широкий класс задач.
Главная область применения рассматриваемого кластера – это поддержка научных исследований. В
настоящее время с помощью ресурсов кластера успешно выполняются расчеты систем, содержащих 4050 атомов, 600-700 базисных функций. Для проведения таких расчетов необходимо выделение до 4 Гб
оперативной памяти и до 200 Гб общего дискового пространства. Время счета подобных задач по методу
MP2/6-31g(d,p) достигает 10 суток.
Работа выполнена при финансовой поддержке РФФИ, проект № 02-07-90196.
РЕГИОНАЛЬНЫЙ ЦЕНТР ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ ВЫЧИСЛЕНИЙ
КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ НА БАЗЕ СУПЕРКОМПЬЮТЕРНОГО
ЦЕНТРА РГУ
А.А.Букатов, В.Н.Дацюк, О.В.Дацюк, Г.М.Хачкинаев
Ростовский государственный университет, Ростов-на-Дону
Тел.: (8632) 43-31-85, факс: 43-47-94, e-mail: [email protected]
Суперкомпьютерный центр РГУ создан в 1997 г. на базе многопроцессорной суперЭВМ nCUBE 2S,
приобретенной на средства, выделенные Министерством образования РФ и Администрацией Ростовской
области. В 2000 г. в рамках работ по проектам ФЦП «Интеграция» на базе суперкомпьютерного центра
РГУ был создан учебно-научный центр высокопроизводительных вычислений (ЦВВ). Вычислительные
ресурсы были значительно увеличены в результате приобретения и ввода в эксплуатацию двух мощных
2-х процессорных рабочих станций Compaq DS20E и Sun Ultra 60, и Linux-кластера из 10-ти компьютеров
Pentium III 500 МГц, соединенных сетью Fast Ethernet. В 2003 г. введен в эксплуатацию новый Linuxкластер из 10-ти вычислительных узлов на базе более мощных и современных компьютеров с
процессорами Intel Pentium IV, и более скоростной коммуникационной сетью Gigabit Ethernet. Таким
образом, в настоящее время в состав оборудования центра высокопроизводительных вычислений
входят следующие многопроцессорные вычислительные системы (МВС):
 64-процессорная МВС nCube 2S, с управляющим компьютером SGI;
 Linux-кластер из 10 компьютеров Pentium 4 2.4 GHz;
 двухпроцессорный компьютер Compaq Alpha DS20E;
 двухпроцессорный компьютер Sun Ultra 60.
 учебный Linux-кластер из 6 компьютеров Pentium III 500MHz.
Кроме того, в состав вычислительных систем ЦВВ РГУ входит рабочая станция Sun Ultra 10,
выполняющая функции вспомогательного хост-компьютера МВС nCube 2S, NFS сервера, используемого
всеми МВС ЦВВ и некоторые другие функции.
Наиболее мощным вычислительным ресурсом ЦВВ РГУ является Linux-кластер на базе
компьютеров Pentium 4. Вычислительные узлы соединены гигабитной сетью передачи данных и
стомегабитной управляющей сетью через коммутаторы Gigabit Ethernet и Fast Ethernet соответственно.
Конфигурация вычислительных узлов кластера выбиралась из условия получения максимальной
производительности при жестких финансовых ограничениях. Были выбраны варианты материнской
платы и сетевых карт, обеспечивающие максимальную при заданной тактовой частоте процессора
производительность вычислений и высокое быстродействие коммуникационной сети. Благодаря
установке на компьютерах кластера оптимизирующих компиляторов Intel (8.0 Release) и относительно
149
сбалансированной системе передачи данных между компьютерами кластера удалось добиться его
достаточно высокой производительности. Так производительность рассматриваемого кластера на тестах
LINPACK составила свыше 30 Gflops.
Прикладное программное обеспечение всех МВС в максимально возможной степени унифицировано
для обеспечения переносимости программ на уровне исходных текстов. Это было достигнуто установкой
на всех системах коммуникационной библиотеки MPI, системы компиляции программ с языка HPF,
базовой библиотеки линейной алгебры (ATLAS), однопроцессорной и параллельной версий библиотеки
LAPACK, параллельной версии библиотеки для решения систем линейных алгебраических уравнений с
разреженными матрицами (Aztec). Такая унификация позволила пользователям одни и те же тексты
программ компилировать на любой из вычислительных систем без какой-либо их модификации. Для
облегчения процесса компиляции были написаны универсальные «файлы компиляции и сборки»
(Makefile), в которых пользователям для перекомпиляции программы достаточно только изменить
название архитектуры, для которой должен быть создан исполнимый файл.
Для организации эффективного выполнения потока программ пользователей ЦВВ создана система
организации пакетного выполнения потоков заданий для каждой из вычислительных систем ЦВВ. Эта
система основана на широко известной системе Open PBS. Создание первой версии системы
управления заданиями на базе системы OpenPBS обеспечило относительно быстрое создание
требуемых средств. Важнейшим достоинством системы OpenPBS является поддержка вычислительных
узлов разной конфигурации и архитектуры, необходимая для вычислительной сети ЦВВ РГУ,
включающей МВС различного типа. Кроме того, следует отметить простоту и удобство работы с
OpenPBS как для администратора системы, так и для конечных пользователей (имеющих опыт работы в
ОС UNIX). К достоинствам системы PBS следует отнести также наличие средств оперативного контроля
состояния очередей, вычислительных узлов, а также системы регистрации выполненных заданий.
Входящая в состав OpenPBS система регистрации выполненных заданий позволяет получать
статистическую информацию за любой промежуток времени, что также немаловажно для центров
коллективного пользования. Тем не менее, система OpenPBS имеет некоторые недостатки. Поэтому в
настоящее время ведутся работы по созданию более развитой версии системы управления выполнения
потоком заданий в гетерогенной вычислительной сети ЦВВ РГУ [1].
Возможности эффективного удаленного доступа к вычислительным ресурсам ЦВВ РГУ из
компьютерных сетей РГУ и других научно-образовательных организаций Ростова-на-Дону, ЮжноРоссийского региона и других регионов России обеспечивается развитой телекоммуникационной средой
ЦВВ РГУ, предоставляемой научно-образовательной сетью Ростовской области и Южного федерального
округа РФ, построенной на базе распределенной телекоммуникационной сети РГУ.
Поскольку каналы доступа к ЦВВ РГУ из научно-образовательных сетей региона одновременно
являются каналами доступа этих сетей к Интернет и могут быть временно перегружены трафиком служб
доступа к Интернет, ведется работа над созданием специальных средств, обеспечивающих
динамическое резервирование пропускной способности региональных каналов передачи данных для
служб доступа к ЦВВ РГУ [2]. Использование телекоммуникационных сетей общего пользования для
доступа к вычислительным ресурсам ЦВВ РГУ естественно порождает комплекс проблем
информационной безопасности, решение которых рассмотрено в работе [3].
Вычислительные ресурсы ЦВВ РГУ достаточно интенсивно используются для решения различных
научных и прикладных задач. Основными потребителями ресурсов ЦВВ являются научноисследовательские подразделения РГУ, однако ресурсами ЦВВ РГУ пользуются и научнообразовательные организации из других регионов. При этом химики используют ресурсы ЦВВ для
решения прикладных задач квантовой химии, отдел астрофизики НИИФ и кафедра астрофизики – для
моделирования процессов в галактике, кафедра радиофизики – для моделирования процессов в
низкотемпературной плазме и расчета волноводов сложных профилей, механико-математический
факультет и ЮГИНФО – для решения задач гидродинамики и моделирования гидросистем.
Вычислительные средства ЦВВ РГУ используются и в учебном процессе РГУ. В настоящее время
курс параллельного программирования в рамках спецкурса «СуперЭВМ» проходят студенты 3-х групп
механико-математического факультета, обучающихся по специальности прикладная математика. Общая
численность обучающихся около 75 человек. Обучение производится по оригинальным пособиям,
разработанным сотрудниками ЮГИНФО РГУ [4]. Электронный вариант пособия размещен на сервере
сектора высокопроизводительных вычислений РГУ.
Литература
1. Букатов А.А., Хачкинаев Г.М. Разработка системы управления параллельными заданиями в
гетерогенной вычислительной среде // Труды Первой Всероссийской научной конференции «Методы и
средства обработки информации», М: Изд. МГУ, 2003, с. 197-202.
2. Букатов А.А., Шаройко О.В. Организация средств динамического резервирования каналов
удаленного доступа к региональному центру высокопроизводительных вычислений // Материалы
конференции «Relarn-2002», Нижний Новгород, 2002, с. 17-18.
3. Букатов А.А., Дацюк В.Н., Шаройко О.В. Обеспечение информационной безопасности центра
высокопроизводительных вычислений РГУ // Сборник трудов научно-практической конференции
«Информационная безопасность», Таганрог, 2002, с. 56-58.
4. Букатов А.А., Дацюк В.Н., Жегуло А.И. Программирование многопроцессорных вычислительных
систем, Ростов-на-Дону: ЦВВР, 207 с.
150
ПРИМЕНЕНИЕ ЦЕПОЧЕК СПЕЦИФИКАЦИЙ В АСПЕКТНООРИЕНТИРОВАННОМ ПРОГРАММИРОВАНИИ
А.Н.Литвиненко, А.Н.Кручинин
Ростовский государственный университет, Ростов-на-Дону
E-mail: [email protected]
Аспектно-ориентированное программирование – это новая развивающаяся концепция, призванная
сократить время, стоимость и сложность разработки ПО. Известно, что в жизненном цикле ПО 70% всего
времени отводится на сопровождение. Кроме того, фактом является положение, утверждающее, что
большинство необходимых программных продуктов уже реализовано, протестировано и внедрено. Таким
образом, сопровождение приобретает первостепенную значимость, а это, в свою очередь, требует
специальных подходов для обеспечения достаточно быстрой и всегда безболезненной модификации [1]
программы.
Аспектно-ориентированное программирование предполагает наличие языковых средств,
позволяющих выделять сквозную функциональность в отдельные модули. Однако, из-за того, что
реализация сквозной функциональности не может быть обособлена средствами языка
программирования в отдельном программном модуле, элементы этой реализации присутствуют в том
или ином виде в большинстве модулей, образующих программную систему. Современные технологии
разработки ПО предоставляют удобные средства для выделения логики функционирования программы в
отдельные модули, но ни одна из них не обеспечивает удобного способа локализации в отдельные
модули функциональности, которая должна распространяться на всю систему [2].
В докладе рассматривается новый метод, реализующий концепцию АОП. В основе подхода лежит
возможность структурного разбиения программы на составляющие модули, что, позволяет разбить
задачу на части с целью более рационального распределения времени и сил. В модуле, исходя из
определенного мотива, собирается код из различных мест программы, затем он параметризуется с
целью абстрагирования от конкретной задачи для перенесения полученных достижений и на другие
проекты. В этом случае мы получаем в свое распоряжение не просто константные модули, призванные
сливаться с имеющимся кодом, а реальные гибкие компоненты, способные формировать необходимые
фрагменты кода и интеллектуально распадаться в зависимости от ситуации. При подключении модуля
происходит его распад на множество фрагментов кода, которые инсталлируется в заранее
утвержденные места программы. В докладе предлагаются новые методы подключения (отключения)
модулей при работе с каркасом программы – ее базовой почти не изменяемой частью. Работа с
фрагментами кода позволяет приблизиться к логике задачи: к существующим общесистемным
требованиям и одновременно отдалиться от предлагаемых средой разработки способов декомпозиции.
Таким образом, совокупность фрагментов текста программы – это элемент декомпозиции, такой же, как,
например функция или класс.
В рамках аспектно-ориентированного подхода программа понимается как набор модулей, каждый из
которых отвечает за определенный аспект – мотив или критерий, вбирающий в себя соответствующую
функциональность. В результате исследований оказалось продуктивным ввести некоторую надстройку
над аспектами, позволяющую управлять ими на уровне спецификаций. Спецификация – однозначное,
полное формализованное описание высокого уровня на языке, отличном от языка реализации [3]. Задача
спецификации – управление компонентом. Обосновывается эффективность применения гибкой связи со
спецификациями. В этом случае, спецификация поставляется вместе с программой, а ее изменения
влечет автоматическое изменение функциональности программы без перекомпиляции.
Удобство использования спецификаций объясняется получаемой декларативностью, позволяющей
возвыситься над конкретным языком программирования и аспектом и перенести указания некоторых
параметров непосредственно из кода в спецификации. Кроме того, обобщая цепочечный подход для
программных модулей, были выработаны методы использования цепочек спецификаций. Это, в
частности, позволило не создавать всякий раз сложные структуры данных вручную, а формировать их на
основе некоторых, вводимых разработчиком, регулярных конструкций, что предоставило, в сою очередь,
возможность преобразования сжатых спецификации к полным.
Предлагаемый подход не накладывает какие-либо ограничения на язык написания программы: он не
сужает синтаксис и семантику используемых средств, а только предписывает некие требования к
структуре программы. Его применение позволяет осуществлять безболезненные модификации
существующего кода, повторно использовать полученные модули и отделять логику приложения от
содержания.
Взаимодействие модулей и каркаса осуществляется с применением языков сценариев, которые
играют важную роль в процессе построения модульных систем, предоставляя возможность склеивания
уже существующих модулей.
Подход был реализован на примере модернизации HTML-страниц и предназначен для решения
задачи построения сайта на основе компонентов – XML-спецификаций и XSLT-трансформаций. Эти
компоненты легко подключаются к некоторой исходной HTML-странице. После написания достаточно
большого количества таких заготовок и их объединения в хранилище модулей появляется возможность
создавать необходимые страницы гораздо быстрее и качественнее, чем это было раньше. Все это будет
достигаться за счет возможностей построенной модели и качественного создания модулей, в которых
151
будут предусматриваться необходимые параметры. Получив доступ к таким хранилищам, пользователь
сможет повысить производительность своего труда путем несложного задания тегов XML-документа.
Система может найти свое применение в различных областях, где запросы на качество и
функциональность высоки, а количество времени ограничено.
Литература
1. Горбунов-Посадов М.М. Безболезненное развитие программы. // Открытые системы 1996, №4,
с.65-70
2. В.Павлов. Аспектно-ориентированное программирование //
http://www.optim.ru/cs/2003/4/AOP2/AOP.asp.
3. Салтыкова Н.Н., Литвиненко А.Н. Использование спецификаций для проектирования
модифицируемых СУБД-приложений // Ростов-на-Дону, 2003, «ЦВВР», Компьютерное моделирование.
Вычислительные технологии, с. 107.
СОЗДАНИЕ РАСШИРЯЕМЫХ ПРОГРАММ В ОБЛАСТИ СУБДПРИЛОЖЕНИЙ НА ОСНОВЕ XML-ТЕХНОЛОГИЙ
А.П.Малышевский, А.Н.Литвиненко
Ростовский государственный университет, Ростов-на-Дону
Тел.: 79-17-95, e-mail: [email protected]
Под
расширяемой
программой
понимается
программа,
сопровождение
которой
по
спрогнозированным разработчиком векторам развития и возможным модификациям можно производить
безболезненно и технологично [1].
Безболезненное развитие программы означает, что эволюционный переход из одного
работоспособного состояния программы в другое работоспособное состояние с добавлением нового
содержательного свойства или удаления существующего не нарушает работоспособность ранее
отлаженных версий программы и не затрагивает свойств и функций, не относящихся к добавляемому
свойству [2].
Технологичное развитие программы говорит о том, что у разработчика имеются отлаженная
методика и инструментарий для внесения широкого класса изменений в уже работающую программу,
отвечающих требованиям безболезненности.
В результате проведенных нами исследований оказалось, что использование классического
программирования без определенных приемов и конфигурационных ориентиров не приводит к созданию
расширяемой программы.
Для создания расширяемой программы мы предлагаем классическое программирование сочетать с
альтернативными средствами разработки.
Нами был разработан подход к созданию расширяемых программ в области СУБД-приложений с
использованием XML-технологий. Данный подход применим и к другим типам программ, но поскольку
СУБД-приложения являются часто модифицируемыми программами с долгим жизненным циклом
эксплуатации, то проблема качественного сопровождения приложений решалась, прежде всего, в
области СУБД.
Основная идея подхода заключается:
 в уменьшении количества параметров и информации, которые надо задавать при добавлении
очередного свойства или функции программы и представлении их в виде XML спецификации,
включающей как структурные (декларативные) элементы, так и процедурные элементы в виде
фрагментов кода;
 в сосредоточении информации о каждой содержательной функции или свойстве программы. При
этом предполагается, что реализация этого свойства или функции может быть представлена
несколькими фрагментами программного кода, располагаемого в разных местах;
 в преобразовании сложно структурированных параметров добавляемого свойства или функции в
исполняемый код путем многоэтапных трансформаций, среди которых важная роль принадлежит
XSLT-технологии.
Основные концепции предлагаемого подхода:
1. «Вертикальный» аспект модульного представления программы: движение от менее абстрактных
моделей объектов к более абстрактным, декларативным, высокоуровневым моделям (рис. 1).
152
Рис. 1
2. «Горизонтальный» аспект представления программы: движение от разрозненных моделей схожих
объектов к одной, единой модели для всех этих объектов (рис. 2).
Рис. 2
3. «Консолидирующий» аспект представления программы: реализация механизма точек
присоединения [3]. Механизм точек присоединения – это один из подходов реализации хорошо
известной технологии “plug-in-play”.
Основным преимуществом при использовании данного подхода является возможность построить
программную систему, эволюционные модификации которой будут производиться безболезненно и
технологично. Безболезненность достигается, прежде всего, за счет уменьшения и сосредоточения
информации об однородных объектах системы, а это, в свою очередь, достигается за счет введения
более высокоуровневых и более декларативных объектов в виде XML-спецификаций и отображения их в
код программы на основе XSLT-трансформаций.
Литература
1. Горбунов-Посадов М.М. Расширяемые программы. – М.: Полиптих. – 1999. 5.
2. Горбунов-Посадов М.М. Безболезненное развитие программы. Открытые системы – 1996. - №4. –
C.65-70.
3. Салтыкова Н.Н., Литвиненко А.Н. Проектирование модифицируемых приложений на основе
событийного аппарата//Известия высших учебных заведений Северо-Кавказского региона. Технические
науки, №3, 2002. – С.5-11.
ЭЛЕКТРОННАЯ ИНФОРМАЦИОННО-ОБРАЗОВАТЕЛЬНАЯ СИСТЕМА
ДИСТАНЦИОННОЙ ПОДГОТОВКИ, ПРОФЕССИОНАЛЬНОЙ
ПЕРЕПОДГОТОВКИ И ПОВЫШЕНИЯ КВАЛИФИКАЦИИ ПО ПРОФИЛЮ ИПИТЕХНОЛОГИЙ (CALS)
В.П.Корячко, А.И.Таганов, Р.А.Таганов
Рязанская государственная радиотехническая академия
Тел.: (0912) 92-17-75, e-mail: [email protected]
Вопросы моделирования жизненного цикла продукта (изделия) и выполняемых в его ходе бизнеспроцессов, а также моделирования производственной и эксплутационной среды занимают важное место
в ИПИ-технологиях. Для решения этих задач моделирования в зарубежных CALS-технологиях и
отечественных ИПИ-технологиях используется семейство методов IDEF. Продолжающаяся разработка
технологий IDEF обеспечивает поддержку общей стратегии, направленной на получение семейства
взаимосвязанных и эффективных методов интеграции предприятий.
153
Отечественная и зарубежная практика показывает, что значительные технологические,
экономические и стратегические преимущества можно получить за счет эффективного сбора данных,
контроля и управления информационными ресурсами и ресурсами знаний [1]. Подобно людским
ресурсам, материалам и машинам, активы, обеспечиваемые информацией и знаниями, признаются
жизненно важными ресурсами, которые могут быть использованы в целях достижения высокого качества
продукции и преимущества в конкурентной борьбе.
Применение активов семейства методов IDEF (IDEF0, IDEF1Х, IDEF3, IDEF4, IDEF5 и др.) в
отечественных проектах позволяет достигнуть определенного баланса между специализированными
методами, которые ограничиваются конкретными типами проблем, и «супер методами», которые делают
попытку включить в себя все. Этот баланс поддерживается за счет явных механизмов интеграции
результатов отдельных методов в рамках семейства методов IDEF.
Для автоматизации информационной поддержки семейства методов IDEF создан и широко
используется в практической работе, в том числе в России, целый комплекс CASE-средств, который
позволяет значительно сократить временные и стоимостные характеристики процессов моделирования и
проектирования, а также повысить качество проектных работ. При этом эффективное применение CASEсредств требует соответствующей подготовки специалистов в области автоматизированного
моделирования и проектирования. Для решения этой задачи на кафедре САПР ВС Рязанской
государственной радиотехнической академии была разработана электронная информационнообразовательная среда (ЭИОС) по ИПИ-технологиям [2].
Электронная информационно-образовательная среда предназначена для представления
профессиональных справочных данных и знаний с элементами дистанционного обучения и контроля
(самоконтроля) знаний по следующим направлениям поддержки профессионального творчества с
использованием ИПИ-технологий:
1. По технологии анализа предметной области автоматизации методом интервьюирования в
соответствии с CASE-технологией.
2. По технологии обследования объектов автоматизации и представления результатов
обследования в соответствии с CASE-технологией.
3. По технологии функционального моделирования в соответствии с методологией IDEF0,
предназначенной для создания функциональной модели, являющейся структурированным
изображением функций сложной системы или среды, а также информации и объектов, связывающих эти
функции.
4. По технологии информационного моделирования в соответствии с методологией IDEF1Х,
предназначенной для построения информационной модели, представляющей структуру информации,
необходимой для поддержки функций сложной системы или среды.
5. По технологии процессного моделирования в соответствии с методологией IDEF3,
предназначенной для создания моделей процессов сложных систем на основе процессноориентированных и объектно-ориентированных стратегий приобретения знаний относительно процессов
и событий предметной области.
6. По технологии объектно-ориентированного проектирования систем клиент/сервер в соответствии
с методом IDEF4.
7. По технологии онтологического моделирования в соответствии с методологией IDEF5,
предназначенной для сбора онтологических описаний.
8. По технологиям автоматизированного моделирования IDEF0, IDEF1Х, IDEF3 в среде CASE/IDEF.
9. По методологическим основам стандартного подхода к руководству проектами (СПРП)
информационных систем [3].
10. По процессам и задачам стандартного подхода к руководству проектами информационных
систем [3].
Наряду с профессиональной сферой применения ЭИОС предназначена для широкого
использования в учебном процессе высшей школы, а также для подготовки и переподготовки
специалистов в области ИПИ-технологий по дистанционной технологии представления знаний без
отрыва от производства.
Электронная информационно-образовательная среда по ИПИ-технологиям демонстрировалась на
Всероссийских выставках-ярмарках «Современная образовательная среда» в ВВЦ (Москва, 2001, 2002
гг.) и нашла практическое применение по планам ряда промышленных предприятий и учебных
заведений, в число которых вошли: РГРТА, ФГУП ОКБ «Спектр» (Рязань), ФГУП ОКБ «Глобус» (Рязань),
ГНОЦ CALS-технологий (Москва), ФГУП РСК «Миг» (Луховицы).
Литература
1. Концепция развития CALS-технологий в промышленности России / НИЦ CALS-технологий
«Прикладная логистика»; Е.В. Судов, А.И. Левин. – М., 2002.
2. Программа для ЭВМ «Информационно-образовательная среда системного моделирования и
управления проектами в CALS» (ИОС-CALS), РОСПАТЕНТ №2002610045 от 16.01.02.
3. Везенов В.И., Светников О.Г., Таганов А.И. Основы процессно-ориентированного управления
проектами информационных систем / Под ред. проф. Корячко В.П. – М.:Энергоатомиздат, 2002. 320 с.
ISBN 5-283-03219-1.
154
МЕТОДЫ МОДЕЛИРОВАНИЯ СЕТИ НА ОСНОВЕ ГРАФОВЫХ МОДЕЛЕЙ
НЕПРЕРЫВНОГО ВРЕМЕНИ
Ю.В.Гугель1, А.П.Шибанов2
1)Санкт-Петербургский филиал Государственного научно-исследовательского
института информационных технологий и телекоммуникаций «Информика»,
2)Рязанская государственная радиотехническая академия
Тел.: (812) 233-94-14, (0912) 92-17-75,
e-mail: [email protected], [email protected]
Рассматриваются проблемы, связанные с оценкой задержек пакетов, из-за старения информации и
снижения качества функционирования технических и программных средств сети. Наиболее экономичным
и быстрым способом оценки рабочих параметров сети является метод математического моделирования.
Для оценки рабочих параметров сети предлагается использовать графоаналитический подход и
имитацию. Строится комбинированная модель, на нижнем уровне иерархии которой используются
ориентированные графы большой размерности с непрерывным временем. Графовые модели большой
размерности используются для отражения стохастического поведения протоколов, алгоритмов, и
программ телекоммуникаций. Предполагается, что такие модели можно применять для анализа сложных
структур с большим количеством вероятностных ветвлений и циклов, в частности отражаемых
решетчатыми графами. Отдельные части модели могут разрабатываться разными группами
разработчиков и составлять единую иерархическую модель. Допускается использование как
непрерывных, так и дискретных распределений, важно лишь, чтобы выходное распределение было
непрерывным.
Графоаналитическая модель, отражающая с той или иной степенью детальности стохастическое
поведение алгоритмов и программ, реализующих некоторый протокол, "погружается" во внешнюю по
отношению к ней среду. Последняя отражает функционирование входных и выходных буферов
коммутаторов и маршрутизаторов, и изменение ее состояния отражается на основе теории массового
обслуживания.
Для нахождения закона распределения времени прохождения графа большой размерности (сотни
вершин и дуг и более) используются численные методы. При этом применяются алгоритмы
эквивалентных упрощающих преобразований структуры модели, основанные на нахождении плотности
распределения вероятностей по известной характеристической функции выходной величины модели.
Метод характеризуется полиномиальной вычислительной трудоемкостью относительно числа вершин
графа. Полученное распределение сохраняется в файле и используется для генерации выборочных
значений в имитационной системе, представляющей второй уровень иерархии.
Данный метод предназначен для комплексной оценки быстродействия сети с учетом старения
информации в пакетах, а также показателей надежности программных и технических средств системы.
Учет процессов старения информации осуществляется следующими методами:
 использованием графовых моделей с произвольными условными распределениями времени
выполнения отдельных операций алгоритма или программы, в которых исключаются все
случайные события, происходящие после некоторого заданного критического момента времени,
называемого параметром старения;
 использованием в качестве спецификаций транзактов имитационной модели параметров (или
меток) времени, значение которых может изменяться имитационными блоками-активностями при
движении транзактов в модели. Транзакты, у которых значения меток времени достигают
заданного критического значения, могут исключаться из модели или обрабатываться по
специальным алгоритмам.
Учет характеристик надежности (а, возможно и исследование процессов восстановления системы)
может осуществляться на основе применения графовых моделей непрерывного времени со структурой,
случайно изменяющейся во времени. В таких моделях на входе узла обязательно имеется
вероятностное ветвление, определяющее вероятность готовности узла к обслуживанию заявки (узел
может находиться в двух состояниях "готов" или "не готов"). Используются четыре основных типа
моделей, отличающиеся друг от друга по способу обработки заявки при получении отказа в
обслуживании заявки из-за неготовности узла:
 тип 1 – заявка исключается из модели (отправляется на выход модели);
 тип 2 – заявка отправляется на вход модели;
 тип 3 – заявка с произвольной случайной задержкой снова поступает на вход узла, в котором она
получила отказ в обслуживании;
 тип 4 – заявка отправляется на вход некоторого другого узла.
Модель первого типа соответствует такому режиму работы сети, в котором информационные пакеты
исключаются из сети по причине переполнения входных очередей коммутаторов и маршрутизаторов.
При этом никаких действий, связанных с повторной передачей пакетов, в сети не производится. Модель
второго типа удобно использовать для оценки быстродействия сети, с учетом того, что кадры (или
пакеты), потерянные на нижних уровнях протоколов, повторно пересылаются протоколами более
высоких уровней, например, транспортным или уровнем приложений. Модель третьего типа
155
предназначена для расчета быстродействия системы с учетом процессов восстановления
работоспособности отдельных компонентов системы. Модель четвертого типа используется для
моделирования систем с резервированием. Конкретный узел, в который должна быть направлена заявка
(в отличие от предыдущих моделей, в которых он задан однозначно), указывается непосредственно
составителем модели.
Конечной целью моделирования является определение таких характеристик, как задержка пакета
при движении от отправителя к получателю и его вариация, среднее время восстановления отказавших
устройств и каналов и его дисперсия, коэффициенты готовности и коэффициенты использования
компонентов телекоммуникационной системы.
СОЗДАНИЕ ИНСТРУМЕНТА ДЛЯ ФУНКЦИОНАЛЬНОГО МОДЕЛИРОВАНИЯ
В.А.Капустин, А.С.Корсун
Санкт-Петербургский государственный университет
Тел.: (812) 328-12-66, e-mail: [email protected], [email protected]
Функциональное моделирование находит свое применение в отраслях, связанных с созданием
сложных организационных и информационных систем, поддержкой жизненного цикла сложных систем и
изделий. Это зрелая технология, основы которой были предложены более 30 лет назад в
авиакосмической промышленности США, и которая была стандартизована в США [1] и в России [2].
IDEF0 поддерживается рядом известных программных продуктов (например, AllFusion Business Process
Modeler от Computer Associates, ранее BPWin), имеющих тяжеловесные графические интерфейсы и
перегруженных различными функциями, факультативными для целого ряда моделей. Такие
программные средства дороги, что является препятствием для их массового применения.
Графический язык IDEF0, в основном, ограничен прямоугольными линиями, параллельными
сторонам прямоугольного носителя графического образа модели (листа бумаги, экрана) и фигурами,
образуемыми такими линиями. Такая графика легко реализуется в HTML, что привело к идее разработки
инструмента поддержки создания IDEF0-диаграмм в виде веб-приложения.
Аналитик, создающий функциональную модель, должен иметь возможность не только указать, где
разместить прямоугольный элемент модели ("блок"), но и переместить и даже удалить блок или другой
элемент модели, а также сохранить результат моделирования, включающий информацию о текстах,
связанных с графическими элементами модели и о расположении самих этих элементов. Объем такой
информации может быть значительным, и реализация поддержки каждого действия аналитика в виде
серверных программ (скриптов) сделает работу аналитика крайне некомфортной из-за задержек при
пересылке HTTP-запросов и HTML-ответов из браузера на сервер и обратно.
Современные браузеры обеспечивают возможность отреагировать на события, порождаемые
пользователем (движения мыши, нажатия на клавиши мыши и клавиатуры), изменением отображаемого
документа. Эти возможности браузеров широко используются при создании разнообразных
административных интерфейсов (например, в системах управления контентом). Наш подход к созданию
инструмента для функционального моделирования заключается в реализации поддержки манипуляции
объектами модели непосредственно в браузере (HTML-документе) с помощью скриптового языка
ECMAscript (JavaScript 1.5). Использование именно этого языка связано с практически повсеместной его
поддержкой браузерами всех основных производителей (Microsoft Internet Explorer – MSIE,
Mozilla/Netscape, Opera) на всех платформах (Windows, Linux/Unix, Mac).
Браузеры обеспечивают три различных уровня программных интерфейсов (API), позволяющих
изменять отображаемый документ:
 непосредственный вывод HTML-текста в документ (document.write());
 изменение содержимого выбранного элемента документа (innerHTML/outerHTML);
 стандартизованные не только для браузеров API объектной модели документа (методы DOM).
Первоначально одним из авторов был создан ранний прототип инструмента для функционального
моделирования с использованием второго из перечисленных подходов. Компоненты графического
интерфейса пользователя (ГИП) задавались в виде программных констант, которые конкатенировались
со значением свойства innerHTML необходимого элемента HTML. Этот подход, эффективно работающий
для несложных интерфейсов в MSIE, оказался совершенно неработоспособным в Mozilla, причем сразу
по двум причинам. Во-первых, добавление или изменение (строковых) значений атрибутов элемента
документа путем изменения свойства innerHTML браузером Mozilla (в отличие от MSIE) не отражаются в
дереве DOM документа (за исключением ссылок на обработчики событий, где все обстоит ровно
наоборот – изменение названия функции – обработчика события – в Mozilla приводит к изменению
обработчика, а в MSIE – нет). Во-вторых, Mozilla вообще более строго следует стандарту DOM, в
соответствии с которым любое изменение свойства innerHTML любого элемента документа порождает
формально новый документ.
В результате прототип инструмента для функционального моделирования был переработан с
использованием исключительно DOM API. Оказалось, что стандарт DOM 2 не полностью
поддерживается даже последними (IE 6.1, Mozilla 1.6) версиями браузеров (в частности, в части
передачи информации о событиях их обработчикам, копирования поддеревьев и др.), что пока
156
задерживает завершение отладки части ГИП, связанной с перемещением блоков и изменением их
размеров.
Для сохранения результатов формирования функциональной модели написан простой серверный
скрипт на языке Perl, принимающий от браузера сериализованную в текстовый поток диаграмму IDEF0 и
сохраняющий ее как текстовый файл, а также возвращающий ее в виде массива JavaScript, что
позволяет восстановить изображение диаграммы в браузере.
Для превращения разработанного прототипа в реальный инструмент моделирования, обладающий
минимальной необходимой функциональностью, предстоит решить еще несколько задач:
 завершить отладку перемещения и изменения размеров элементов ГИП;
 разработать метод хранения связанных диаграмм (моделей) и их версий и графическое
представление этого хранилища, обеспечивающее наглядную навигацию по нему.
Можно продолжать реализацию ГИП инструмента для функционального моделирования в
HTML/XHTML, однако мы планируем исследовать возможность отказаться от HTML и перейти к
использованию XML/XSLT/CSS, что позволит упростить разработку конвертеров в промышленные
коммуникативные стандарты, используемые для обмена данными о IDEF0 функциональных моделях: IDL
и XML, а также стандартизовать те элементы ГИП, которые используются для задания параметров
моделей (панели свойств, диалоги ввода текста и т.п.) за счет перехода к использованию мощных
оконных интерфейсов, доступ к которым возможен в современных браузерах: XUL в Mozilla и HTA в
Internet Explorer.
Работа частично поддержана Российским фондом фундаментальных исследований, грант 03-0790299.
Литература
1. Integration Definition for Function Modeling (IDEF0)/FIPS Publication 183. – 1993.
2. Рекомендации по стандартизации Р50.1.028-2001. Информационные технологии поддержки
жизненного цикла продукции: Методология функционального моделирования. – Госстандарт, 2001.
РАЗВИТИЕ ИНФОРМАЦИОННО-ВЫЧИСЛИТЕЛЬНОГО КОМПЛЕКСА СПбГУ
В ПЕТЕРГОФЕ
В.Ю.Сепман, Ю.П.Галюк, В.И.Золотарев, Н.Г.Пинчук
Санкт-Петербургский государственный университет
Тел.: (812) 428-43-52, e-mail: [email protected]
В состав информационно-вычислительного комплекса в Петродворце входят 4 кластера с
суммарной пиковой производительностью около 100 млрд флопс, предназначенных для
высокопроизводительных вычислений, 5 кластеров для обучения параллельному программированию и
разработке приложений, корпоративная система хранения данных емкостью 4 ТБ, базирующаяся на
технологии SAN. Сегмент сети университета в Петродворце объединяет более 2000 компьютеров
(включая 700 ПК из общежития), причем число только управляемых сетевых коммутаторов превысило
60, а общая длина оптоволоконных каналов – 21 км. Все это делает Петродворцовый комплекс
идеальным полигоном для отработки решений в области новейших информационных технологий.
Комплекс имеет устойчивую тенденцию к росту (количественному и качественному) по
экспоненциальному закону, поэтому решения, хорошо зарекомендовавшие себя несколько лет назад,
оказываются тормозом в настоящее время. Прежде всего, это касается вопросов администрирования и
повышения качества обслуживания пользователей.
Наиболее простой и менее затратный способ создания единой информационной среды
университета – это разработка и внедрение последовательности пилотных проектов, реализация
которых позволяет выбрать комплекс решений для всего университета. Это связано с тем, что
внедрение любого компонента единой системы требует согласования со многими участниками.
Выбираемые решения при этом должны соответствовать корпоративному уровню с учетом дальнейшего
развития.
Перечислим основные направления развития комплекса:
 Развитие удаленного доступа к ресурсам. На смену непосредственного (терминального) доступа
вводятся системы разработки и запуска программ, базирующиеся на портальных Webтехнологиях, такие как WebWS и Alien (портал доступа к grid-ресурсам европейского центра
ядерных исследований CERN) и ориентирующиеся на свободно распространяющиеся
программные продукты. Повышающиеся требования к комфортности среды разработки привели к
необходимости осваивания нового программного продукта – IBM WebSphere Portal, становящегося
де-факто мировым стандартом в области разработки порталов. Технология портлетов,
базирующаяся на языке Java2 Enterprise Edition, позволяет пользователю создавать свою
собственную среду, используя только стандартный веб-браузер. Совместимым по применяемым
технологиям с IBM WebSphere является и проект GridSphere, предназначенный для комфортного
доступа к grid-ресурсам.
157
 Внедрение единой учетной записи (LDAP) для доступа сотрудников университета к различного
рода информационным ресурсам, таким как: электронная почта, доступ в Интернет,
высокопроизводительные ресурсы, электронные библиотеки, хранилища данных, и т.п. Единая
учетная запись должна быть доступна в любом подразделении университета, разбросанного по
всему Санкт-Петербургу и окрестностям на любой компьютерной платформе, обеспечивая при
этом защиту при доступе к конфиденциальной информации (такой как пароли).
 Использование коммерческих программных продуктов. Приобретение лицензионного
программного обеспечения часто дает эффект даже при наличии бесплатных аналогов. Они
имеют большую сферу применения (транслятор Lahey Fortran позволяет разрабатывать
программы, написанные в стандарте F90, программный комплекс для квантово-химических
расчетов Gaussian03 позволяет рассчитывать намного большее количество конфигураций
молекул, чем бесплатно распространяемая программа GAMESS), и зачастую считают в несколько
раз быстрее. Закуплены также программные пакеты (Mathematica, Matlab), не имеющие
бесплатных аналогов, но входящие в набор инструментов современного ученого.
 Создание системы постоянного мониторинга конфигурации оборудования. Для реализации этой
задачи был выбран пакет Tivoli Inventory, который собирает сведения о программной и аппаратной
конфигурации всех серверов сети и сохраняет ее в СУБД. Преимуществом этого пакета над
другими является его многоплатформенность (Linux, Solaris, AIX, MS Windows, …), возможность
работы практически с любой распространенной базой данных и масштабируемость (система
одинаково эффективно работает как с небольшими сетями, так и с сетями, насчитывающими
десятки и даже сотни тысяч компьютеров).
 Внедрение системы автоматизации распространения программного обеспечения. Преимуществом
выбранного нами пакета Tivoli Software Distribution является, наряду с многоплатформенностью,
возможность гибкой настройки сценария обновления и восстановления ПО в зависимости от
состава оборудования и программного обеспечения.
 Развитие системы мониторинга сети и оперативного управления сетевыми ресурсами. Собирая и
анализируя данные о состоянии сети, программные пакеты Tivoli Netview и Tivoli Enterprise Console
практически мгновенно реагируют на поступившее сообщение о возникшей неисправности и
информируют администратора, предлагая пути возможного решения проблемы. Разгружая
администратора сети от необходимости анализа огромного объема разнородной информации,
пакеты позволяют оперативно и эффективно управлять сетями огромных масштабов.
ПРИМЕНЕНИЕ ПАКЕТА SCILAB ДЛЯ МОДЕЛИРОВАНИЯ АБЕРРАЦИЙ
ВРЕМЯПРОЛЕТНОГО МАСС-СПЕКТРОМЕТРА НА РАСПРЕДЕЛЕННОМ
ВЫЧИСЛИТЕЛЬНОМ КЛАСТЕРЕ
М.И.Павлова1, И.И.Пилюгин2
1 Институт высокопроизводительных вычислений и информационных систем,
2 Физико-Технический институт им. А.Ф.Иоффе, Санкт-Петербург
Тел.: (812) 352-29-97, e-mail: [email protected], [email protected]
Компьютерное моделирование аберраций времяпролетного масс-спектрометра необходимо для
конструирования масс-спектрометра с максимально возможным разрешением, позволяющим решать
задачи газового анализа. По результатам полученных расчетов конструируются масс-спектрометры,
находящие применение в химической и фармацевтической промышленности. Задача построения
прибора, обладающего высокой чувствительностью и одновременно высоким разрешением без
проведения компьютерного моделирования практически неосуществима по следующим причинам:
аберрационный функционал зависит более чем от десяти параметров оптимизации и имеет большое
количество локальных максимумов, что требует большого объема вычислений.
Для проведения расчетов был выбран пакет Scilab (http://www.scilab.org) французской фирмы Inria,
часть функций написано на языке Си.
Такая технология программирования выбрана по следующим причинам: пакет Scilab свободно
распространяется через Интернет вместе с исходными кодами и снабжен обширной документацией,
работает как в Linux, так и в операционной среде Windows, является средой создания законченных
приложений, включающей в себя реализацию численного метода и визуализацию результата с
возможностью интерактивного вмешательства, снабжен обширной библиотекой алгоритмов базовой
математики, имеет возможности создания интерфейса и прост в обращении. Особо существенным
являются наличие интерфейса с откомпилированными функциями языков Си и Фортран, что
обеспечивает возможность параллельных вычислений.
Программа компьютерного моделирования масс-спектрометра написана на языке пакета Scilab с
использованием откомпилированных функций языка Си и отлажена на персональном компьютере с
платформой Windows, с дальнейшей возможностью перенесения на кластер под платформой Linux и при
необходимости распараллелена. Результаты расчета визуализируются с помощью встроенной графики
пакета Scilab. Оптимальные параметры конструируемого прибора в одних случаях непосредственно
вычисляются, а в других – могут быть выбраны оператором на основе визуализационной картины в
158
зависимости от конкретных аберрационных параметров. На основе полученных результатов расчета
были сконструированы и внедрены в производство времяпролетные масс-спектрометры серии ЭМГ
фирмы "Меттек" (Санкт-Петербург).
Применение пакета Scilab может быть успешно применено для решения других прикладных
инженерно-технических задач.
РАЗВИТИЕ И ЭКСПЛУАТАЦИЯ Linux-КЛАСТЕРА В ФТИ ИМ. А.Ф.ИОФФЕ
РАН
Р.Л.Аптекарь, П.А.Войнович, А.М.Кузьмин, Г.В.Михайлов, А.Н.Рипак, А.Н.Соколов,
А.А.Шмидт
Физико-технический институт им. А.Ф.Иоффе РАН, Санкт-Петербург
Тел.: (812) 247-23-65, факс: (812) 247-22-45, e-mail: [email protected]
В рамках реализации первого этапа проекта создания Центра высокопроизводительных вычислений
в 2001 г. в Физико-техническом институте им. А.Ф.Иоффе РАН (ФТИ) был собран и введен в опытную
эксплуатацию вычислительный комплекс (кластер) состоящий из 12 двухпроцессорных узлов на основе
процессора Intel Pentium III, 1260 MHz, размещенных в единой стойке и соединенных высокоскоростной
сетью Myrinet с пропускной способностью 1,3 Гбит/с, а также управляющего компьютера. Каждый узел
обладал оперативной памятью 1 Гбайт и дисковым пространством 40 Гбайт; управляющий компьютер –
оперативной памятью 2 Гбайт и дисковым пространством 150 Гбайт [1]. Вычислительный комплекс
размещен в специально спроектированном помещении, снабженном системой бесперебойного
электропитания через два фидера, подключенных к независимым подстанциям, а также кондиционерами
и приточной вентиляцией с фильтрами очистки поступающего воздуха.
За прошедшее время был выполнен ряд работ по развитию аппаратной и программной
составляющих комплекса, а также накоплен опыт его практической эксплуатации. Завершено
административное
оформление
Санкт-Петербургского
Филиала
Межведомственного
суперкомпьютерного центра РАН. Информация о текущем состоянии аппаратных и программных средств
комплекса, правила пользования и доступа, список реализованных проектов и многое другое
представлено на нашем интернет-сайте [2].
В 2003 г. первоначальная вычислительная производительность комплекса была увеличена более
чем в два раза и доведена до суммарной пиковой производительности свыше 60 миллиардов операций
двойной точности с плавающей точкой в секунду введением семи дополнительных двухпроцессорных
вычислительных модулей на базе процессора AMD Athlon MP2400+. Большая часть вычислительных
модулей объединена высокоскоростной сетью Myrinet, все вычислительные модули и управляющий
компьютер связаны сетью Fast/Giga Ethernet. Суммарная оперативная память решающего поля
составляет 26 Гбайт. Сети передачи данных между процессами и сетевая файловая система
обслуживаются разными сетевыми коммутаторами. Программные и аппаратные средства комплекса
позволяют выполнять одно задание с использованием всего объема вычислительных ресурсов, а также
разделять решающее поле на части требуемого размера и предоставлять их для выполнения
независимых заданий. Для долговременного хранения данных используется дисковый массив RAID5 в
составе управляющего компьютера с емкостью увеличенной до 300 Гбайт.
Программное обеспечение вычислительного комплекса состоит из общего программного
обеспечения (ПО), тестового ПО и подсистемы колллективного доступа. В состав общего ПО входят:
операционные системы управляющего компьютера и вычислительных модулей (ОС Linux Debian с
поддержкой SMP), операционная среда параллельного программирования (пакет MPICH), программные
средства коммуникационных сетей (Myrinet, Fast Ethernet), инструментальные программные средства
разработки системного и прикладного программного обеспечения, включающие оптимизирующие
компиляторы языков программирования GNU C, C++, FORTRAN, средства параллельного
администрирования системы. Тестовое ПО выполняет проверку работоспособности управляющего
компьютера, вычислительных модулей и сетевого оборудования. Подсистема коллективного доступа
обеспечивает: прием заданий пользователей и их запуск согласно текущим правилам предоставления
ресурсов, динамическое распределение вычислительных ресурсов по запросам пользователей,
выполнение заданий с функциями MPI и без них, сбор и предоставление статистической информации по
отдельным заданиям пользователей. Взаимодействие удаленных пользователей с управляющим
компьютером осуществляется по протоколу SSH с возможностью автоматической упаковки-распаковки
потока данных при использовании медленных каналов связи. Подключение к АТМ-облаку сети RUNNet,
объединяющей научные и образовательные организации, обеспечивает передачу данных со скоростью
100 Мбит/с. Все элементы программного обеспечения вычислительного комплекса регулярно
обновляются. Развитие и поддержка аппаратных средств комплекса и его системного программного
обеспечения выполняются силами отдела Перспективного развития технических средств и программного
обеспечения ФТИ и Санкт-Петербургского Филиала Межведомственного суперкомпьютерного центра
РАН.
Вычислительный комплекс ФТИ использовался для решения ряда ресурсоемких задач газовой
динамики, астрофизики, материаловедения и биологических приложений квантовой химии. В настоящее
время в число корпоративных пользователей вычислительного комплекса входят ФТИ, Санкт159
Петербургский государственный политехнический университет, Институт физиологии им. И.П.Павлова
РАН, Главная астрономическая обсерватория РАН. В разработке прикладного программного
обеспечения и выполнении расчетов участвуют студенты и аспиранты Санкт-Петербургского
государственного университета, Санкт-Петербургского государственного политехнического университета
и ФТИ.
Планами развития вычислительного комплекса на 2004 г. предусматривается установка одной-двух
секций вычислительной системы МВС 1000М производительностью 160 миллиардов операций с
плавающей точкой в секунду и увеличение дискового пространства управляющего компьютера до 1
Терабайта.
Работы по развитию и эксплуатации вычислительного комплекса поддержаны грантом РФФИ № 0307-90201, программой «Национально-технологическая база» Минпромнауки РФ (ГК № 35.663.11.0108,
проект «Экран»), а также Программой фундаментальных исследований СПбНЦ РАН и целевой
программой Президиума РАН «Научные телекоммуникации и информационная инфраструктура».
Литература
1. Аптекарь Р.Л., Войнович П.А., Кузьмин А.М., Михайлов Г.В., Пульцин Н.М., Рипак А.Н.,
Соколов А.Н. Linux-кластер в ФТИ им. А.Ф.Иоффе РАН. // Труды Всеросс. науч.-методич. конф.
"Телематика’2002", СПб, 3–6 июня 2002 г., с. 185.
2. http://www.scc.ioffe.ru/.
ЭЛЕКТРОННЫЙ КУРС «МНОГОСЕТОЧНЫЕ МЕТОДЫ ВЫЧИСЛЕНИЙ»
Е.Н.Станкова, М.А.Затевахин, М.И.Павлова, Л.С.Юденич
Институт высокопроизводительных вычислений и информационных систем,
Санкт-Петербург
Тел.: (812) 352-29-97, e-mail: [email protected]
В настоящее время одним из существенных факторов, сдерживающих широкое применение
высокопроизводительных вычислительных ресурсов, является недостаточное знание пользователями
современных методов вычислений. Для расширения математического образования в этой области нами
был создан электронный курс «Многосеточные методы. Введение в стандартные методы».
Многосеточные алгоритмы эффективно применяются для решения задач динамики плазмы и
гидродинамики, расчета собственных значений и собственных функций дифференциальных операторов,
для расчета нейтронных полей в ядерном энергетическом реакторе, для решения задач теории
упругости, в задачах обтекания тел достаточно сложной формы, а также для решения медицинских
проблем, связанных с реконструкцией электрической активности головного мозга и сердца по
измерениям электрических потенциалов вне мозга или сердца.
Математически все эти задачи сводятся к численному решению систем эллиптических уравнений в
частных производных или интегро-дифференциальных уравнений.
Задачей созданного авторами лекционного курса (http://www.csa.ru/skif/kurs_3/multigrid/index.html)
являлось дать общие представления о стандартных многосеточных методах и стратегии их разработки, а
также показать эффективность их применения для решения задач повышенной сложности, требующих
использования высокопроизводительных численных алгоритмов и значительных вычислительных
ресурсов.
Курс содержит основы теории многосеточных алгоритмов, описание применения этой теории для
решения нелинейных уравнений (схема полной аппроксимации) и описание метода вложенных итераций
и техники многоуровневой адаптации. Отдельный раздел посвящен использованию многосеточного
метода для проведения параллельных вычислений.
Лекционный курс предназначен для научных работников и инженеров, занимающихся решением
задач с использованием сеточных методов, требующих большого объема вычислений и
заинтересованных в повышении их эффективности.
Курс представлен в виде гипертекстового документа, снабжен конкретными вычислительными
примерами, реализованными в виде готовых программ на языке Fortran и пакета Scilab
(http://scilabsoft.inria.fr/). Примеры помогают быстрее освоить предмет путем наглядного сравнения
результатов вычислений, полученных различными сеточными методами, а также путем изменения
параметров проводимых расчетов. Для удобства печати имеется альтернативная pdf-версия курса.
Кроме того, имеется тестовая система, позволяющая учащемуся самостоятельно контролировать
усвоение материала.
Материалы курса лекций были использованы для обучения студентов Санкт-Петербургского
политехнического университета.
Литература
1. Р.П.Федоренко. Введение в вычислительную физику. – М.: Изд. МФТИ, 1994.
2. MGNet http://www.mgnet.org/.
160
3. Мартыненко С.И. Распараллеливание универсальной многосеточной технологии //
Интернет-журнал "Вычислительные методы и программирование", 2003, Т.4, с.45
(http://srcc.msu.su/num-meth/zhurnal/tom_2003/v4r106.html).
СОВРЕМЕННЫЕ ИНФОРМАЦИОННЫЕ ЛОГИСТИЧЕСКИЕ СИСТЕМЫ И ИХ
ПРОБЛЕМЫ
А.В.Бурдуков, А.В.Богданов
Представительство Flextronics, Институт высокопроизводительных вычислений и
информационных систем, Санкт-Петербург
Тел.: (812) 274-67-15, e-mail: [email protected]
При сегодняшней глобализации экономики сложность сетей цепи поставок стала наиболее важной
проблемой всех OEM (original equipment manufacturer). Действия компаний направлены на обеспечение
эксплуатационной надежности посредством достижения необходимых целей и времени по обеспечению
поставок при управлении и сокращении общей цены цепей поставок. Компании сегодня понимают
важность оптимизации их цепей поставок. Однако проектирование и планирование наиболее
эффективных цепей поставок требует нечто большее, чем исторические данные, средние значения
различных метрик и статистической оптимизации стоимости. Колебания спроса, изменчивость поставок
во взаимосвязанных сетях поставок многих компаний требуют такого подхода в планировании, который
позволит синхронизировать операции в цепях поставок с реальными колебаниями и ограничениями
мировой экономики. Проектирование, планирование, анализ и оптимизация сетей цепей поставок
являются целевыми задачами, которыми занимается такой раздел науки как логистика.
В настоящее время современные информационные логистические системы являются мощным
инструментом для моделирования и оптимизации цепей поставок и транспортных систем крупных
транснациональных компаний. Точность результатов, полученных посредством таких систем, дает
возможность компаниям принимать стратегические и затратно-чувствительные решения в управлении
сложными цепями поставок. Помимо этого, появляется возможность понимания потенциальных
воздействий изменений различных рыночных условий на логистику цепей поставок в целом.
Функционально такие системы охватывают практически весь спектр логистических проблем,
возникающих в современном мире. Тем не менее, эти системы имеют и свои узкие места. На данный
момент не существует какой-либо одной информационной логистической системы, которая позволяла бы
решить все проблемы сразу. Однако использование нескольких систем в комплексе позволяет устранить
этот недостаток.
В настоящее время все ориентированные на логистику информационные системы можно разбить на
несколько категорий:
 геоинформационные системы;
 системы моделирование микрологистических процессов;
 системы оптимизации;
 системы моделирования макрологистических процессов (Forward Logistics);
 системы моделирования возврата брака и гарантийного обслуживания уже произведенных
товаров (Reverse Logistics).
Несмотря на функциональные возможности, у всех информационных логистических систем есть
одна, общая для всех них, проблема – это проблема производительности. Это обусловлено, в первую
очередь, гигантскими объемами данных, которые необходимо обработать для получения практического
результата (особенно данной зависимостью страдают системы линейной статистической оптимизации).
В системах компьютерного моделирования поведения цепей поставок на производительность
накладывает свой отпечаток алгоритм моделирования. Дело в том, что такие системы построены на
событийно-временном дискретном алгоритме; события, происходящие в цепи поставок, поступают на
специальный конвейер обработки и являются, как правило, зависимыми от предыдущих обработанных
событий. В связи с этим, параллельная обработка событий (которая могла бы легко решить вопрос
производительности, например, с помощью построения большого вычислительного кластера) является
нетривиальной задачей. Несмотря на неявность в решении, данная задача является актуальной и
жизненно-необходимой в современной глобальной экономике и возникающих в ней задач логистики.
Наилучшим решением в настоящий момент является программный комплекс SimFlex. SimFlex
является симулятором макрологистических процессов с собственной мощной геоинформационной
системой. SimFlex позволяет моделировать процессы как Forward Logistics, так и Reverse Logistics. С
помощью внешнего модуля CPLEX от iLog возможно также решение оптимизационных задач в логистике.
В рамках 3-ех уровневой архитектуры SimFlex позволяет строить вычислительные кластера для
параллельных симуляций моделей и модельных сценариев в пакетном режиме.
161
ОРГАНИЗАЦИЯ GRIDTESTBED ИВВИС И ПТЦ СПбГУ
И.В.Шошмина, В.В.Корхов, Д.Ю.Малашонок, А.В.Богданов
Институт высокопроизводительных вычислений и информационных систем, СанктПетербург
Тел.: (812) 545-42-61, e-mail: {irena, vladimir, mal, bogdanov}@csa.ru
В последнее время, благодаря поддержке федеральной целевой программы «Интеграция науки и
высшего образования России на 2002-2006 годы» во многих российских университетах довольно активно
создавались более или менее высокопроизводительные кластерные компьютерные системы и фермы
рабочих станций. Таким образом, информационно-вычислительное пространство российского научного
сообщества стало понемногу напитываться вычислительными ресурсами. Однако, всем хорошо известен
факт, что большая часть установленного оборудования в основном простаивает или не загружена.
Невостребованность компьютерных ресурсов имеет под собой несколько причин:
 недоверие и непонимание необходимости использования высокопроизводительных систем для
решения практических и научных задач;
 недостаточную информированность потенциальных пользователей;
 недостаточность существующих ресурсов одного вычислительного центра для некоторых научнотехнических задач;
 отсутствие простой и достаточно отработанной технологии организации доступа удаленного
пользователя к ресурсам вычислительного центра.
Первые три причины имеют социально-экономический характер и не являются предметом нашего
обсуждения. Однако и они имели бы гораздо больше шансов для разрешения, если бы были решены
технические (технологические) аспекты доступа и эксплуатации вычислительных центров.
Дело в том, что недостаточно иметь компьютерные ресурсы и подведенный к ним канал доступа.
Необходимо организовать прозрачную инфраструктуру, предоставляемых сервисов, создать простую,
комфортную, надежную среду для работы пользователя. Для того чтобы иметь возможность
масштабировать и развивать, свои ресурсы, например, интегрируя ресурсы нескольких вычислительных
точек в одном университете или объединяя ресурсы нескольких университетских компьютерных центров,
требуется разработать решение на некоторой общей основе при помощи единой технологии.
ИВВИС и ПТЦ СПбГУ приняли решение объединить часть своих компьютерных ресурсов на базе
технологии Grid. Grid – современная перспективная технология, которая сегодня активно развивается. Во
всем мире существуют сотни проектов, связанных с Grid. Технология призвана обеспечить пользователю
надежный, удобный доступ к большому количеству широко распределенных вычислительных ресурсов
из любой точки земного шара. Очевидно, что объединяемые ресурсы не только распределены, но и
гетерогенны, находятся под управлением разных организаций, а значит и разных локальных политик,
кроме того, подключение и выход из объединенной среды ресурсов происходит динамически. В Gridтехнологии не предполагается сглаживать подобные проблемы. Каждое отдельное сообщество,
реальная организация, подразделение реальной организации или группа исследователей
представляется в Grid как виртуальная организация. Такие виртуальные организации разделяют между
собой общие ресурсы на основе взаимных договоренностей.
В ИВВИС развернута распределенная система (часть Grid в рамках нашей организации),
объединяющая несколько вычислительных систем, в том числе и высокопроизводительные ресурсы.
Даже внутри ИВВИС объединенные вычислительные ресурсы разнородны (ОС, установленные на наших
машинах, Linux, Solaris). Со стороны ПТЦ в тестовый сегмент Grid тоже подключаются разнородные
вычислительные ресурсы. В будущем в состав разделяемых в рамках Grid ресурсов планируется
включить и систему хранения IBM. Объединяемые, таким образом ресурсы оснащены программным
обеспечением Globus версий 2.4 и 3.0, которое играет базовую связующую роль в построении Grid-сред.
Таким образом, у нас имеется две виртуальных организации (ИВВИС и ПТЦ), в каждой из которых
есть собственный сертификационный орган. Сертификационный орган позволяет пользователю,
получившему в своей организации сертификат доступа к ресурсам, автоматически получать доступ к
ресурсам другой организации, за счет наличия взаимной регистрации (авторизации) сертификационных
органов двух виртуальных организаций. В процессе работы нами были сформированы политики доступа
сотрудников каждой из организаций к ресурсам организации-партнера. Т.е. мы имеем тестовую среду
разделения ресурсов между двумя организациями.
На компьютерных системах Grid-сегмента запущен информационный сервис, собирающий данные о
состоянии ресурсов (Globus MDS) и сервис мониторинга и предсказания состояния коммуникаций и
загруженности ресурсов (NWS – Network Weather Service). Они используются для управления ресурсами
при распределении задач в среде Grid.
Тестирование созданного сегмента в настоящее время выполняется при помощи GRAM –
менеджера ресурсов из пакета Globus. Именно с его помощью задачи запускаются на удаленном
ресурсе. Исполняемые задачи могут предназначаться как для непосредственного запуска (jobmanagerfork), так и для запуска через системы очередей, например PBS (jobmanager-pbs). Это также
подразумевает проверку правильности настройки инфраструктуры AAA (authentication, authorization,
accounting). Впоследствии мы предполагаем начать тестирование состояния систем при помощи тестов
специально разработанных для Grid, в частности, GridLabTest (из проекта GridLab) и GridBench (из
проекта CrossGrid).
162
На базе созданной Grid testbed (опорной вычислительной сети) планируется отработать технологию
объединения ресурсов с возможностью последующего распространения опыта на другие организации. В
настоящее время мы разрабатываем систему информационных и вычислительных сервисов, которая
должна действовать с сохранением уникальности, не вторгаясь и не изменяя внутренние политики
каждого из вычислительных центров.
В будущем как партнеры международного проекта Grid ИВВИС и ПТЦ СПбГУ собираются
участвовать в европейском EGEEGrid, объединяющем разные европейские вычислительные сети.
ОСОБЕННОСТИ ОРГАНИЗАЦИИ СИСТЕМ ХРАНЕНИЯ И ОБРАБОТКИ
ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ
ВЫЧИСЛИТЕЛЬНЫХ ТЕХНОЛОГИЙ
А.В.Богданов, А.В.Бухановский, С.В.Иванов
Институт высокопроизводительных вычислений и информационных систем, СанктПетербург
Тел.: (812) 352-29-97, e-mail: [email protected]
В последнее десятилетие кардинально меняется идеология хранения сверхбольших массивов
данных: от традиционных клиент-серверных систем (DAS-архитектуры) осуществляется переход к
сетевым системам хранения данных (архитектуры NAS и SAN), позволяющим обеспечить виртуализацию
данных в рамках глобальных хранилищ. В свою очередь, это приводит к изменению требований к
технологиям обработки таких данных, в первую очередь – открывая широкие возможности для
применения распределенных и параллельных вычислений. Основным сдерживающим фактором
является то, что современный аппарат Data Mining’a, несмотря на колоссальное количество разработок в
этой области, в основном ориентирован на последовательные вычисления, или в лучшем случае – на
параллельные вычисления в рамках SMP-архитектуры с небольшим (2-32) числом функциональных
устройств. Цель данного доклада – обсуждение эффективных технологий обработки информации в
виртуальных хранилищах, учитывая особенности исследуемых процессов, специфику представления
данных и архитектуру вычислительных систем.
Организация параллельных алгоритмов обработки данных существенно затрудняется их
неоднородностью и наличием различного рода стохастических и функциональных связей. Это
ограничивает возможность применения формальных методов распараллеливания, и требует
привлечения естественных параллельных алгоритмов, которые соответствуют моделям анализа и
синтеза, apriori допускающим параллельное представление. В работе рассматриваются различные
подходы к построению статистических моделей такого рода, основанные на методах декомпозиции по
статистическому ансамблю, индексирующей переменной и однородным таксонам.
Принципиальным вопросом практической реализации параллельных и распределенных алгоритмов
обработки данных является их оптимизация с целью достижения наилучшей производительности для
конкретной архитектуры. Эта идея отражается в т.н. принципе конкуренции параллельных алгоритмов,
который позволяет в зависимости от характеристик исходных данных сформулировать критерии
предпочтения конкретному способу организации коммуникаций между функциональными устройствами.
Учет специфических особенностей архитектуры параллельных систем, не описываемых теоретическими
моделями производительности (например, включение в сеть двух и более маршрутизаторов),
организуется итерационно путем применения алгоритмов динамической балансировки нагрузки. В
докладе рассматриваются практические примеры использования этой технологии применительно к
большим массивам гидрометеорологической информации.
АНАЛИЗ ОБРАЗОВАТЕЛЬНЫХ СТАНДАРТОВ РОССИИ И ГЕРМАНИИ В
ОБЛАСТИ ПРИЛОЖЕНИЯ ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ
ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ ПРИ СОВМЕСТНОЙ ПОДГОТОВКЕ
СПЕЦИАЛИСТОВ ПО КОРАБЛЕСТРОЕНИЮ И ОКЕАНОТЕХНИКЕ
А.В.Богданов, А.Б.Дегтярев, Ю.И.Нечаев, H.Gudenschwager, А.Kraus, W-D.Weiss
Институт высокопроизводительных вычислений и информационных систем,
Государственный морской технический университет, Санкт-Петербург, Россия,
University of Applied Sciences, Бремен, Германия
Тел.: (812) 352-29-97, e-mail: [email protected]
При создании судов и технических средств освоения океана современному инженеру приходится
решать сложные научно-технические проблемы. Успешное их решение связано с применением
информационных технологий, обеспечивающих анализ и прогнозирование развития быстропротекающих
процессов на базе математического моделирования и средств высокопроизводительных вычислений.
163
Комплексность и сложность моделей и методов при решении таких задач ориентирована на цепочку
"моделирование – прогнозирование – принятие решений". Опыт применения методов и моделей,
адекватно описывающих связи и соотношения в динамических системах, показывает, что в глубине их
"информационного среза" оказываются скрытыми сложные и разнообразные явления и процессы,
определяющие парадигму информационного подхода. Осознавая необходимость кооперации в решении
современных проблем науки и образования, ученые Института высокопроизводительных вычислений и
информационных систем и Государственного морского технического университета объединили усилия со
специалистами Бременского Университета Прикладных Наук (Германия), выделив приоритетные
направления исследований, представляющих взаимный интерес. Это открывает новые возможности
понимания естественнонаучных аспектов информационных технологий и высокопроизводительных
вычислений.
В 2003 году исполнился 5-летний срок такого сотрудничества, в результате которого накоплен
определенный опыт проведения совместных исследований, разработки и внедрения алгоритмов
решения прикладных задач, чтения лекций по актуальным вопросам развития интеллектуальных
технологий и высокопроизводительных вычислений, подготовка совместных докладов на
международные конференции, публикации научных статей.
Прочитанный в этот период цикл лекций российских специалистов был связан с вопросами
разработки интеллектуальных систем новых поколений, в том числе и систем мониторинга безопасности
мореплавания, применения информационных технологий обработки информации на основе методов
нечеткой логики, теории искусственных нейронных сетей и генетических алгоритмов, а также основных
направлений применения этих вычислительных технологий к решению сложных задач анализа и
интерпретации информации в системах искусственного интеллекта. Освоение этого материала
позволяет будущим специалистам не только разобраться в огромном потоке информации, посвященном
использованию средств вычислительной техники и информационных технологий в изучаемой
предметной области, но и обеспечить взаимодействие со сложными системами, реализующих
вычисления и возможность использования неполных и неточных данных. Создавая новую модель
объекта проектирования, выпускник университета получает возможность пользоваться преимуществами,
которые дает использование высокопроизводительных информационных технологий и вычислений при
решении нетрадиционных расчетных задач, обеспечивающих управление сложными динамическими
объектами и производственными процессами.
Расширение сотрудничества и апробация методики преподавания студентам кораблестроительных
специальностей применения суперкомпьютерных технологий произошло год тому назад в рамках 39-й
летней школы WEGEMT, проводившейся в Берлине, где присутствовали студенты из многих
университетов Германии, Италии, Франции, Великобритании, Греции, Польши, Литвы. Прочитанные
лекции выявили необходимость введения в образовательный процесс специалистов по
кораблестроению и океанотехнике новых курсов, посвященных современным информационным
технологиям: высокопроизводительным вычислениям, теории и системам поддержки принятия решений,
нечеткой логики, нейронным сетям и т.п.
Совместная деятельность в области науки и образования позволила разработать дальнейшую
программу совместных исследований в области интеллектуальных технологий, а главное – создать
предпосылки к переходу на совместную подготовку специалистов в области вычислительной техники и
информационных технологий с ориентацией на использование высокопроизводительных вычислений в
сложных задачах обработки информации при проектировании, постройке и эксплуатации судов и
плавучих технических средств освоения океана. В настоящее время ведется работа по согласованию
совместных учебных планов и организации подготовки магистров в области информационных технологий
в судостроении на базе Государственного морского технического университета и Института
высокопроизводительных вычислений и информационных систем.
Разработка совместных учебных планов и программ подготовки специалистов потребует
значительных усилий взаимодействующих сторон. Прежде всего, необходимо разработать
компьютерные циклы лекций на английском языке, а также тематику магистерских исследовательских
работ. Сотрудничество по совместной подготовке специалистов будет тесно переплетаться с научноисследовательской работой. Предусматривается широкий обмен информацией в области исследований
и разработок, связанных с математическим и численным моделированием, параллельными
вычислениями, управлением вычислительными ресурсами и информационными потоками,
CAD/CAM/CAE системами. Это позволит определить ключевые направления в исследованиях,
содержащих принципиально новые результаты, представляющие взаимный интерес. Планируется обмен
специалистами, студентами и аспирантами, организация совместных семинаров; взаимные консультации
в области разработки специальных приложений и портинга.
Особенность разрабатываемого комплекса учебно-методического обеспечения процесса обучения
по дисциплинам информационного цикла состоит в том, что в его основу положен тщательно
разработанный тезаурус терминов по читаемым курсам. Применение двухуровневых шрифтовых
выделений ключевых слов создает основу для формирования компьютерного гипертекста и
параллельной разработки компьютерной модели комплекса. Для большинства реальных приложений,
определяемых дисциплинами информационного цикла, построить адекватную модель подготовки
специалиста исключительно сложно. Это предъявляет определенные требования к структурированию
учебного материала, формированию межпредметных связей, изменению содержания методической
литературы и организации соответствующего справочного аппарата.
164
В рамках программы DAAD участниками совместных научно-исследовательских работ
предусматривается развитие аппарата знаний, направленного на формирование новых поколений
информационных технологий – от базового уровня до средств интеллектуализации, основанных на
децентрализованном, асинхронном, максимально параллельном процессе вычислений. Построение
лекционного материала на основе этих принципов будет способствовать совершенствованию знаний в
области интеллектуальных технологий и высокопроизводительных средств вычислений, находящих
применение в экспериментальных системах, обеспечивающих моделирование, прогнозирование и
принятие решений в сложных ситуациях виртуальной реальности, но еще не созревших для
использования в серьезных технических приложениях. Расширению возможностей освоения изучаемого
материала в области перспективных информационных технологий способствует использование
глобальной информационно-коммуникационной системы Интернет.
Проблема распараллеливания императивных программ образует определенный барьер на пути
широкого распространения многопроцессорных систем. Уровень автоматизации проектирования
аппаратных средств и стоимость элементной базы позволяют производить компьютеры с любым числом
процессоров. Однако разработка нового программного обеспечения, по-прежнему, остается задачей,
решаемой только специалистами высокого уровня. В новой парадигме интеллектуальных технологий
параллельность перестает быть проблемой, а становится естественным свойством программной
системы.
Авторы выражают надежду, что активно развиваемая в последние годы интеграция различных школ
и направлений в области компьютеризации образования обогатит научную методологию подготовки
специалистов в области информационных технологий и высокопроизводительных средств вычислений.
Это будет способствовать не только формированию и углублению понимания роли информационных
технологий и высокопроизводительных средств вычислений, которые необходимы для дальнейшего
развития техники и технологий судостроения, но и повышению качества системы университетского
образования в области морской инженерии, скорейшему разрешению многих проблем развития
современной высшей школы и, прежде всего, актуальной проблемы интеграции образования.
ИСПОЛЬЗОВАНИЕ GRID-ТЕХНОЛОГИЙ ПРИ МОДЕЛИРОВАНИИ СЛОЖНЫХ
ФИЗИКО-ХИМИЧЕСКИХ СИСТЕМ
Ю.Е.Горбачев, В.В.Кржижановская, П.М.А.Слоот
Институт высокопроизводительных вычислений и баз данных, СанктПетербургский государственный политехнический университет, Санкт-Петербург
Тел.: (812) 247-58-79, e-mail: [email protected]
Численное моделирование является одним из важнейших инструментов в процессе создания и
оптимизации современных технологических установок, обладающих сложной пространственной
конфигурацией и множеством определяющих параметров системы. Адекватная физико-математическая
модель в таких задачах предполагает учет множества взаимосвязанных разномасштабных физикохимических процессов, таких как плазменный разряд, конвективный и диффузионный
тепломассоперенос, объемные и поверхностные химические реакции, горение, конденсация-испарение,
адсорбция-десорбция и т.д. Трехмерное компьютерное моделирование процессов столь высокой
сложности предъявляет чрезвычайно высокие требования к эффективности применяемых методов и
алгоритмов, а также к используемым вычислительным ресурсам. Проведение таких расчетов возможно
только с использованием суперкомпьютеров или высокопроизводительных вычислительных кластеров.
Наиболее перспективной и быстро развивающейся технологией параллельных вычислений в настоящее
время является метод распределенных вычислений на компьютерных кластерах, связанных в Gridсистему. Grid-технологии обеспечивают прозрачный защищенный доступ и средства управления
динамически меняющимися географически удаленными децентрализованными гетерогенными
ресурсами и данными.
В рамках данного проекта было разработано программное окружение для численного
моделирования реакторов плазмохимического осаждения [1,2] в Grid-системах. Созданное окружение
обеспечивает быструю защищенную передачу и анализ данных и позволяет проводить эффективные
исследования влияния различных параметров системы на определяющие характеристики протекающих
процессов. Разработанная интегрированная система [3,4] предоставляет пользователю полный спектр
сервисов для быстрой инициализации, компиляции, запуска, контроля и визуализации результатов
численного моделирования в распределенной вычислительной Grid-системе, не тратя время на такие
рутинные операции, как аутентификация и авторизация в каждом из узлов Grid-сети, нахождение
свободных вычислительных ресурсов и сервисов, их регистрация и управление, репликация кода на
доступные вычислительные системы, запуск расчетных задач и их мониторинг. Все эти операции
выполняются автоматически Grid-сервисами, к которым обращается программное окружение.
Разработки велись на основе экспериментального Grid-окружения, построенного в рамках
европейского проекта CrossGrid [5] с использованием стандарта HLA, разработок проекта DataGrid, а
также программных средств и протоколов Globus Toolkit 2. Стандарт HLA (High Level Architecture) [6]
позволяет интерактивно интегрировать программные модули, расположенные на компьютерах с
разнородными операционными системами, используя сценарии, которые можно модифицировать по
165
ходу выполнения расчетов. Основными преимуществами использования HLA являются гибкость,
удобство повторного использования различных компонентов программного комплекса, а также наличие
всех необходимых компонентов для организации отказоустойчивого вычислительного процесса, что
особенно важно при работе в распределенных компьютерных сетях с вероятным выключением
отдельных вычислительных узлов или сетевых соединений. Данные свойства были использованы для
интеграции модулей расчетов, интерактивных коммуникаций и визуализации в Grid-окружении, включая
организацию чекпойнтинга и миграции задач [7].
Ключевым компонентом использованной Grid-архитектуры является Migrating Desktop – Grid-портал,
разработанный как Web-приложение и являющийся "рабочим столом" пользователя ресурсов Grid.
Migrating Desktop предоставляет доступ к локальным и удаленным Grid ресурсам и сервисам с
произвольного компьютера, подключенного к Интернету и оснащенного лишь Интернет-браузером с
включенным разрешением на запуск виртуальной машины Java. Заходя в портал Migrating Desktop,
пользователь автоматически авторизуется в Grid-системе и получает в окне браузера виртуальный
рабочий стол с сохраненными настройками, списком доступных Grid ресурсов и сервисов, индикацией
текущего состояния выполняемых заданий, архивами результатов и т.д.
Созданный программный комплекс включает в себя: графический интерфейс пользователя, блок
формирования начальных данных задачи, базы данных физико-химических свойств газов и химических
процессов с удобным редактором, генератор многоблочных расчетных сеток, модуль расчета
плазменного разряда, модуль решения трехмерных уравнений динамики многокомпонентной газовой
смеси с химическими реакциями, программы обработки и визуализации результатов расчетов, а также
средства взаимодействия всех вышеперечисленных модулей, запуска и контроля заданий в Gridсистеме.
Все модули программного комплекса разработаны как платформо-независимые коды,
обрабатываемые GNU C++ компилятором. Для имплементации HLA сценариев была использована
инфраструктура RTI (Run Time Infrastructure). Параллелизм в расчетных модулях реализован с
использованием стандарта передачи сообщений MPICH-G2, варианта MPICH, использующего Globus I/O
для межпроцессорных коммуникаций и Globus DUROC для совместного распределения ресурсов.
Менеджер ресурсов был разработан в рамках CrossGrid проекта на базе компонентов DataGrid.
Интерфейс пользователя разработан с использованием свободно распространяемых графических
библиотек GTK+. Модули визуализации написаны на языке Java, а для визуализации в трехмерной
виртуальной реальности использовались библиотеки VTK.
Построенное программное окружение было протестировано на Grid-системе DAS2 (Distributed ASCI
Supercomputer), объединяющей ресурсы пяти голландских университетов, а также в расширенной
системе Grid, объединяющей ресурсы 21 участника панъевропейского проекта CrossGrid.
Работа выполнена в тесном сотрудничестве с университетом Амстердама при частичной поддержке
РФФИ/NWO грантов № 047.016.007 и 047.016.018.
Литература
1. Горбачев Ю.Е., Затевахин М.А., Кржижановская В.В., Швейгерт В.А. "Особенности роста пленок
гидрированного аморфного кремния в PECVD-реакторах". ЖТФ, 2000, том 70, выпуск 8, С. 77-86.
2. V.V. Krzhizhanovskaya, M.A. Zatevakhin, A.A. Ignatiev, Y.E. Gorbachev, P.M.A. Sloot. "Distributed
Simulation of Silicon-Based Film Growth". Lecture Notes in Computer Science, Vol. 2328, pp. 879-888.
Springer-Verlag 2002.
3. V.V. Krzhizhanovskaya, P.M.A. Sloot, Yu.E. Gorbachev. "Grid-based Simulation of industrial thin Film
Production". Simulation: Transactions of The Society for Modeling and Simulation International, Special Issue on
Applications of Parallel and Distributed Simulation, October 2004 (in press).
4. Iskra, K.A., Belleman R.G., Van Albada G.D., Santoso J., Sloot P.M.A., Bal H.E., Spoelder H.J.W. and
Bubak M. "The Polder Computing Environment, a system for interactive distributed simulation". Concurrency
and Computation: Practice and Experience (Special Issue on Grid Computing Environments), 2002, v. 14, pp.
1313-1335.
5. The CrossGrid EU Science project: http://www.eu-CrossGrid.org.
6. HLA specifications: http://www.sisostds.org/stdsdev/hla/.
7. K. Zajac, M. Bubak, M. Malawski and P.M.A. Sloot. "Towards a Grid Management System for HLA-Based
Interactive Simulations". Proc. of the 7th IEEE International Symposium on Distributed Simulation and Real
Time Applications. IEEE Computer Society, Delft, The Netherlands, October 2003, pp. 4-11.
166
РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ И ИНФОРМАЦИОННЫХ РЕСУРСОВ
ЦЕНТРА ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ ВЫЧИСЛИТЕЛЬНЫХ
КЛАСТЕРНЫХ ТЕХНОЛОГИЙ СПбГПУ
А.В.Забродин, Н.Н.Шабров, А.А.Соломатников, И.Д.Лопатухин
Санкт-Петербургский государственный политехнический университет
Тел.: (812) 552-77-70, e-mail: [email protected]
Развитие и применение высокопроизводительных вычислительных кластерных технологий в
машиностроении стимулировано насущной необходимостью решения сложных промышленных задач. В
первую очередь к этим задачам следует отнести задачи по моделированию газодинамических и
химических процессов, возникающие в автомобильной, судостроительной и авиационной
промышленности и задачи моделирования сложного динамического поведения различных механических
систем. Моделирование столкновений автомобилей для анализа безопасности пассажиров и пешеходов
(так называемые «крэш-тесты») и моделирование газодинамических процессов в турбомашинах с
вычислительной точки зрения относятся к наиболее важным и ресурсоемким, и выполняется на
высокопроизводительных вычислительных кластерах.
Полный цикл компьютерного моделирования включает в себя последовательное использование
специализированного CAD/CAE/CFD/3DiVR программного обеспечения. Как правило, моделирование
начинается с создания твердотельной модели объекта в одном их CAD (Computer Aided Design) пакетов,
затем модель импортируется в зависимости от типа исследования либо в CFD (Computational Fluid
Dynamics) систему, либо в CAE (Computer Aided Engineering) систему. В завершение исследования
результаты моделирования визуализируются как сцены трехмерной виртуальной реальности на
программно-аппаратном 3DVR (Virtual Reality) комплексе.
В
Санкт-Петербургском
государственном
политехническом
университете
на
кафедре
«Компьютерные технологии в машиностроении» механико-машиностроительного факультета и центре
высокопроизводительных вычислительных кластерных технологий установлено два вычислительных
кластера:
 16 CPU IA-32, Dual 8-port Myrinet-SAN switch;
 16 CPU x-86 64 bit AMD Opteron 244.
Высокопроизводительные вычислительные кластеры являются одной из основ вычислительного
обеспечения развития критических и прорывных технологий федерального уровня. Выбор архитектуры
кластера обусловлен анализом текущего состояния и перспектив развития микропроцессоров. Рейтинги
specbench (http://www.specbench.org) показывают заметное преимущество в производительности
процессора AMD Opteron по сравнению с процессорами IA-32 и, в частности, в сравнении с
процессорами Xeon. На кластере инсталлировано специализированное программное обеспечение: CFD
система FLUENT и ее препроцессор GAMBIT и CAE система MPP LS-DYNA 970. Имеющиеся лицензии
позволяют распараллеливать процесс решения задачи на 32 процессорах кластеров.
Кластер 16 CPU IA-32 используется в основном студентами университета в учебном процессе для
проведения занятий по системам FLUENT, GAMBIT и MPP LS-DYNA, а также по изучению
программирования в среде MPI. Кластер 16 CPU AMD x-86 64 bit Opteron используется аспирантами и
научными сотрудниками университета для выполнения исследований по темам дипломных работ и
магистерских диссертаций с использованием программных систем FLUENT, GAMBIT и MPP LS-DYNA.
Решено большое количество сложных задач из области моделирования нестационарных
газодинамических процессов в турбомашинах. Решены задачи по моделированию столкновений
автомобилей для некоторых моделей автомобилей АО «АвтоВАЗ» и ряда моделей автомобилей
некоторых зарубежных фирм. В настоящее время кластерная система X-84/64 AMD завершила стадию
тестирования на тестах LINPACK и реальных задачах. Компания LSTC (Livermore Software Technology
Corporation) – разработчик программной системы LS-DYNA – обратилась на кафедру «Компьютерные
технологии в машиностроении» ММФ с просьбой протестировать производительность и
работоспособность программного кода LS-DYNA на платформе AMD и процессоре Opteron на примере
решения задачи о столкновении трех автомобилей. Конечно-элементная модель трех автомобилей
включает конечные элементы разных типов и содержит порядка 1,5 млн. степеней свободы. Результаты
тестирования
производительности
кластера
на
этой
задаче
представлены
на
сайте
http://www.topcrunch.org. По показателям производительности кластер показал заметное
преимущество в производительности по сравнению с кластерами на процессоре Xeon.
Естественным дополнением моделирования газодинамических процессов и динамики механических
систем на кластерах является возможность визуализации результатов моделирования как сцен
трехмерной виртуальной реальности на программно-аппаратном комплексе WorkBench, установленном в
центре высокопроизводительных вычислительных кластерных технологий ММФ.
Результаты компьютерного моделирования газодинамических процессов, динамики механических
систем и объекты CAD моделирования визуализируются как сцены трехмерной виртуальной реальности.
Стереоскопическая интерактивная визуализация – мощный инструмент определения и устранения
проблем проектирования на гораздо более ранней стадии разработки. Интегрирование современных
компьютерных технологий инженерного труда в виде единой среды разработки, моделирования и
качественно нового уровня визуализации результатов моделирования, позволяет качественно изменить
труд инженеров по созданию передовых образцов техники.
167
Авторы доклада благодарят РФФИ за поддержку в части проведенных исследований в рамках гранта
№ 02-07-90011.
УНИВЕРСАЛЬНЫЕ КЛИЕНТ-СЕРВЕРНЫЕ РЕАЛИЗАЦИИ
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ФИЗИЧЕСКИХ ЯВЛЕНИЙ И ПРОЦЕССОВ
Д.И.Иванов, И.А.Цикин
Санкт-Петербургский государственный политехнический университет
Тел.: (812) 552-76-39, e-mail: [email protected]
В настоящее время как в научных исследованиях, так и при использовании современных технологий
обучения широко применяются методы математического моделирования физических процессов и
явлений. Сетевой удаленный доступ к таким моделям позволяет реализовать технологии группового
проектирования или группового обучения в среде открытого образования, не требуя наличия мощного
компьютера у конечного пользователя. В таком случае всю вычислительную нагрузку берет на себя
сервер. Такой подход позволяет также организовать централизованное управление изменением свойств
модели, которые без каких либо усилий со стороны конечных пользователей станут им доступны.
В ряде случаев целесообразно использовать специализированные программные среды, на основе
которых можно создать ту или иную модель, например, в целях схемотехнического проектирования или
на основе графического программирования. Однако часто необходимо, например, при реализации
метода статистических испытаний, реализовать не только многопользовательский сетевой доступ к ней,
чего иногда не могут предоставить некоторые специализированные среды, но и обеспечить высокий
уровень быстродействия. В подобных случаях может оказаться эффективным использование
универсальных языков программирования высокого уровня с некоторыми базовыми библиотеками,
ориентированными на создание той или иной модели. Такой подход позволяет не только выиграть в
скорости выполнения моделирования, но и более гибко описать способы взаимодействия в
многопользовательском
режиме,
применяя
различные
методы
оптимизации
вычислений,
ориентированных на конкретную модель.
Целью
настоящей
работы
является
исследование
возможностей
и
реализация
многопользовательского удаленного сетевого доступа к сложным компьютерным моделям физических
процессов и устройств на основе описанной выше концепции. При этом важным с точки зрения
практического применения является вид реализации, позволяющий снизить требования к пропускной
способности каналов доступа конечного пользователя, вплоть до использования соединений dial-up.
Одним из перспективных решений этой задачи является реализация такой системы в рамках
использования HTML, HTTP и других элементов Интернета на основе технологии «клиент/сервер».
Основными составными частями системы являются исполняющее приложение, Web-сервер,
коммуникационный шлюз, Web-браузер пользователя. Исполняющим приложением является собственно
программный комплекс, обеспечивающий процедуру моделирования. В простейшем случае таковым
является MDI (Multi Desktop Interface) Windows приложение, которое может реализовывать одновременно
несколько моделей, являющихся копиями основного моделирующего алгоритма, но с различными
начальными условиями. Это обеспечит возможность использования одного моделирующего алгоритма
одновременно несколькими пользователями. Роль коммуникационного шлюза выполняет CGI-сценарий,
работающий в среде Web-сервера, и при этом обеспечивается взаимодействие с исполняющим
приложением. Эта программа занимается разбором и оформлением полученных данных от
исполняющего приложения, а также посылкой ему команд управления.
Все эти элементы взаимодействуют между собой по протоколу TCP/IP. Использование такого
подхода позволяет разделить моделирующую машину и машину, формирующую (оформляющую)
результаты. Эти машины могут располагаться на разных Интернет-узлах и быть территориально
разнесенными. Универсальная часть системы моделирования, инвариантная к виду моделируемого
алгоритма, с учетом выбранного способа удаленного доступа основывается на следующих
составляющих: Web-сервер, коммуникационный шлюз и браузер. Программная реализация
исполняющего приложения обеспечивает взаимодействие с коммуникационным шлюзом, используя
отдельно оговоренные макросы.
В работе произведена оценка таких показателей, как время расчетов для одной модели в
зависимости от числа одновременно выполняемых процессов моделирования; объем памяти,
занимаемый программным комплексом, в зависимости от числа одновременно выполняемых процессов
моделирования; время от подачи запроса до получения результатов в зависимости от числа
подключенных пользователей; объем передаваемых по сети данных для одного клиента. Рассмотрены
пути улучшения этих показателей.
В качестве примера моделировался процесс пакетной передачи данных применительно к модели
информационного обмена между модемами системы распределенного мониторинга. Исходными
данными являются формат пакета, протокол обмена и вероятность ошибки на бит. Результатом
моделирования является оценка помехоустойчивости алгоритма, использующего процедуру контроля
циклической избыточности пакета. Реализованная в ходе работы система, основанная на Web-среде,
позволяет производить удаленные эксперименты одновременно многим пользователям, причем их
количество определяется вычислительной производительностью аппаратной части сервера. Так, в ходе
168
эксперимента на ПК Pentium III 1000 (385 MB RAM, операционная система Windows 2000) при 106 циклах
моделируемого информационного обмена (генерация пакета, внесение ошибок, анализ результата
обработки пакета) разработанная система позволила одновременно обслуживать 10 пользователей в
мультизадачном (квазипараллельном) режиме, причем время ожидания окончания эксперимента для
каждого пользователя не превышало 1 минуты.
РАЗРАБОТКА WEB-ОРИЕНТИРОВАННЫХ ИНТЕРАКТИВНЫХ МОДЕЛЕЙ
ФИЗИЧЕСКИХ И МАТЕМАТИЧЕСКИХ ОБЪЕКТОВ
О.Д.Андреев, Д.А.Кудряшов, А.Б.Никитин, И.А.Цикин
Санкт-Петербургский государственный политехнический университет
Тел.: (812) 552-76-39, e-mail: [email protected]
При создании учебно-методических материалов по естественнонаучным и инженерно-техническим
дисциплинам, предназначенных для использования в сети Интернет, важной задачей является
определение базовой технологии и разработка на ее основе интерактивных динамических моделей,
включаемых в состав учебных курсов.
Интерактивные модели, предназначенные для описания физико-математических объектов, не
отличающихся чрезмерной сложностью, т.е. модели, исполняющие лишь иллюстративные функции, а
также такие, которые характеризуются относительно небольшими объемами и некритичны к
вычислительным возможностям рабочих станций пользователей, могут быть созданы в виде небольших
приложений, загружаемых на компьютер пользователя и выполняемых на нем встроенным в браузер
дополнительным модулем. Настоящая работа посвящена анализу опыта разработки именно таких
интерактивных моделей применительно к формированию Web-ориентированного учебного контента
физико-математической направленности для учащихся школ и абитуриентов технических вузов.
Среди современных технологий создания интерактивных моделей подобного рода выделяются две
наиболее распространенные технологии, обладающие достаточно широкими функциональными
возможностями – это Java и Flash. Проведенные исследования показали, что Java- и Flash-технологии
весьма близки по своим функциональным возможностям и позволяют разработчику создавать на их
основе интерактивные Web-материалы, в том числе и в области физико-математических дисциплин.
Созданные на основе Java и Flash-технологий интерактивные модели, иллюстрирующие некоторые
математические факторы и понятия, обладают схожим внешним видом и техническими
характеристиками. Проведенные сравнительные исследования эффективности использования памяти
компьютера Java- и Flash-приложениями, а также размеров получаемых файлов показали близость
характеристик исследуемых технологий. Например, при разработке Интернет-пособия по математике
средний размер Flash-приложения составил около 15 KB, а Java-приложения – несколько более 16 KB.
Аналогичная ситуация и по объему занимаемой Java- и Flash-приложениями памяти. Исследования
вычислительной и графической производительностей технологий показали, что Java-приложения
обладают существенным (на порядок и более) преимуществом. Это в первую очередь должно сказаться
при создании и использовании динамических моделей сложных процессов и задач, предъявляющих
повышенные требования к объему математических вычислений. Однако при экспертной оценке
функционирования даже простейших математических моделей в ряде случаев отмечается то же
преимущество Java-приложений.
В то же время, Flash предоставляет чрезвычайно удобные и мощные средства разработки
графических интерфейсов. Поэтому представляется целесообразным применение Flash-технологии там,
где внешняя сторона представления данных имеет определяющее значение и не требуется сложных
математических вычислений. Java-технология более приспособлена для решения задач, не
предъявляющих чрезмерных требований к интерфейсу приложений и требующих дополнительных
вычислительных возможностей. Поэтому в процессе определения базовой технологии создания
иллюстративных динамических моделей для курса физики выбор был остановлен на Flash, а при
разработке пособия математике использовалась в основном Java.
Анализ типовых задач, решаемых в процессе визуализации учебного материала по математике,
позволил сформулировать требования к универсальной интерактивной модели, используемой в целом
ряде разделов математики школьного курса: «Функция», «Область определения и множество значений
функции», «Функция, обратная данной», «Преобразования графика функции», «Параметрические
задачи». Такая унифицированная модель должна обладать следующими функциональными
возможностями:
 визуализация масштабируемой координатной сетки на плоскости
просмотра;
 построение на этой плоскости графиков уравнений

a
x0 y
с управляемым окном



f ( x, y, a )  0 , где a
- набор параметров;
 динамическая визуализация влияния параметров
на отображаемые графики с
предоставлением пользователю удобных и наглядных инструментов управления моделью,
включающих кнопки и ползунковые регуляторы, технологию drag&drop. Исследования,
проведенные в процессе разработки интерактивных моделей, предназначенных для решения
169
вышеуказанных задач, позволили определить оптимальную структуру Java-апплета. Особое
внимание при этом было уделено минимизации кода и масштабируемости апплетов, повышению
их производительности.
В процессе создания серии Flash-моделей лабораторных практикумов, предназначенных для
пособия по физике, были определены основные требования к универсальной части интерактивной
модели широкого назначения, которая может быть использована при изложении целого ряда разделов:
«Оптика», «Силы упругости», «Гидростатика» и др. К числу базовых требований можно отнести:
 удобный интерфейс ввода данных при наличии инструментов контроля и индикации;
 средства построения математических зависимостей, отражающих физический смысл проводимого
эксперимента;
 интерактивные анимации, иллюстрирующие ход физического эксперимента.
На основании данных требований для унифицирования процесса создания Flash-моделей для
пособия по физике разработан набор инструментальных средств, упрощающий процедуру разработки. В
состав инструментария входят: набор часто встречающихся функций, прототипы типичных для данной
серии моделей объектов, визуальные компоненты для создания пользовательского интерфейса.
В результате работы на основе экспериментального сравнения Flash- и Java-технологий определены
предпочтительные области их использования при разработке Web-ориентированных моделей для
учебных материалов. С целью повышения степени унификации сформулированы требования к
стандартной типовой модели, оптимизирована ее структура. Созданы наборы интерактивных моделей,
встраиваемых в учебные курсы по математике и физике.
ПРИНЦИПЫ РЕАЛИЗАЦИИ ЛАБОРАТОРНЫХ ПРАКТИКУМОВ НА ОСНОВЕ
СЕТЕВОГО УДАЛЕННОГО ДОСТУПА К СЕРВЕРУ КОМПЬЮТЕРНЫХ
МОДЕЛЕЙ И БАЗАМ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
В.А.Сороцкий, О.М.Урлапова, И.А.Цикин
Санкт-Петербургский государственный политехнический университет
Тел.: (812) 552-76-39, e-mail: [email protected]
Технологии реализации лабораторных практикумов, основанных на сетевом удаленном доступе к
техническому оборудованию, обладают как неоспоримыми достоинствами [1], так и определенными
недостатками, затрудняющими их применение в образовании. Одним из наиболее серьезных
недостатков является сравнительно низкая пропускная способность, поскольку большинство из
лабораторных установок, как правило, могут быть использованы только в режиме индивидуального
управления. Кроме того, удаленное управление не исключает возможность возникновения в ходе работы
аварийных ситуаций, связанных как с ошибками в канале передачи, так и с недопустимыми
управляющими командами удаленного пользователя. В этой связи большой интерес вызывает
исследование и разработка технологий, обеспечивающих реализацию лабораторных практикумов в
режиме удаленного доступа с использованием баз и хранилищ данных, созданных на основе
экспериментов с уникальным и дорогостоящим оборудованием. Доступ к подобным моделям может быть
осуществлен путем создания серверов множественного асинхронного удаленного сетевого доступа.
Создание подобных серверов может быть осуществлено на основе различных программных сред,
обеспечивающих встроенную поддержку стека протоколов TCP/IP. Однако, принимая во внимание, что
при разработке лабораторных практикумов по дисциплинам инженерного образования обычно требуется
создание большого количества нестандартных библиотек приборов, разработка которых при
использовании
универсальных
программных
сред
достаточно
трудоемка,
целесообразно
воспользоваться программно-аппаратной системой графического программирования типа LabVIEW.
Применение данной среды позволяет значительно сократить время, необходимое на разработку
программных средств научной направленности и использовать функционально-полные готовые модели
наиболее распространенных технических устройств. При этом особое внимание уделяется
исследованию особенностей реализации таких, стандартных для большинства «клиент-серверных»
приложений функций, как:
 минимизация времен реакции на запрос и его выполнения;
 нахождение разумного соотношения между величиной объемов данных, пересылаемых по сети, и
легкостью исполнения на клиентской машине;
 проверка введенных пользователем данных;
 контроль доступа к модели путем идентификации зарегистрированных пользователей по имени и
паролю;
 регистрация новых пользователей;
 регистрация времени работы пользователя с удаленным оборудованием;
 возможность получения информации о состоянии работы сервера и пользовательского запроса;
 возможность завершения работы с сервером по желанию пользователя;
 ограничение числа одновременно работающих с моделью пользователей;
 реализация кэширования промежуточных и конечных результатов вычислений;
170
 обработка исключительных ситуаций и корректное завершение работы с пользователем и
моделью.
Пилотная модель «клиент-серверного» приложения множественного асинхронного доступа,
отвечающая перечисленным выше требованиям, была создана на основе системы LabVIEW. На сервер
помимо обработки начальных данных компьютерной моделью возложены функции регистрации и
идентификации пользователей, контроль за количеством одновременно работающих с моделью
клиентов, организация кэширования, а также пересылка результатов работы модели клиенту и
обработка исключительных ситуаций. К основным функциям клиента, помимо ввода начальных данных,
относится осуществление связи с сервером, проверка введенных пользователем данных [2] и
преобразование данных, полученных в результате обработки на сервере, в доступную для
пользовательского восприятия форму, что позволяет максимально разгрузить сеть. При недостаточной
мощности клиентской машины возможно переложение части функций обработки конечных результатов
на компьютер-сервер. Работа сервера организована по циклической схеме, т.е. сервер последовательно
проходит все стадии обработки запроса и переходит к следующему запросу, не завершая связи с
предыдущим клиентом.
При использовании моделей, требующих для работы сравнительно больших интервалов времени, с
целью уменьшения времени ожидания пользователей более эффективна схема сервера с параллельной
обработкой запросов, при которой сервер создает отдельный поток для каждого подключившегося
клиента. Подобная схема позволяет обеспечить одинаковую задержку для всех клиентов, которая в
общем случае будет больше задержки первого из пришедших клиентов в циклической схеме обработки.
Другим способом, уменьшающим задержки в работе сервера, может стать переход к событийной модели
работы сервера. Эта модель позволяет экономить ресурсы серверного компьютера за счет исключения
из обработки данных неактивных пользователей, которые подлежат повторной обработке в случае
циклической модели сервера.
Таким образом, на основе проведенных исследований можно рекомендовать несколько вариантов
реализации структуры сервера моделей и алгоритмов его функционирования. Выбор конкретного
варианта должен осуществляться на основе поставленных требований к режимам работы сервера, а
также с учетом особенностей размещенных на нем моделей.
Литература
1. Поляков А., Арбузов Ю., Маслов С. и др. Новый подход к инженерному образованию: теория и
практика открытого доступа к распределенным информационным и техническим ресурсам. Под.ред.
Полякова А.А. – М.: Центр-Пресс, 2000. – 238 с.
2. Пустовалов Д. Об архитектуре программных систем сбора данных и управления. Открытые
системы, 1997, №5.
ИНТЕРАКТИВНЫЕ ВИРТУАЛЬНЫЕ СРЕДЫ С ПОГРУЖЕНИЕМ:
КОНЦЕПЦИЯ, РЕАЛИЗАЦИЯ И ОПЫТ ИСПОЛЬЗОВАНИЯ В ОБРАЗОВАНИИ
А.А.Никитин, А.В.Никитин
Государственный центр компьютерного интерактивного моделирования, СанктПетербургский государственный университет аэрокосмического приборостроения,
Санкт-Петербург
Тел.: (812) 313-70-44, 315-89-40, e-mail: [email protected], [email protected]
В докладе рассматривается концепция интерактивных виртуальных сред с индивидуальным и
групповым погружением, позволяющих пользователям взаимодействовать с объектами и персонажами
мира и между собой на основе устройств прямого доступа с использованием текста, голоса, жестов,
видео и др. в одно- или многопользовательском режимах.
Приводятся структура и режимы работы виртуальной среды. Особое внимание уделяется
интерфейсу пользователя, поддерживающего:
 уровень погружения – трехмерный аудиовизуальный мир с шестью степенями свободы и
кинестетическими ощущениями – посредством одно- и многоэкранных (моно и стерео)
настольных, проекционных и носимых (персональный дисплей) устройств, аудиосистем и системы
имитации нагрузок;
 вид интерактивности – передвижение в трехмерном мире, взаимодействие с объектами,
реагирование на воздействия – посредством клавиатуры, мыши, трекбола, джойстиков, перчатки,
трекеров, микрофона, велосипеда (руль и педали).
Рассматриваются особенности реализации виртуальной среды – поддержка распределенных
вычислений на кластерах персональных компьютеров, стандарта VRPN для подключения VRпериферийных устройств, методов синхронизации многоэкранных конфигураций, средств доставки
пользователю (компакт-диски и Интернет), реализация на основе платформ VRML/X3D/MPEG4
(Интернет-качество) и Virtools (высокореалистичные приложения реального времени).
Приводятся примеры использования виртуальной среды при выполнении образовательных
проектов:
171
 Виртуальный мир университетов Санкт-Петербурга.
 Изучение русского языка как иностранного (совместно с СПбГУ, грант ЮНЕСКО).
 Электронные путешествия и соревнования с использованием кибернетического велосипеда
(совместно с Zentrum für Kunst und Medientechnologie Карлсруэ, Германия и Centre for Interactive
Cinema Research, University of New South Wales, Сидней, Австралия).
 Виртуальный музей Второй мировой войны.
Рассматриваются некоторые достоинства использования подобных сред в образовании, в частности,
целостное сенсорное восприятие объекта, непосредственное формирование опыта, активное
использование сенсорики и моторики человека, поддержка текстовой, речевой и невербальной
коммуникации.
Доклад сопровождается демонстрацией разработанных сайтов и многопользовательских серверов,
изданных компакт-дисков.
АРХИТЕКТУРА И ПРИНЦИПЫ ПОСТРОЕНИЯ МУЛЬТИ-АГЕНТНЫХ
ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМ НОВОГО ПОКОЛЕНИЯ
А.В.Тимофеев
Санкт-Петербургский институт информатики и автоматизации Российской
академии наук
Тел.: (812) 328-04-21, e-mail: [email protected]
Глобальные мульти-агентные телекоммуникационные системы (ТКС) служат для представления
пользователям информационных и вычислительных ресурсов, распределённых в компьютерных сетях
(КС). Архитектура таких ТКС состоит из четырёх основных подсистем:
 распределённая система связи (РСС);
 сетевая система управления (ССУ);
 распределённая информационная система (РИС);
 распределённая транспортная система (РТС).
Все указанные подсистемы мульти-агентной ТКС имеют распределённый характер, взаимосвязаны и
активно взаимодействуют между собой в процессе обслуживания пользователей информационными и
вычислительными ресурсами, хранящимися в глобальной КС.
Главную роль в целенаправленной и высококачественной обработке информации и адресной
передаче потоков данных по запросам пользователей играет ССУ. Она получает через РСС запросы
клиентов и команды сетевых администраторов ТКС, обрабатывает внутреннюю информацию о текущем
состоянии РТС и внешнюю информацию о состоянии информационных и вычислительных ресурсов в КС,
поступающую от РИС, и формирует управление РТС, обеспечивающее удовлетворение запросов
пользователей путём передачи им необходимых информационных и вычислительных ресурсов КС.
Основной задачей ССУ глобальных ТКС нового поколения, работающих на больших скоростях
передачи данных, является адаптивное формирование мульти-агентного управления трафиком
гетерогенных данных большого объёма с надёжными гарантиями высокого качества обслуживания
(Quality of Service, QoS) пользователей ТКС. Решение этой задачи распадается на локальные задачи
управления потоками данных, адаптации к изменяющемуся трафику, предотвращения перегрузок,
разрешения сетевых конфликтов и т.п.
Традиционно для организации управления потоками данных и оборудованием РТС используются
сетевые принципы и архитектуры централизованного или децентрализованного управления. Учитывая
недостатки описанных традиционных сетевых архитектур, целесообразно разработать “гибридную”
архитектуру ССУ для глобальных ТКС нового поколения, сочетающую в себе достоинства
централизованной и децентрализованной архитектур. Будем называть такую “компромиссную”
архитектуру мульти-агентной архитектурой ССУ.
В этом случае основные функции обработки информации и управления потоками данных в
глобальных ТКС нового поколения распределяются между взаимосвязанными интеллектуальными
агентами. Каждый сетевой агент имеет собственную локальную БД и БЗ и средства связи с другими
агентами для обмена информацией в процессе совместного (кооперативного) принятия решений и
автоматического формирования сетевого управления РТС, обеспечивающего адресную доставку
информационных вычислительных ресурсов КС по запросам пользователей глобальной ТКС.
В роли сетевых агентов могут выступать компьютеры ССУ, связанные с узлами РТС, а также
программные агенты РСС и РИС. Будем называть таких агентов внутренними агентами глобальной ТКС.
Тогда роль внешних агентов играют пользователи (клиенты, администраторы и т.п.) вместе со
средствами доступа в ТКС и сетевым интерфейсом, а также компьютерные узлы (хосты) КС.
В процессе проектирования ССУ на базе теории агентов возникают новые проблемы организации
многоадресной и многопотоковой адресации и мульти-агентного диалога между внутренними агентами
глобальной ТКС нового поколения и внешними агентами-пользователями и агентами КС как
распределённого хранилища данных, знаний и приложений. Для решения этих проблем необходимо
172
разработать методы предотвращения или автоматического разрешения сетевых конфликтов под
контролем адаптивной и интеллектуальной ССУ с мульти-агентной архитектурой.
Для управляемой адресной передачи и навигации потоков данных, разрешения сетевых конфликтов,
функциональной диагностики и распознавания состояний глобальной ТКС нового поколения
целесообразно ввести специальных агентов-координаторов (например, на уровне маршрутизации
потоков данных) и, возможно, других глобальных агентов. Особенность этих агентов высокого уровня
заключается в том, что их БД и БЗ формируются на основе локальных БД и БЗ агентов более низкого
уровня. Поэтому они имеют глобальный (мульти-агентный) характер и позволяют оценивать сетевую
ситуацию “в целом”.
Таким образом, развитие и совершенствование архитектур ССУ глобальных ТКС нового поколения
должно осуществляется не только и не столько “вширь” (т.е. “ по горизонтали” охвата территории), но и
“вглубь” (т.е. “по вертикали” эволюции иерархии сетевого управления). Важную роль при этом играют
процессы адаптации и интеллектуализации ССУ.
Рассмотрим основные особенности этих процессов на примере мульти-агентной и адаптивной
маршрутизации информационных потоков в ТКС. Необходимость в адаптивной маршрутизации
возникает при непредсказуемых изменениях структуры (узлов и каналов связи) ТКС и числа
пользователей или при перегрузке буферов узлов или каналов связи ТКС. По существу речь идет о
маршрутизации в нестационарных глобальных ТКС с переменной структурой и нагрузкой.
Адаптивная и мульти-агентная маршрутизация потоков данных в глобальных ТКС имеют ряд
преимуществ:
 обеспечивается работоспособность и надежность ТКС при непредсказуемых изменениях их
структуры или параметров;
 балансируется загрузка узлов и каналов связи ТКС за счет «выравнивания» нагрузки;
 упрощается управление передачей потоков данных и облегчается адаптация к сетевым
перегрузкам;
 увеличивается время безотказной работы и производительность ТКС при высоком уровне
предоставляемых услуг в непредсказуемых условиях изменения сетевых параметров и структуры,
что особенно важно для агентов-пользователей ТКС нового поколения.
В зависимости от используемых способов обработки локальной или глобальной информации
(обратной связи) принципы адаптивной маршрутизации можно разбить на три класса:
 централизованная (иерархическая) маршрутизация;
 децентрализованная (распределенная) маршрутизация;
 мульти-агентная (многоадресная, многопотоковая) маршрутизация.
Принцип мульти-агентной маршрутизации является своеобразным компромиссом между принципами
централизованной и децентрализованной маршрутизации. Он основывается на многоадресной и
многопотоковой маршрутизации и анализе возможных сетевых конфликтов с целью их предотвращения
или разрешения в процессе управляемой передачи пакетов по множеству оптимальных маршрутов от
узлов-источников к узлам-получателям. Более подробно принцип и конкретные методы мульти-агентной
и нейросетевой маршрутизации рассмотрены в работах [1–5].
Работа выполнена при поддержке Минпромнауки РФ (проект № 37.029.11.0027), РФФИ (проект №
03-01-00224а) и РГНФ (проект № 03–06–12019в).
Литература
1. Тимофеев А.В. Проблемы и методы адаптивного управления потоками данных в
телекоммуникационных системах. – Информатизация и связь, № 1-2, 2003, с. 68-73.
2. Тимофеев А.В. Модели мульти-агентного диалога и информационного управления в глобальных
телекоммуникационных сетях. – Труды 10-ой международной конференции “Knowledge-Dialogue-Solution”
(16-26 июня, 2003, Варна), 2003, с. 180-186.
3. Тимофеев А.В. Методы высококачественного управления, интеллектуализации и функциональной
диагностики автоматических систем. – Мехатроника, автоматизация, управление, 2003, № 2, с. 13-17.
4. Syrtzev A.V., Timofeev A.V. Neural Approach in Multi-Agent Routing for Static Telecommunication
Networks. – International Journal “Information Theories and Their Applications”, 2003 v. 10, N 2, pp. 167-172.
5. Timofeev A.V. Multi-Agent Information Processing and Adaptive Control in Global Telecommunication
and Computer Networks. – International Journal “Information Theories and Their Applications”, 2003 v. 10, N 1,
pp.54-60.
173
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ИНТЕЛЛЕКТУАЛЬНЫХ
МАТЕМАТИЧЕСКИХ СПРАВОЧНЫХ СИСТЕМ
А.В.Флегонтов
Санкт-Петербургский институт информатики и автоматизации РАН
Тел.: (812) 246-28-56, e-mail: [email protected]
Современные возможности математического моделирования хорошо иллюстрируются справочной
литературой. Однако качественный анализ представленных модельных уравнений и технические
трудности при поиске новых уравнений, удовлетворяющих прикладным физическим задачам, требуют
привлечения современных аналитических систем вычислений и новых информационных технологий
обработки сложной математической информации.
Современные компьютерные технологии дают исследователям такие средства, а также
обеспечивают новые возможности по организации, хранению, иллюстративности и сетевой (доступных
для многих пользователей посредством Интернет) передачи математической информации. Таким
образом, появление и развитие компьютерных банков моделей, основу которых составляет справочная
литература, приводит к базам знаний и интеллектуальным справочным системам.
Разработанная для этих целей на начальном этапе бета-версия системы DIGRAN (DIscrete-GRoup
ANalysis) [1,2] сочетала в себе простые возможности представления текста на экране и достоинства (а
также дополнительные проблемы по вводу/выводу) программируемого знакогенератора для
отображения математических формул с ограниченными средствами ввода текста и графики. В качестве
языков реализации и интерфейса использовались С++ и Clarion. Система DIGRAN существенно
отличалась от demo-версии системы DISAM (DIscrete Symmetry of the Analitical Models), в которой
использовались только средства языка RLisp. Информационная структура системы DIGRAN послужила
основой для новой версии информационной системы «Дифференциальные уравнения» ISDIFF 1.0,
которая является составной частью общей ИС «Дифференциальные уравнения и динамические
системы» [3]. Система предназначена в первую очередь для конечного пользователя-математика,
использующего современные средства телекоммуникации и работающего с динамическими моделями.
За основу принят авторский подход к структурированию справочного материала по дифференциальным
уравнениям.
Анализ развития поддержки математики в HTML показывает, что будущие улучшения связаны с
внедрением системы MathType, где становится возможным использовать базисный язык представления
математической нотации MathML, основанный на расширенном языке маркировок XML. А также, с
улучшением возможностей серии HTML по форматированию, встроенности конвертеров и вьюеров,
наличию дополнительных java-applet’ов и т.д. Перспективно и введение механизма авто-стиля CSS
(Cascading Style Sheets), связывающего шрифт, размер и определенную информацию с тегами автора.
MathML предназначен для представления математической нотации и может быть использован как
средство общения между научным и математическим программным обеспечением. MathML
определяется набором XML элементов и признаков математического языка. Более ранние версии
MathType транслятора уже имели встроенное преобразование к TeX-языку. В последних версиях
MathType уже расширены возможности трансляции уравнений в большое количество других языков.
Процесс перевода управляется транслятором определений, а текстовые файлы содержат простые
команды перевода. MathType установка предоставляет ряд преимуществ: 1) обеспечиваются три версии
поддержки TeX'а: Plain TeX, LaTeX, и AMSLaTeX; 2) транслятор доступен для пользователей через e-mail
и Web. MathType включает MathML средства и, в конечном счете, поддерживает дуплексное
преобразование и способность непосредственного редактирования математических выражений.
Разработанная ИС «Дифференциальные уравнения» представляет собой набор Web-страниц, среди
которых выделяются непосредственно информационные страницы, описывающие конкретные
дифференциальные уравнения, их частные и общие решения; стилевые страницы, задающие
параметры окон, рамок и т.п.; страницы отражающие структуру справочника. Между ними проложены
гипертекстовые ссылки.
При подключении к адресу, по которому располагается в сети ИС, в браузер загружается заглавная
страница. Она несет на себе два окна. Левое окно представляет оглавление, в котором каждый пункт
есть горячая ссылка на другую страничку, соответствующую выбранному пункту. Это может быть,
например, оглавление более низкого уровня или непосредственно страничка с уравнением. В правом
окне, оно большего размера, загружается то, что было выбрано в левом по гипертексту. Таким образом,
пользователь этой странички, двигаясь по гипертекстовым ссылкам, выбирает из главы параграф, из
параграфа пункт, в котором указано искомое уравнение и его описание.
Вышеописанный способ обнаружения информации не всегда пригоден. Как быть, например, если
пользователь не знает, в каком параграфе искать уравнение или, что чаще бывает, не знает, к какому
классу данное уравнение относится. В подобных случаях придется просматривать содержание многих
страничек. Чтобы этого избежать, ИС оборудована специальной интеллектуальной поисковой системой.
Литература
1. Флегонтов А.В. Применение компьютерного справочника DIGRAN и системы Reduce для
симметрийного анализа дифференциальных уравнений// Моделирование процессов управления и
обработки информации. М.: МФТИ, 1994.
174
2. Флегонтов А.В. Компьютерный справочник поиска аналитических решений о.д.у. (система ДИГРАН
и ее расширения)// Компьютерные технологии в высшем образовании. СПбГИТМО, 1994.
3. Осипенко Г.С., Зайцев В.Ф., Флегонтов А.В. Информационная система "Дифференциальные
уравнения"//Труды 2 Международной Конференции "Дифференциальные уравнения и их применения".
СПбГТУ, Санкт-Петербург, 1998.
AnyLogic – ИНСТРУМЕНТ ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ
НОВОГО ПОКОЛЕНИЯ
Ю.Г.Карпов, А.В.Борщев
XJ Technologies, Санкт-Петербург
Тел.: (812) 247-16-74, e-mail: [email protected], http://www.xjtek.com
Современный рынок инструментов моделирования предлагает большой выбор практически в каждой
области моделирования, однако фактически все они основаны на концепциях, которые были
зафиксированы несколько десятилетий назад. В современном мире информационных технологий
десятилетие сравнимо с веком прогресса в традиционных технологиях, и удивительно то, что в
моделировании широко применяются идеи и решения 60-х – 70-х годов прошлого века, которые с тех пор
не менялись.
В докладе после анализа существующих парадигм моделирования представлен отечественный
профессиональный инструмент имитационного моделирования AnyLogic нового поколения, который
разработан на основе современных концепций в области информационных технологий и результатов
исследований в теории гибридных систем и объектно-ориентированного моделирования. Построенная на
их основе инструментальная система AnyLogic не ограничивает пользователя одной единственной
парадигмой моделирования, что является характерным для существующих на рынке инструментов
моделирования. В AnyLogic разработчик может гибко использовать различные уровни абстрагирования и
различные стили и концепции и смешивать их при создании одной и той же модели.
Моделирование систем с дискретными событиями. На рынке существует множество пакетов,
облегчающих разработку дискретно-событийных моделей и проведение экспериментов с моделями в
этой традиционной области моделирования. В первую очередь это GPSS, который стал революцией
более 40 лет назад, задав парадигму моделирования в этой области в виде блоков и транзактов.
Транзакты отображают динамические объекты моделирования (заявки), а блоки – объекты,
обрабатывающие эти заявки. Большинство других инструментов моделирования (Arena, Extend,
ProModel, SimProcess и другие) также используют эту парадигму.
Системная динамика – это методология изучения и моделирования систем, характеризующихся
циклами обратных связей в сложных взаимных причинных зависимостях их параметров. Математически
эти системы описываются системами дифференциальных уравнений, приведенных к форме Коши. Эти
модели применяются для корпоративного планирования и анализа политик управления корпорацией,
политик управления социальными и экономическими системами, в экологии и т.п. В 1961 году Джей
Форрестер заложил методологические принципы системной динамики с использованием графического
представления причинных зависимостей переменных в виде так называемых “stock and flow diagrams”,
которые и сейчас являются основой инструментов моделирования, конкурирующих на рынке: VenSim,
PowerSim, Stella, ModelMaker и др.
Динамические системы, область моделирования систем управления, физических, механических
систем, систем обработки сигналов и т.п. Широкое применение в этой области имеет пакет
моделирования Simulink, являющийся составной частью пакета Matlab. Пакет имеет библиотеку
предопределенных блоков, из которых можно методом ‘drag-and-drop’ строить блочную структуру,
аналогичную блочной структуре моделей, когда-то давно, 30 лет назад набираемых для их решения на
аналоговых вычислительных машинах из интеграторов, усилителей, источников сигналов и т.п.
Агентное моделирование. Под агентом понимается активный объект, обладающий поведением и
имеющий возможность взаимодействия с другими агентами и со средой. Многоагентное моделирование
позволяет вывести характеристики целого (множества агентов) из совокупности локальных поведений и
характеристик отдельных активных элементов целого, распределенных в среде. Моделирование
многоагентных систем используется в анализе социальных процессов, процессов урбанизации и даже
при исследовании рынка в анализе предпочтений различных социальных групп или корпораций,
выступающих как агенты со своим поведением. Существует несколько экспериментальных
инструментов, поддерживающих моделирование в этой области; наиболее известные из них – это
Swarm, разработанный в Университете Санта Фе и RePast, разработанный в Чикагском Университете.
Эти академические инструменты предоставляют пользователю библиотеки программных модулей,
несколько упрощающих разработку агентных моделей по сравнению с разработкой их ‘с нуля’ на языке
программирования, но они никак не могут претендовать на роль продукта для профессионаловсимуляционистов.
AnyLogic является отечественным инструментом моделирования, который был разработан недавно
на основе удачно согласованных современных революционных идей в области информационных
технологий и доказавших свою мощь и удобство применения: объектно-ориентированный подход,
175
визуальное
проектирование,
дружественный
пользовательский
графический
интерфейс,
платформонезависимый язык Java, агентные технологии, теория гибридных систем. Все это делает
AnyLogic не только универсальным мощным средством для решения очень широкого круга проблем в
области имитационного моделирования. Главное, это дает гибкость, позволяющую для решения одной и
той же задачи на одной платформе выбирать как различные уровни абстракции, так и различные стили
создания модели и комбинировать их для достижения целей моделирования. Такими целями у одной и
той же модели могут быть простота представления объектов, высокая производительность
исполняемого модуля, учет специфических разнородных свойств и характеристик элементов модели,
наглядность визуализации и т.п.
Опыт использования AnyLogic для разработки моделей управления производством, маркетинга,
логистики, социальной динамики, управления здравоохранением и многих других во всех перечисленных
выше областях показал, что AnyLogic имеет существенное преимущество перед традиционными
инструментами моделирования именно в тех проектах, разработка которых требует выхода за границы
одной единственной парадигмы моделирования.
О ПРИМЕНЕНИИ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ ПРИ РАБОТЕ В
КОРПОРАТИВНОЙ ВЫЧИСЛИТЕЛЬНОЙ СЕТИ ЦНИИ «ЭЛЕКТРОПРИБОР»
Е.Н.Карташев, В.В.Трошков
ФГУП Центральный научно-исследовательский институт «Электроприбор», СанктПетербург
Тел.: (812) 238-78-25, e-mail: [email protected]
В докладе рассматриваются современные концепции обеспечения сетевой безопасности в
гетерогенной вычислительной среде предприятия, используемой для информационной поддержки
выпускаемых изделий.
Описываются основные сетевые сервисы, доступные в корпоративной вычислительной сети ФГУП
ЦНИИ «Электроприбор»:
 электронный архив предприятия;
 АСУ опытного производства;
 FTP-серверы (сервер разработанной КД, сервер разрешенного к применению ПО, обновления
антивирусных баз и т.д.);
 Web-серверы (внутренний корпоративный сайт, зеркало интернет-сайта ЦНИИ, сайт службы
качества, сайты подразделений, сайт центра обучения);
 службы документооборота и обмена сообщениями (Lotus Domino, Microsoft Exchange);
 информационные службы (юридические базы Консультант-Плюс и Гарант, база стандартов
Глосис).
Особое внимание уделяется вопросам построения корпоративной вычислительной сети на базе
службы каталогов Active Directory, также подробно рассматриваются используемые методы защиты
информации в сети:
 единая система аутентификации и авторизации пользователей в масштабе предприятия;
 задание и обновление настроек безопасности с помощью механизма групповой политики;
 управление правами пользователей и их доступом к различным сетевым ресурсам;
 использование централизованного мониторинга обнаружения вирусов и автоматического
обновления антивирусного программного обеспечения;
 служба автоматических обновлений программных продуктов компании Microsoft™;
 шифрование сетевого трафика с помощью протокола IPSec;
 создание виртуальных сетей (VLAN) с использованием управляемых коммутаторов.
МУЛЬТИ-АГЕНТНОЕ УПРАВЛЕНИЕ КАЧЕСТВОМ В
ТЕЛЕКОММУНИКАЦИОННЫХ СЕТЯХ
А.В.Тимофеев, И.В.Остюченко
Санкт–Петербургский институт информатики и автоматизации РАН,
Международный банковский институт, Санкт-Петербург
Тел.: (812) 117-79-28, e-mail: [email protected]
Новым эффективным подходом к решению задач управления качеством передачи информации в
телекоммуникационных сетях (ТКС) является развитие и применение теории мульти-агентных систем и
176
методов адаптивного и интеллектуального управления, включая их реализацию на канальном, сетевом и
прикладном уровне и имитационное моделирование [1–3].
Применение мульти-агентного подхода при решении задач построения адаптивных и
интеллектуальных систем управления позволят проектировать и создавать более эффективные ТКС
нового поколения. Мульти-агентное управление осуществляется посредством сложного программноаппаратного комплекса, реализующего интеллектуальные или адаптивные алгоритмы управления
параметрами и конфигурацией системы в динамической сетевой среде.
Глобальные ТКС могут интегрировать большое количество распределённых интеллектуальных
агентов, имеющих собственные локальные базы данных и базы знаний и каналы связи для обмена
информацией. Мульти-агентная технология существенно упрощает спецификацию поведения ТКС,
превращая их в активных автономных агентов, взаимодействующих друг с другом и окружающей средой.
При разработке методов адаптации и мульти-агентного управления информационными потоками
особое внимание уделяется возможности их применения для управления динамическими процессами в
условиях неопределённости (изменяющийся трафик, разнородность потоков данных, выход из строя
узлов или каналов связи и т.п.). Благодаря мульти-агентной архитектуре адаптивные системы
управления передачей информации в ТКС могут обеспечить высокое качество услуг и повысить
производительность (за счет параллельности процессов передачи и обработки информации) и
надёжность эксплуатации.
Концепция организации и управления информационными потоками в глобальных ТКС основывается
на рассмотрении коллектива интеллектуальных сетевых агентов, взаимодействующих между собой с
помощью каналов связи для достижения частных (локальных) и общих (глобальных) целей. Каждый
агент способен самостоятельно решать некоторые локальные задачи и имеет возможность
кооперироваться с другими агентами в процессе совместного решения общей (глобальной) задачи.
Обеспечение требуемого качества функционирования глобальной ТКС во многом сводится к
обеспечению допустимых значений множества (вектора) параметров качества Q. Контроль за
соблюдением требуемых параметров качества Q при централизованном управлении распределённой
ТКС порождает служебные потоки информации по всей сети, что приводит к увеличению нагрузки на
ТКС, снижению времени реакции на изменение Q и т.п.
Мульти-агентная технология управления качеством позволяет распределять задачи в соответствии с
классификацией задач управления качеством. Такая классификация задач управления позволяет
произвести декомпозицию задачи управления качеством и распределить подзадачи между агентами
ТКС.
Агенты качества имеют собственные базы данных параметров качества q n (q n
 Q) за которые они
отвечают, а также базы знаний, содержащие методы и средства их коррекции. Декомпозиция Q на q 1 ,
q 2 , …, q n , где n – количество агентов качества, распределенных в ТКС, производится на основе знания
особенностей конкретной ТКС и предъявляемых к ней требований.
Формирование базы знаний агентов качества происходит посредством интеллектуальных методов
обработки информации. Работа выполняется с использованием баз знаний агентов в виде экспертных
систем, составленных с учетом стандарта TL 9000 международного стандарта ИСО серии 9000 для
телекоммуникационной отрасли.
Реализация мульти-агентных систем происходит посредством технологии Java, позволяющей
“производить” мобильных агентов, способных выполнять свои задачи независимо от конкретных
платформ, используемых в ТКС и их системах управления. Кроме того, мобильным агентам нет
необходимости знать, какое программное или аппаратное обеспечение установлено на том или ином
узле ТКС.
Использование мобильных агентов позволяет усовершенствовать систему управления качеством в
различных распределённых ТКС вне зависимости от применяемых в них аппаратных и программных
платформ. Предлагаемая система качества управления информационными потоками позволит улучшить
качество предоставляемых услуг пользователям [4].
Работа выполнена при поддержке Минпромнауки РФ (проект № 37.029.11.0027) и РГНФ (проект №
03–06–12019в), Государственного контракта с фондом содействия развитию малых форм предприятий
2183/р4302 от 20.11.2003.
Литература
1. Тимофеев А.В. Проблемы и методы адаптивного управления потоками данных в
телекоммуникационных системах. – Информатизация и связь, № 1-2, 2003, с. 68-73.
2. Тимофеев А.В. Модели мульти-агентного диалога и информационного управления в глобальных
телекоммуникационных сетях. - Труды 10-ой международной конференции “Knowledge-Dialogue-Solution”
(16-26 июня, 2003, Варна), 2003, с. 180-186.
3. Timofeev A.V. Multi-Agent Information Processing and Adaptive Control in Global Telecommunication
and Computer Networks. – International Journal “Information Theories and Their Applications”, 2003 v. 10, N 1,
pp.54-60.
4. Остюченко И.В. Разработка систем качества управления потоками информации в
телекоммуникационной системе. – Сборник трудов 11-й международной школы-семинара "Новые
информационные технологии" (Украина, г. Судак, май 2003), с. 87-90.
177
5. Остюченко И.В. Управление потоками информации в мульти-агентной телекоммуникационной
системе. Международная школа-семинар БИКАМП-2003, Санкт-Петербург.
МОДЕЛИРОВАНИЕ ИНФРАСТРУКТУРЫ ОТКРЫТЫХ КЛЮЧЕЙ
Г.В.Сопин
Петербургский государственный университет путей сообщения, Санкт-Петербург
Тел.: (812) 465-98-07, e-mail: [email protected]
Криптография с открытым ключом (англ. Public Key Cryptography, PKC) и, в частности, цифровая
подпись играют ключевую роль в формирующемся информационном обществе. Существующие и
доступные приложения PKC включают в себя аутентификацию и шифрование двухсторонних сообщений
(например, электронная почта, электронная коммерция, банковские электронные услуги), электронное
голосование и контроль доступа. Цифровая подпись может служить механизмом для создания
юридически значащей подписи в контрактах, свидетельствах и т.д.
Сертификаты с открытым ключом представляют собой “связывание” между открытым ключом и
пользователем (или, более точно, атрибутами пользователя, однозначно идентифицирующими его) и
являются необходимым компонентом работы вышеупомянутых приложений. Основными функциями
инфраструктуры открытых ключей (англ. Public Key Infrastructure, PKI) являются выпуск, хранение и
распространение (распределение) сертификатов с открытым ключом. В отсутствии выделенных
защищенных каналов передачи информации или внешней третьей доверенной стороны реализация этих
функций является нетривиальной задачей.
Основной целью моделирования инфраструктуры открытых ключей и цифрового подтверждения
является формальное описание всех связанных с PKI концепций. Виды цифрового подтверждения
(цифровые подписи, цифровые сертификаты, временные метки) и абстрактные предположения
(связывание между ключом и пользователем, доверие на предприятии) должны быть однозначно
определены и строго формализованы. Вместе они составляют механизм подтверждения, который
позволяет делать вывод пользователю о верности его предположения. Примерами предположений в PKI
являются предположения о том, что конкретный открытый ключ может быть использован для
шифрования сообщения определенному получателю, или о том, что определенный пользователь несет
юридическую ответственность за определенное обязательство. Связи между различными вида
подтверждения и предположениями могут быть представлены в виде специально разработанной
логической структуры. Модель PKI, построенная с использованием этой структуры, позволит выявить
ошибки и заблуждения в существующих методах проверки открытых ключей. Создание такой
формализованной модели также будет являться первым шагом на пути создания программного
обеспечения, обеспечивающего прозрачную и дружественную проверку открытого ключа.
Целью данной работы является предложение нового подхода к моделированию PKI и ее
рассмотрение с позиции (точки зрения, взгляда) пользователя. Его позиция, с помощью которой он
делает заключения относительно аутентификации открытых ключей других пользователей глобальной
PKI и оценивает вероятность доверия другим пользователям, состоит из утверждений о том, что
открытые ключи других пользователей, которым доверяет пользователь, могут быть аутентифицированы
и что другие рекомендованные пользователи заслуживают доверия, а также состоит из цепочки
сертификатов и рекомендаций, полученных или выбранных из PKI.
Предлагаемая в данной работе модель PKI построена на основе четкого определения понятия
сертификата открытого ключа, доверия и рекомендаций [1]. В модели предложен вероятностный метод,
названный “оценка доверия”: он позволяет вычислять неопределенность пользователя об
аутентификации открытого ключа и основывается на начальной неопределенности пользователя в
утверждениях, которых он придерживается изначально. Предлагаемая модель PKI учитывает
рекомендации доверия пользователям. Кроме того, она включает в себя уровни достоверности
утверждений и может применяться для произвольных схем сертификации, содержащих пересекающиеся
множества цепочек сертификатов, с целью повышения уровня достоверности по сравнению с любыми
простыми схемами сертификации. Уровень достоверности изменяется в непрерывном диапазоне от 0 до
1, и, в отличие от других работ, под ним понимается вероятность строго определенного случайного
события [2].
Расширение этой модели показывает возможные интерпретации описания “связывания” между
открытым ключом и пользователем и иллюстрирует, как часто неправильно понимается роль
самоподписанных сертификатов.
Также в ходе исследования установлены естественные принципы, которым в идеале должна
следовать оценка доверия, базирующиеся на понятиях, которые были использованы в системах
аргументации, первоначально введенные в теории подтверждения и экспертных систем. Как результат,
определены несколько проблем в существующих методах проверки открытых ключей, в частности в
широко распространенном программном обеспечении Pretty Good Privacy (PGP).
В будущих исследованиях необходимо расширять предыдущие модели PKI, рассматривая все новые
аспекты PKI. Одним из таких аспектов является время: достоверность определенного
экспериментального утверждения могла быть подвергнута изменению. В контексте аннулирования или
перепроверки открытых ключей или цифровых сертификатов фактор времени определяет различие,
178
когда цифровая подпись существовала или цифровой сертификат был отозван: до или после
определенной временной отметки. Кроме того, используемый механизм подтверждения и применяемые
в нем правила могут меняться со временем. Например, партнер по электронному контракту должен
знать, какие судья будет принимать решения в дальнейшем в случае судебного разбирательства.
Новая, в значительной степени расширенная, модель разъясняет понятия открытого ключа,
аннулирования (отзыва) сертификата и перепроверки сертификата, иллюстрирует роль временных меток
как одной из составляющих PKI и делает точным понятие атрибутов и авторизации сертификатов.
Долгосрочной целью создания модели PKI является расширение логической структуры [3],
охватывающее все актуальные виды цифрового подтверждения, в частности, связанных с
использованием PKI и криптографических алгоритмов с открытым ключом, включающих, например,
механизмы анонимности, электронные платежные системы и т.д.
ИНСТРУМЕНТАРИЙ GLOBUS TOOLKIT – АСПЕКТЫ ПРИМЕНИЯ GRIDСИСТЕМ
А.Е.Лоренц, А.В.Тимофеев
Санкт-Петербургский государственный электротехнический университет “ЛЭТИ”
им. В.И.Ульянова (Ленина)
Тел.: (812) 346-17-24, e-mail: [email protected]
На сегодняшний день в науке и бизнесе имеет место тенденция роста требований приложений к
вычислительным ресурсам. Это заставляет предприятия и организации постоянно наращивать свои
вычислительные мощности. Как следствие постоянно растут расходы на аппаратное и программное
обеспечение, также растут и площади вычислительных центров.
Второй тенденцией современности является то, что обычные персональные компьютеры (ПК)
достигли достаточно высокой производительности, которая используется не на полную мощность.
Технология Grid Computing позволяет объединять и управлять географически распределенными
вычислительными ресурсами и системами хранения данных. Это позволяет создавать виртуальные
вычислительные системы – сети Grid-вычислений, и эффективно использовать свободные или частично
занятые вычислительные ресурсы, которые могут быть разбросаны по всему миру. Из всех
существующих инструментариев развертывания сетей Grid стандартом де-факто стал пакет Globus
Toolkit.
В данной статье будут рассмотрены: состав пакета Globus Toolkit и назначение его составных
частей; пример архитектуры сетей Grid на базе Globus Toolkit; вопросы разработки приложений для сетей
Grid; перспективы использования Grid в образовательных учреждениях.
Описание и состав инструментария Globus Toolkit. Инструментарий с открытым кодом Globus Toolkit
был разработан Калифорнийским университетом и Аргоннской национальной лабораторией при
поддержке ведущих компаний США и Япония. Отдельно следует отметить вклад корпорации IBM,
которая участвует в проекте Globus и выпускает свой инструментарий GRID Toolbox, построенный на
основе Globus Toolkit.
Globus Toolkit – не готовое решение, это инфраструктура стандартов и инструментов. Основным
стандартом в рамках проекта Globus является OGSA (Open Grid Services Architecture) – открытая
архитектура вычислений учрежденческого уровня. Архитектура OGSA, созданная на концепциях и
технологиях, разработанных специалистами в области Grid и Web-служб, определяет единообразную
семантику представления служб, стандартные механизмы для создания, именования обнаружения
экземпляров Grid-служб, обеспечивает прозрачность местонахождения и связывания различных
протоколов и поддерживает интеграцию с базовыми механизмами нижележащих платформ. Разработка
технической спецификации OGSA ведется в рамках форума Grid Global Forum, разрабатывающего
стандарты для Grid-сообщества.
Большое внимание в Globus Toolkit удалено вопросам безопасности передачи данных и процедуре
аутентификации между учережденческими массивами. Для решения этой проблемы применяется
механизм аутентификации GSI (Grid Security Infrastructure) на базе сертификатов X.509.
Пакет Globus Toolkit доступен для загрузки из Интернет в виде исходных текстов или дистрибутивов.
IBM предоставляет GRID Toolbox в виде дистрибутивов, которые адаптированы под платформы pSeries,
zSeries и xSeries.
Пример построения Grid архитектуры с использованием Globus Toolkit. В рассматриваемом примере
будет приведена тестовая лаборатория, состоящая из трех ПК. Первый ПК – Infrastructure server, будет
заниматься задачей по обслуживанию сертификатов, для этого на него следует установить Network Time
Protocol (NTP) и средства создания и подписи сертификатов Certificate Authority (CA). Каждый
пользователь, чтобы запустить задачу, должен иметь сертификат, и каждый хост в сети GRID должен
иметь сертификат.
Далее на второй и третий хост необходимо установить Globus Toolkit, который содержит серверную
часть в виде контейнера и клиентскую часть в виде утилит командной строки. На все три хоста перед
началом инсталляции необходимо установить java2 SDK и некоторое другое программное обеспечение.
179
После инсталляции необходимо настроить систему безопасности: сконфигурировать GSI и
сгенерировать публичный сертификат и распространить его на все элементы сети Grid. Также
необходимо обеспечить доступ пользователем к загрузке задач в Grid. Для этого пользователю
необходимо создать запрос на сертификат, а администратору его подписать. После получения
подписанного сертификата пользователь может приступать к запуску приложений, используя утилиты
командной строки или специализированный графический браузер задач.
Использование технологий Grid в образовательных учреждениях. Рассмотрим возможности и
перспективы использования технологий Grid в вузе. Как известно, вычислительные мощности
компьютерных классов зачастую используются не полностью, например, всего 5x10 вместо 7x24.
Разворачивание сети Grid на базе такого учебного классе позволит выполнять научные расчеты, в
которых нуждается образовательное учреждение, выполняя научно-исследовательские работы. Также
Grid-система будет полезна с учебно-методической точки зрения: в таком учебном классе можно будет
проводить занятия по дисциплинам связанным параллельными технологиями и вычислительными
системами.
Нетрудно заметить что такое решения не потребует больших финансовых затрат, так как
используется уже существующая аппаратная база. Также очевидна возможность широкого
масштабирования вузовской сети Grid: объединение несколько учебных классов или даже ПК
сотрудников. Более того, существует возможность построения межвузовской сети Grid.
Интернет изначально создавался для обеспечения совместных научных исследований, в процессе
эволюции Интернет адаптировался для задач электронного бизнеса. Аналогичное будущее, несомненно,
ожидает и Grid-технологии, причем основным движущим моментом коммерциализации Grid является не
просто увеличение производительности, а возможность создания надежных, масштабируемых и
защищенных распределенных вычислительных систем.
ЯЗЫК АВТОМАТНОГО ПРОГРАММИРОВАНИЯ «STATE»
Н.Н.Шамгунов, А.А.Шалыто
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
Тел.: (812) 247-95-45, e-mail: [email protected]
В настоящее время активно развивается технология автоматного программирования, впервые
сформулированная в работе [1] и развитая в работе [2]. Совершенствование указанной технологии
связано с совместным использованием автоматов и классов. Этот вопрос исследуется в проектах,
опубликованных на сайте http://is.ifmo.ru, во многих из которых используется конструкция switch,
которая не является «объектной».
Цель настоящей работы состоит в разработке нового объектно-ориентированного языка
программирования, который позволяет:
 эффективно работать с конечными автоматами на основе объектно-ориентированной модели;
 обеспечить работу с каждым автоматом как с единым объектом на этапе проектирования,
кодирования и использования.
Наиболее близким подходом для решения указанной задачи является применение любого объектноориентированного языка и реализация на нем паттерна State [3]. Такой подход неэффективен для
создания систем, содержащих большое количество небольших автоматов с малым числом состояний,
так как:
 для каждого автомата необходимо ввести столько классов, сколько состояний в реализуемом
автомате плюс один (базовый);
 для доступа к данным автомата из объектов, реализующих состояния, необходимо обращаться к
контексту [3], хранящему эти данные, что усложняет код и делает неудобным добавление новых
данных.
Авторы считают, что одним из важнейших факторов, ограничивающих широкое использование
автоматов в разработке программного обеспечения, является отсутствие непосредственной их
поддержки в современных языках программирования. Для устранения этого недостатка разработан
новый язык программирования State. Язык построен на базе языка C#, в который введены
синтаксические конструкции «automaton» и «state». Программа на этом языке компилируется в сборку
Microsoft CLR (Common Language Runtime [4]). Ввиду того, что язык является расширением C#, он
обладает всеми его преимуществами.
Automaton (далее автомат) – это расширение понятия class за счет использования понятия
«состояние». Если не определить ни одного состояния, автомат будет эквивалентен классу. В теле
автомата можно определить одно или несколько состояний state, внутри каждого, из которых
описывается набор методов. Это позволяет непосредственно реализовывать паттерн State не в виде
совокупности классов, а внутри одной логической конструкции. Автомат может наследоваться как от
класса, так и от другого автомата. Это позволяет, в частности, повторно использовать код для
реализации модифицированных графов переходов.
180
Для компиляции языка разработан препроцессор, преобразующий код на языке State в код на языке
C#. Препроцессор преобразует автомат в класс, который может быть скомпилирован в Microsoft CLR.
Таким образом, обеспечена возможность работы с автоматом как с единым объектом, как на этапах
проектирования и кодирования, так и на этапе использования.
В качестве примера реализуем простейший автомат с двумя состояниями. При переходе из первого
состояния во второе при входном воздействии move формируется выходное воздействие (на консоль
выводится строка State1). На петле во втором состоянии при том же входном воздействии на консоль
выводится строка State2. Этот автомат на языке State описывается следующим образом.
using System;
automaton Sample
{
enum State
{
state1,
state2,
}
State _state = State.state1;
state ( _state == State.state1 )
{
public void move ()
{
Console.WriteLine ( "state1" );
_state = State.state2;
}
}
state ( _state == State.state2 )
{
public void move ()
{
Console.WriteLine ( "state2" );
_state = State.state2;
}
}
static void Main(string[] args)
{
Sample s = new Sample ();
s.move ();
s.move ();
}
}
Применение автоматов в программировании в настоящее время активно развивается. Так, в
частности, в Microsoft Research разработан язык ASML (Abstract State Machine Language) [5].
Предлагаемый язык рассчитан на более широкую аудиторию, так как является расширением языка C#.
Литература
1. Шалыто А.А. SWITCH-технология. Алгоритмизация и программирование задач логического
управления. СПб.: Наука, 1998.
2. Шалыто А.А., Туккель Н.И. SWITCH-технология – автоматный подход к созданию программного
обеспечения «реактивных» систем // Программирование. 2001. №5. http://is.ifmo.ru, раздел «Статьи».
3. Гамма Э., Хелм Р., Джонсон Р., Влассидес Дж. Приемы объектно-ориентированного
проектирования. Паттерны проектирования. СПб.: Питер, 2001.
4. Richter, J. Applied Microsoft® .NET Framework Programming. Microsoft Press, 2002.
5. Abstract State Machine Language. http://research.microsoft.com/foundations/AsmL/.
ОБХОД ДЕРЕВЬЕВ НА ОСНОВЕ АВТОМАТНОГО ПОДХОДА
Г.А.Корнеев, Н.Н.Шамгунов, А.А.Шалыто
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
Тел.: (812) 247-95-45, е-mail: [email protected]
С 1991 г. в России развивается SWICTH-технология, которая базируется на автоматном
программировании [1]. Настоящая работа проведена в рамках исследования применения SWICTHтехнологии в вычислительных алгоритмах [2, 3] и посвящена одному из них – обходу деревьев.
Первоначально в работе рассматривается обход двоичных деревьев, а затем предлагаемое решение
обобщается на случай k-ичных деревьев. При этом рассматриваются алгоритмы обхода, как
использованием стека, так и без его применения. Использование автоматного подхода позволяет
181
получить наглядные и универсальные алгоритмы решения рассматриваемых задач, которые также
весьма экономны по памяти по сравнению с классическими алгоритмами [4].
Обход двоичного дерева
Пусть задано двоичное дерево, например, представленное на рис. 1. Необходимо осуществить его
обход – сформировать последовательность номеров его вершин в одном из принятых порядков.
0
1
2
3
5
4
7
6
8
9
Рис.1. Двоичное дерево
Рассмотрим три порядка обхода дерева: прямой (preorder), обратный (postorder) и центрированный
(inorder) [4, 5]. Такие порядки используются при обходе дерева в глубину.
Данная задача может быть решена несколькими способами: рекурсивно [4, 5], итеративно с
применением стека и итеративно без использования стека [6]. Ни в одной из этих работ не используются
автоматы, что, по мнению авторов, не позволило обеспечить наглядность предлагаемых решений и их
универсальность.
Для обхода деревьев используется автомат со следующим графом переходов (рис. 1).
0. Начальное состояние
4. Конечное состояние
1
1: !node->p
!node->l
1. Left
out(node)
2. Right
!node->r
out(node)
3. Parent
out(node)
node->r
2: node->p->l == node
node = node->r
node = node->p
node->l
3: node->p->r == node
node = node->l
node = node->p
Рис.2. Граф переходов автомата для реализации обхода двоичного дерева
Отметим, что если в работах [4, 5] рассмотрено три типа обходов и для каждого из обходов
предложен свой алгоритм, то предлагаемый подход позволяет, используя один и тот же граф переходов
автомата, осуществлять все три обхода за счет вывода номера текущей вершины только в одном из
состояний: Left, Right, Parent. При этом в зависимости от выбранной вершины получим три стандартных
обхода [4, 5]:
Состояние
Обход
Left
Прямой
Right
Центрированный
Parent
Обратный
Таким образом, предложенный автомат представляет стандартные виды обхода в единой форме.
Обход k-ичного дерева
Изложенный подход может быть обобщен на случай k-ичных деревьев [5], где k – константа. (рис. 3).
На этом рисунке c – массив, хранящий указатели на потомков узла. Отметим, что у построенного
автомата k+3 состояний.
182
node->c[1]
node = node->c[1]
1. Child 1
out(node)
1
0. Начальное состояние
k+1. Конечное состояние
!node->c[1]
2: node->p->c[1] == node
node->c[2]
2. Child 2
node = node->c[2]
out(node)
node = node->p
1: !node->p
k+1. Parent
!node->c[3]
2: node->p->c[2] == node
node->c[3]
node = node->c[3]
3. Child 3
out(node)
node = node->p
out(node)
!node->c[3]
...
!node->c[k-1]
node->c[k]
node = node->c[k]
k. Child k
2: node->p->c[k-1] == node
node = node->p
out(node)
!node->c[k]
Рис.3. Граф переходов автомата для реализации обхода k-ичного дерева с использованием стека
Литература
1. Шалыто А.А. SWITCH-технология. Алгоритмизация и программирование задач логического
управления. СПб.: Наука, 1998.
2. Туккель Н.И., Шамгунов Н.Н., Шалыто А.А. Ханойские башни и автоматы //Программист. 2002 № 8.
http://is.ifmo.ru, раздел «Статьи».
3. Туккель Н.И., Шамгунов Н.Н, Шалыто А.А. Задача о ходе коня //Мир ПК 2003. №1. http://is.ifmo.ru,
раздел «Статьи».
4. Кормен Т., Лейзерсон Ч., Ривест Р. Алгоритмы: построение и анализ. М.: Центр непрер. матем.
образования, 2000.
5. Кнут Д. Искусство программирования. Т. 1. Основные алгоритмы. M.: Вильямс, 2003.
6. Касьянов В.Н., Евстигнеев В.А. Графы в программировании: обработка, визуализация и
применение. СПб.: БХВ-Петербург, 2003.
ПОСТРОЕНИЕ КОРРЕКТНЫХ ТОПОЛОГИЧЕСКИХ ОТНОШЕНИЙ ДЛЯ
ЭЛЕКТРОННЫХ КАРТ
Г.А.Чижова
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
Тел.: (812) 247-95-45, е-mail: с[email protected]
Географическая информационная система (ГИС) – это современная компьютерная технология для
картирования и анализа объектов реального мира, также событий, происходящих на нашей планете. Эта
технология объединяет традиционные операции работы с базами данных, такими как запрос и
статистический анализ, с преимуществами полноценной визуализации и географического
(пространственного) анализа, которые предоставляет карта. Эти возможности отличают ГИС от других
информационных систем и обеспечивают уникальные возможности для ее применения в широком
спектре задач, связанных с анализом и прогнозом явлений и событий окружающего мира, с осмыслением
и выделением главных факторов и причин, а также их возможных последствий, с планированием
стратегических решений и текущих последствий предпринимаемых действий. Главным недостатком ГИС
систем является отсутствие топологии, которая принесена в жертву производительности и
универсальности.
Топология – это пространственные отношения между соединенными или смежными объектами
покрытий (дуг, узлов, полигонов и точек). При помощи топологии пространственным данным
присваивается поведение реальных ГИС-объектов. Топология обеспечивает возможность получить
ответы на вопросы, касающиеся смежности, связности, близости и совпадения, сокращает объем
хранимых данных по полигонам, поскольку границы между смежными полигонами хранятся один раз (не
дублируются). Топологические данные могут быть более быстро отображены, чем нетопологические, так
183
как перерасчет из географических координат в экранные для каждой точки будет происходить один раз.
Топология дает мощный и гибкий способ задания правил, служащих для обеспечения и поддержки
качества и целостности ваших пространственных данных. Топология делает возможным проведение
расширенного пространственного анализа и играет фундаментальную роль в обеспечении качества базы
данных ГИС.
Для решения поставленной задачи построения топологии (топологизации) для любых данных ГИС
был разработан и реализован алгоритм, позволяющий создать топологию на произвольных входных
данных. В нем топологические отношения строятся от простых объектов к сложным: точки (простейшие
элементы) и дуги (набор соединенных между собой точек) используются для представления более
сложных объектов, таких как полигоны (набор соединенных дуг). Например, топология дуги включает в
себя начальный и конечный узлы и левый и правый полигоны. Все объекты из данных ГИС,
составляющих одну карту, перед обработкой помещаются в общий контейнер, затем обрабатываются на
основе всей совокупности точек объектов. После отбрасывания совпадающих объектов, строится
система объектов, основанная на исходной, в которой каждый элемент хранит только ссылки на точки
других элементов составляющих систему. При дальнейшей обработке дуги разбиваются на несколько с
выделением максимально возможных поддуг. Такой механизм позволяет свести исходные наборы
отдельных точечных, линейных и полигональных объектов к набору взаимосвязанных топологических
данных со сложной иерархией и богатыми возможностями по дальнейшей обработке. Топологические
отношения могут быть установлены для нескольких классов точечных, линейных и полигональных
объектов. Фактически алгоритм восстанавливает топологию исходных данных, утерянную из-за
выбранного ГИС формата представления данных.
На полученной топологии реализованы механизмы проверки корректности данных. Например,
предоставляется возможность убедиться, что все полигоны участков образуют замкнутые контуры, что
они не перекрываются, и что между участками нет промежутков. Также реализованные механизмы
позволяют произвести коррекцию ошибок топологии.
Литература
1. А. Петринчук. «Оптимизированный ввод картографической информации. Построение
топологических взаимоотношений средствами ArcView-GIS», Материалы третьей конференции ГИСАссоциации «Проблемы ввода и обновления пространственной информации», Москва, 23-27 февраля
1998 г.
2. Никонов Алексей. «Построение топологически корректной полигональной темы», Нежинское
государственное унитарное геологическое предприятие.
3. «ArcView и топология», ArcReview №2(1997), с. 10.
4. Collin Child. «ArcGIS Topology for ArcView Users», ArcUser, July-September 2003.
5. «ArcGIS 8.3 Brings Topology to the Geodatabase». ArcNews, June 26, 2002.
6. David M. Theobald. «Understanding Topology and Shapefiles», ArcUser, April-June 2001.
7. Дэвид Теобалд, «Топология и шейп-файлы», ArcReview №4(2001), с. 19.
CAME&L – СРЕДА МОДЕЛИРОВАНИЯ И БИБЛИОТЕКА РАЗРАБОТЧИКА
КЛЕТОЧНЫХ АВТОМАТОВ
Л.А.Наумов
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
Тел.: (812) 247-95-45, e-mail: [email protected]
Большинство актуальных в настоящее время вычислительных задач требуют для своего решения
мощностей превосходящих возможности однопроцессорного персонального компьютера. Это послужило
причиной столь бурного развития средств параллельных вычислений: создания многопроцессорных
компьютеров и вычислительных кластеров, а также разработки программного обеспечения для них.
Наиболее популярными (а, следовательно, и удачными) средством организации распределенных
параллельных вычислений является Globus Toolkit [1], один из инструментов реализации Grid-систем [24]. Такие инструменты, как MPI (Message Passing Interface) [5] и PVM (Parallel Virtual Machine) [6]
используют настолько широко, что их уже изучают в университетах. Однако базовой абстракцией в
данных средствах является понятие «сообщение», которое, в рассматриваемом контексте
воспринимается, как некоторая информация, получение которой может привести к выполнению какихлибо действий.
Проект CAME&L (Cellular Automata Modeling Environment & Library) направлен на создание среды и
библиотеки разработчика для решения задач параллельного программирования на основе понятия
«клеточный автомат» [7].
Ввиду того, что клеточные автоматы являются дискретными динамическими системами, то с их
помощью естественно моделировать объекты, описываемые дифференциальными уравнениями, так как
последние служат для описания непрерывных динамических систем. Клеточные автоматы являются
184
аналогом понятия «поле». Таким образом, многие задачи, например, физики, биологии, химии,
статистики могут быть эффективно решены с их помощью.
Клеточные автоматы являются одной из наиболее удобных, простых и общих моделей
параллельных вычислений так, как машины Тьюринга – для последовательных вычислений. При работе
на однопроцессорном компьютере программное обеспечение CAME&L имеет образовательное значение,
как средство выполнения, изучения и визуализации параллельных алгоритмов. Многопроцессорная или
кластерная платформа позволят использовать естественный параллелизм клеточных автоматов для
повышения скорости трудоёмких вычислений.
Перечислим основные свойства и отличительные особенности разрабатываемого программного
обеспечения CAME&L:
 Каждый автомат представляется набором из четырёх компонентов:

решётки (grid);

метрики (metrics);

хранилища данных (datum);

правил (rules).
 Это позволяет «собирать» автоматы с различной функциональностью, а также распределять
разработку системы обеспечения эксперимента между различными исполнителями.
 Реализация метрики в виде отдельного компонента позволяет использовать нестандартные
системы координат, как, например, обобщённые координаты [8].
 Для анализа величин, характеризующих систему, существует пятый тип компонентов –
анализаторы (analyzer).
 Каждый компонент декларирует список собственных параметров, изменение которых
обеспечивает настройку компонента.
 Компонент, реализующий правила автомата, декларирует список анализируемых параметров,
характеризующих работу системы. Среда позволяет наблюдать изменение их значений в
динамике, строить графики, файлы отчётов и т.п.
 Библиотека CADLib (Cellular Automata Developing Library), являющаяся частью программного
обеспечения CAME&L, представляет собой иерархию C++ классов для разработки компонентов и
реализации автоматов произвольной сложности.
 Среда обеспечивает сохранение документов в XML-формате (CML-файлы), который может стать
де-факто стандартом для обмена клеточной информацией. Для уменьшения размера этих файлов
информация о состоянии решетки автомата, внутри документа, может быть сжата с помощью
алгоритма BZip2.
 Программа имеет многодокументный интерфейс (MDI), что позволяет не только редактировать
несколько автоматов одновременно, но и реализовывать межавтоматные взаимодействия в
процессе моделирования.
 Предусмотрена возможность построения графиков динамики производительности вычислений,
что позволяет настраивать систему для достижения оптимальных результатов.
 Продукт может работать на однопроцессорном компьютере, многопроцессорной системе или в
вычислительном кластере (в том числе и через Интернет). При этом продукт не требует никаких
дополнительных инструментов для организации кластеров. Необходимые возможности
реализованы в среде.
 Большинство известных качественных сред моделирования клеточных автоматов разработаны
для операционных систем семейства Linux. Предлагаемая среда является Windows-приложением.
Анализ более чем двадцати существующих средств решения задач с использованием клеточных
автоматов позволяет выделить следующие преимущества проекта CAME&L.
 В настоящее время отсутствуют программные продукты со столь удобным пользовательским
интерфейсом, как в предлагаемой среде. Например, реализованы такие возможности, как:

поддержка буфера обмена;

поддержка отмены/повторения последней операции;

поддержка печати;

возможность сохранения состояния решётки в виде рисунков для иллюстрирования
публикаций.
 Все известные продукты накладывают жесткие ограничения на используемый тип клеточных
автоматов. Разрабатываемая среда универсальна и позволяет использовать произвольные
клеточные автоматы.
 Для кластерных вычислений используется специальных сетевой протокол CTP (Commands
Transfer Protocol), разработанный автором. Этот протокол быстрый, надёжный и ориентированный
именно на распределённые вычисления, в то время, как в большинстве кластеров сейчас
использует протокол общего назначения TCP (Transmission Control Protocol).
Проект получил высокую оценку экспертов на международной конференции по компьютерным
наукам ICCS (International Conference on Computational Sciences), которая проходила в Мельбурне и
Санкт-Петербурге в 2003 г.
185
Литература
1.
2.
3.
4.
5.
6.
7.
8.
I.Foster, C.Kesselman Globus: A Metacomputing Infrastructure Toolkit // http://www.globus.org.
2002.
I.Foster, C.Kesselman, S.Tuecke The Anatomy of Grid // http://www.globus.org. 2001.
I.Foster, C.Kesselman, J.M.Nick, S.Tuecke The Physiology of Grid // http://www.globus.org. 2002.
I.Foster What is a Grid? A Three Point Checklist // http://www.globus.org. 2002.
N.MacDonald, E.Minty, T.Harding, S.Brown Writing Message Passing Parallel Programs with MPI
– Edinburgh Parallel Computing Center. The University of Edinburgh. 1996.
A.Geist, A.Beguelin, J.Dongarra, W.Jiang, R.Manchek, V.Sunderam PVM: Parallel Virtual
Machine. A User Guide and Tutorial for Networked Parallel Computing – MIT Press, Cambridge.
1994.
J.von Neumann Theory of Self-Reproducing Automata – University of Illinois Press. 1966.
L.Naumov Generalized Coordinates for Cellular Automata Grids // Computational Science – ICCS
2003. Part 2. Springer-Verlag. 2003.
ПРИМЕНЕНИЕ ВЕРОЯТНОСТНОГО МОДЕЛИРОВАНИЯ В МЕТОДАХ
ЭКОНОМНОГО КОДИРОВАНИЯ ВИДЕОИНФОРМАЦИИ
В.В.Семенюк
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
E-mail: [email protected]
На сегодняшний день весьма актуальна проблема хранения и передачи видеоинформации в
цифровом виде. Для получения компактных представлений информации используются алгоритмы
экономного кодирования. Их применение позволяет существенно снизить требования, накладываемые
на объем информационного носителя, и увеличить скорость передачи информации по
телекоммуникационным каналам.
Алгоритм экономного кодирования включает в себя моделирование процесса порождения
информационной выборки и осуществляемую на основе этого моделирования генерацию кода. С целью
снижения вычислительной сложности на практике долгое время применялись упрощенные методы
информационного моделирования и генерации кода. В качестве информационных моделей брались, как
правило, простейшие комбинаторные модели, а генерация кода осуществлялась с использованием
заранее подготовленных статических систем префиксных кодов. В настоящее время постановка задачи
изменилась: на первый план все чаще выходит эффективность кодирования. Сегодня целесообразно
применять сложные технологии кодирования, позволяющие достигнуть максимально компактного
информационного представления.
Одним из наиболее эффективных методов информационного моделирования является
вероятностное контекстно-зависимое моделирование. При использовании данного метода выбор
информационной модели в каждый момент времени осуществляется на основе значения некоторого
контекста, который формируется из элементов уже обработанной информационной выборки. Вводя
контексты, мы фактически решаем задачу идентификации состояний информационного источника. Для
каждой модели хранится статистическая информация о появлении различных символов
информационного алфавита в контексте, соответствующем данной модели. На основе этой информации
формируется распределение вероятностных оценок появления символов на выходе источника, которое
служит основой для генерации кода.
Арифметическое кодирование является наиболее эффективным методом генерации кода по
заданному вероятностному распределению. Использование этого метода позволяет получать коды,
длины которых мало отличаются от теоретически оптимальных значений. Сочетание вероятностного
моделирования и арифметического кодирования на сегодняшний день наиболее выгодно с точки зрения
эффективности кодирования.
В данной статье рассмотрены результаты практического исследования, целью которого является
создание методов повышения эффективности стандартных технологий экономного кодирования за счет
применения вероятностного моделирования и арифметического кодирования. Были рассмотрены две
задачи:
 повышение эффективности стандартных схем кодирования JPEG и MPEG4;
 разработка эффективного алгоритма кодирования изображений на основе дискретного вейвлетпреобразования.
Результатом решения первой задачи стал алгоритм высокоэффективного контекстно-зависимого
кодирования коэффициентов двухмерного блочного дискретного косинусного преобразования,
используемого в стандартах JPEG и MPEG4. Идея заключается в построении контекстной модели,
хорошо описывающей особенности двумерного пространственного распределения значений
коэффициентов преобразования. При формировании контекста кодируемого символа используется
информация об уже обработанных соседних символах, а также информация о позиции, на которой
186
находится кодируемый символ. При построении модели была учтена важная особенность
распределения значений коэффициентов, состоящая в том, что их абсолютные значения, как правило,
уменьшаются при движении в направлении от левого верхнего угла в блоке к правому нижнему углу. За
счет учета данной особенности удалось добиться достаточно высокой производительности кодирования.
Практические эксперименты показали, что использование предложенного алгоритма позволяет повысить
эффективность стандартных схем кодирования JPEG и MPEG4 в среднем на 10%. При этом не было
отмечено заметного снижения скорости обработки информации. Разработанный алгоритм стал частью
новой перспективной технологии кодирования видеоинформации VSS Codec.
В результате решения второй задачи был разработан алгоритм экономного кодирования
коэффициентов дискретного вейвлет-преобразования. В алгоритме применяется высокоэффективная
схема контекстно-зависимого кодирования, основанная на идеологии нуль-деревьев. Коэффициенты
кодируются поразрядно, начиная от старших разрядов и заканчивая младшими. Отдельно
обрабатываются знаки коэффициентов. При кодировании разрядов (знаков) используются
пространственные контекстные модели. Контекст для разряда коэффициента (знака) формируется на
основе информации об уже обработанных разрядах (знаках) соседних коэффициентов. Порядок
кодирования имеет древовидную структуру, что позволяет лучше утилизировать особенности
распределения значений коэффициентов (распределение значений обладает так называемым
масштабным подобием). Было проведено практическое сравнение разработанного алгоритма с
существующими аналогами. Сравнивалось пиковое соотношение сигнал-шум при фиксированном
размере закодированного изображения. В среднем предложенный алгоритм оказался на 0.1-0.2 db
эффективнее существующих решений.
Следует отметить, что в процессе разработки алгоритма кодирования коэффициентов вейвлетпреобразования был предложен новый способ адаптивного кодирования выборки двоичного
информационного источника, более эффектный и более быстрый по сравнению с методом, обычно
применяемым на практике.
Таким образом, в результате исследования удалось показать, что применение сложных методов
вероятностного моделирования позволяет добиться заметного повышения эффективности экономного
кодирования источников видеоинформации. Разработанные алгоритмы уже сегодня успешно
применяются на практике.
ИСПОЛЬЗОВАНИЕ СИСТЕМЫ FEMLAB ДЛЯ МОДЕЛИРОВАНИЯ
ПРОЦЕССОВ, ПРОИСХОДЯЩИХ В КОЖЕ ПОД ВОЗДЕЙСТВИЕМ
ОПТИЧЕСКОГО ИЗЛУЧЕНИЯ
А.Е.Пушкарева, М.З.Смирнов
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
E-mail: [email protected]
Проблема моделирования процессов, происходящих в живых тканях при воздействии оптического
излучения, в настоящее время является достаточно актуальной. Оптические технологии получают все
большее распространение в медицине, и все более остро встает вопрос предсказания возможных
результатов воздействия. Однако количество работ, посвященных клиническому опыту проведения тех
или иных процедур, намного превышает число теоретических исследований. В данной статье изложены
некоторые аспекты и проблемы моделирования воздействия оптического излучения на биологические
ткани, в частности на кожу человека, с помощью системы Femlab.
Проблемы, возникшие при моделировании, можно разделить на две основные группы.
Первая группа включает в себя проблемы, связанные с построением физико-математической
модели живой биоткани. Биологические ткани, такие как, например, кожа, являются рассеивающими
неоднородными многокомпонентными средами, оптические свойства которых сильно зависят от длины
волны падающего излучения. Вдобавок, в коже человека расположены волосы и вены, имеющие свои
индивидуальные оптические и теплофизические характеристики, вследствие чего они существенно
влияют на распределение излучения в коже и на температурную динамику. Помимо наличия
индивидуальных особенностей и различных структур можно также отметить метаболические реакции,
перенос тепла кровью сложную геометрию слоев кожи, которые не являются плоскими, наличие сложных
биохимических процессов, в т.ч. стимулированных оптическим излучением. Все это в значительной
степени осложняет процесс моделирования воздействия света на кожу.
Другая группа проблем порождается необходимостью последовательного решения двух задач –
распространения света и тепла в коже. Основной сложностью здесь является трансформация
результатов оптического расчета в исходные данные теплового расчета.
В работе также уделено внимание вопросу оценки безопасности и эффективности воздействия.
Результатом расчетов может являться не только температура в какой-то определенной точке, но и
полное распределение температуры в коже. Также существует возможность сравнения поражения
различных участков ткани.
187
CTP (COMMANDS TRANSFER PROTOCOL) – СЕТЕВОЙ ПРОТОКОЛ ДЛЯ
ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ ВЫЧИСЛЕНИЙ
Л.А.Наумов
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
Тел.: (812) 247-95-45, e-mail: [email protected]
Вычислительный кластер – особая система, требующая специфической организации сетевого
взаимодействия между составляющими её частями. Основные требования, предъявляемые к механизму
сетевого взаимодействия в кластере, перечислены ниже:
 высокая скорость обмена данными;
 надёжность обмена данными;
 поддержка широковещательной рассылки (не необходимо, но полезно);
 поддержка пересылки больших блоков данных (необходимо не всегда, но для некоторого класса
задач).
Отметим, что большинство инструментов для организации высокопроизводительных вычислений в
кластерах являются библиотеками, предоставляющими разработчикам реализации неких абстракций,
структур данных, а также функции, работающие с этими структурами. Однако, как правило, эти
библиотеки не затрагивают вопрос сетевого взаимодействия, а используют стандартные сетевые
протоколы общего назначения (модели TCP/IP [1] в большинстве случаев).
Перечислим недостатки протокола TCP в свете приведенных выше требований к сетевым
взаимодействиям между элементами кластера:
 низкая скорость обмена данными. «Надёжность» и «универсальность» протокола TCP требует
множества накладных расходов;
 формирование пакета TCP занимает лишнее время, так как пакет содержит избыточные, с точки
зрения кластерных вычислений, параметры;
 TCP не поддерживает широковещательную рассылку данных. UDP [2] поддерживает, но он не
надёжен и, к тому же, неудобен для пересылки больших блоков данных (размер дейтаграммы
ограничен 65467 байтами [1]);
 TCP – поточный протокол, в то время, как обмен чётко ограниченными блоками данных удобнее
при решении задач с детерминированными условиями.
Разработка специализированного протокола для кластерных вычислений позволит добиться
выполнения перечисленных в начале работы требований.
Автором было решено разработать сетевой протокол Commands Transfer Protocol (CTP) для
использования его в проекте CAME&L (Cellular Automata Modeling Environment & Library) – среде
моделирования и библиотека разработчика клеточных автоматов, служащей для организации и изучения
параллельных вычислений.
Большинство существующих средств организации параллельных вычислений используют понятие
«сообщение», как базовую абстракцию. В протоколе CTP базовой абстракцией является понятие
«команда».
Что такое, в сущности, «команда»? Это приказ от кого-то кому-то сделать что-то. Чаще всего
вычисления в кластере происходят именно так: машины посылают друг другу запросы на некоторые
значения, давая, таким образом, друг другу приказы выполнять некоторые вычисления.
Понятия «сообщение» и «команда» можно считать синонимами в данном контексте («команда»
является «сообщением»).
В протоколе CTP выполнение четырёх требований, предъявляемых к механизму сетевого
взаимодействия в кластерных системах, достигается следующим образом:
 Для увеличения скорости обмена данными было решено выбрать протокол UDP в качестве
базового протокола. Ещё одной причиной этого выбора послужила чрезвычайная популярность
модели TCP/IP, в которую входит протокол UDP.
 Надежность протокола обеспечивается дополнительно. Отправленный пакет сохраняется до
момента получения подтверждения его доставки. Для этих целей каждому пакету присваивается
идентификационный номер, уникальный для каждого отправителя. В случае, если подтверждение
не приходит слишком долго, то пакет отправляется повторно.
 Широковещательную рассылку поддерживает протокол UDP.
 Поддержка пересылки больших блоков данных реализуется дополнительно. В случае если
величина сообщения превышает некоторое предельное значение (по умолчанию – 65400 байтов),
оно будет разделено на пакеты, размер данных в которых не превосходит этого предела. Пакеты
нумеруются и отправляются получателю. На стороне получателя они снова составляются в
единый блок данных. При этом информация о получении команды будет доставлена только после
воссоединения всех частей сообщения. Сообщения, требующие разделения на части, будут
называться «большими сообщениями».
Таким образом, IP-адрес отправителя, идентификатор подтверждаемого пакета и номер пакета
внутри сообщения, однозначно определяют отправленный пакет, если он представляет собой часть
188
большого сообщения. Для однозначного определения пакета, соответствующего обычному сообщению,
отпадает необходимость в номере пакета внутри сообщения.
В результате, заголовок каждого пакета содержит поля, перечисленные в следующей таблице:
Имя
Размер пакета
Команда
Размер
(в битах)
16
16
Номер пакета
внутри большого
сообщения
32
Количество пакетов
в большом
сообщении
Идентификатор
32
Размер сообщения
64 (только 48
используются)
Опции
32
8
Комментарии
Целое число без знака – размер пакета, включая заголовок
Целое число без знака – идентификационный номер команды (от
нуля до 32767, старший бит не установлен). Если старший бит
установлен, то данный пакет является подтверждением
получения пакета с соответствующей командой
Целое число без знака. Для больших сообщений – номер пакета,
от нуля до количества пакетов, несущих данное сообщение
(значение из следующего поля заголовка) минус единица. Для
обычных сообщений – единица
Целое число без знака. Для больших сообщений – количества
пакетов, несущих данное сообщение. Для обычных сообщений –
ноль или единица
Целое число без знака. Идентификатор данного пакета. Должен
быть уникален для каждого отправителя
Целое число без знака – размер сообщения (без учёта заголовков
пакетов). Максимальный размер сообщения, которое можно
переслать, равен 232*65400 (максимальное число пакетов на одно
сообщение, умноженное на максимальный размер пакета), то
есть 280890861158400 байтов или более 255 терабайтов. Это
означает, что размер сообщения практически не ограничен. Для
хранения этого значения достаточно 48 битов, в то время, как
отведено под него 64 бита
Набор битов, каждый из которых соответствует определённой
опции, влияющей на обработку отправки/получения пакета. Их
обсуждение останется за рамками настоящей работы
Таким образом, общий размер заголовка – 25 байт.
Разработана библиотека для использования протокола CTP при разработке приложений для
операционной системы Windows. Данная библиотека является основой сетевой функциональности
проекта CAME&L.
Литература
1. A. Jones, J. Ohlund Network Programming for Windows – Microsoft Press. 2000.
2. E. Nemeth, G. Snyder, S. Seebass, T. R. Hein Unix System Administration Handbook. Third Edition –
Prentice Hall PTR. 2001.
UNIMOD – ПРОГРАММНЫЙ ПАКЕТ ДЛЯ РАЗРАБОТКИ ОБЪЕКТНООРИЕНТИРОВАННЫХ ПРИЛОЖЕНИЙ НА ОСНОВЕ АВТОМАТНОГО
ПОДХОДА
В.С.Гуров, М.А.Мазин, А.А.Шалыто
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
E-mail: [email protected], [email protected]
В последнее время широкое распространение получили пакеты для проектирования программ на
языке UML [1]. Они позволяют разработчику описывать модель программы с помощью набора диаграмм.
В дальнейшем диаграммы могут быть преобразованы в код на целевом языке программирования.
В языке UML существуют диаграммы для описания как статической структуры программы
(диаграммы классов), так и для описания поведения объектов (диаграммы состояний, диаграммы
взаимодействия, диаграммы последовательности вызовов).
Существует множество методологий для моделирования статической структуры программ, а также
для получения кода на целевом языке. Описание же поведенческой части программы, как правило, носит
неформальный характер. Отсутствует семантическая связь с создаваемым в последствии кодом. При
наличии сложной логики достаточно трудно применять диаграммы состояний в виде, предлагаемом
авторами UML.
В работе [2] предложен метод проектирования событийных объектно-ориентированных программ с
явным выделением состояний, названный «SWITCH-технологией». Особенность этого подхода состоит в
том, что поведение объектов описывается с помощью конечных автоматов, представляемых в форме
189
графов переходов с нотацией, предложенной в работе [3]. Существуют утилиты, позволяющие
автоматически получать код из графов переходов [4].
Настоящая работа посвящена описанию разработанного авторами программного пакета UniMod.
Этот пакет реализует подход, описанный в работе [5], и решает задачи автоматизации построения
событийных объектно-ориентированных программ с явным выделением состояний. Для обеспечения
переносимости создаваемых приложений применяется язык программирования Java и язык разметки
XML. Для проектирования конечных автоматов используется методология SWITCH-технологии и
унифицированный язык моделирования UML. Схема связей автомата, записывается с помощью
диаграммы классов, а граф переходов – с помощью диаграммы состояний.
Программный пакет UniMod состоит из следующих частей:
 ядро, содержащее объектную метамодель конечного автомата, алгоритмы разбора и
интерпретации булевских выражений, алгоритмы проверки корректности конечного автомата и
среду исполнения XML-описания модели конечного автомата;
 встраиваемый модуль для среды разработки диаграмм на языке UML, который помогает
создавать схемы связей автомата и графы переходов в виде UML-диаграмм, а также выполняет
генерацию XML-описания.
Задача проверки корректности графа переходов, включает в себя:
 проверку достижимости каждого простого (без вложенных) состояния;
 проверку единственности начального состояния для каждого сложного состояния;
 проверку единственности перехода при любом сочетании события и значений входных
переменных (непротиворечивость);
 проверку наличия переходов при любых сочетаниях событий и значений входных переменных
(полнота).
Множество достижимых состояний строится обходом графа переходов «в глубину». Проверка
единственности начального состояния осуществляется последовательным просмотром каждой вершины
графа. Непротиворечивость означает, что условия на всех исходящих переходах попарно ортогональны,
а полнота – что конъюнкция всех переходов равна единице.
Для разбора булевских формул в условиях на дугах графа применялась библиотека ANTLR [7]. Она
позволяет по заданной LL(k) грамматике, строить транслятор, который преобразует входной поток в
синтаксическое дерево разбора. Полученное дерево можно интерпретировать во время выполнения, а
также трансформировать в другое дерево.
В программный пакет UniMod входит также встраиваемый модуль для среды ArgoUML [8]. Этот
модуль, в частности, позволяет упростить процесс создания схем связей и графов переходов автоматов.
Модуль представляет в виде дерева структуру разрабатываемого конечного автомата. Узлами
дерева являются объекты управления, состояния и переходы между состояниями. Узлу, который
представляет объект управления, сопоставлен класс на схеме связей. Узлу, представляющему
состояние – состояние на графе переходов. При выделении какого-либо узла в дереве, открывается
диаграмма, на которой присутствует соответствующий элемент, и он выделяется. Такой подход,
предложенный авторами, позволяет легко ориентироваться в структуре создаваемого конечного
автомата.
Модуль также отображает ошибки проверки корректности автомата. Эти ошибки делятся на два
класса – синтаксические и семантические. К синтаксическим относятся такие ошибки, как отсутствие
имени состояния или неправильное имя объекта управления. Узлы, содержащие синтаксические ошибки,
выделяются в дереве красным цветом.
Узлы, содержащие семантические ошибки, выделяются синим цветом. К семантическим относятся
такие ошибки как наличие более одного начального состояния, недостижимость состояния, неполнота
или противоречивость множества исходящих переходов из состояния.
Разработанный метод апробирован при создании ряда приложений и показал свою эффективность.
К таким приложениям относятся, например: клиент-серверное приложение мгновенного обмена
сообщениями [9] и задача о преступниках (http://is.ifmo.ru/?i0=reflections&i1=problems).
Программный пакет UniMod позволяет:
 сократить объем ручного программирования;
 при наличии библиотеки требуемых объектов управления отказаться от ручного
программирования;
 использовать диаграммы классов и графы переходов в составе проектной документации;
 формально и наглядно описывать логику поведения программы и модифицировать ее, изменяя
только графы переходов;
 упростить сопровождение проекта вследствие повышения централизации логики программы.
Дистрибутив, исходные тексты, документация и примеры использования программного пакета
UniMod представлены на сайте http://unimod.sourceforge.net.
Литература
1. Буч Г., Рамбо Д., Джекобсон А. Язык UML. Руководство пользователя. М.: ДМК, 2000. – 320 с.
2. Шалыто А.А., Туккель Н.И. Танки и автоматы //BYTE/Россия. 2003. №2, с. 69-73. http://is.ifmo.ru
(раздел «Статьи»).
190
3. Шалыто А.А., Туккель Н.И. SWITCH-технология - автоматный подход к созданию программного
обеспечения "реактивных" систем //Программирование. 2001. №5, с. 45-62. http://is.ifmo.ru (раздел
«Статьи»).
4. Головешин А. Использование конвертора Visio2SWITCH. http://is.ifmo.ru.
5. Гуров В.С., Нарвский А.С., Шалыто А.А. Автоматизация проектирования событийных объектноориентированных программ с явным выделением состояний //Труды X Всероссийской научнометодической конференции "Телематика-2003". СПб.: СПбГИТМО (ТУ). 2003. http://tm.ifmo.ru.
6. Кормен Т., Лайзерсон Ч., Ривест Р. Алгоритмы. Построение и анализ. М.: МЦМНО 2000. – 960 с.
7. ANTRL (ANother Tool for Language Recognition). http://antlr.org/
8. ArgoUML. http://argouml.org.
9. Гуров В.С., Шалыто А.А. Построение простого клиент-серверного приложения на основе
автоматного подхода (ICQ и автоматы). http://is.ifmo.ru (раздел «Проекты»).
РЕАЛИЗАЦИЯ ВИЗУАЛИЗАТОРОВ НА ОСНОВЕ АВТОМАТНОГО
ПРОГРАММИРОВАНИЯ
М.А.Казаков, А.А.Шалыто
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
Тел.: (812) 247-95-45, e-mail: [email protected]
Одним из методических приемов [1- 4] при обучении программированию и дискретной математике
является разработка визуализаторов классических вычислительных алгоритмов [5, 6].
Визуализатор – это программа, иллюстрирующая выполнение алгоритма при определенных входных
данных. Примерами визуализаторов могут служить, например, программа, занимающаяся построением
графика функции, либо программа, визуально моделирующая какой-либо физический процесс.
Применительно к дискретной математике и программированию, визуализаторы обычно моделируют
некоторые алгоритмы, давая возможность обучающемуся при помощи интуитивно понятного интерфейса
проходить алгоритм шаг за шагом от начала до конца, а при необходимости, и обратно.
Визуализаторы в рассматриваемой области решают следующие задачи, возникающие в процессе
обучения.
1. Графическое и словесное разъяснение действий алгоритма на конкретных наборах входных
данных. При этом понимание алгоритма не обязательно, поскольку именно визуализатор должен
объяснить действие алгоритма.
2. Предоставление пользователю инструмента, реализующего данный алгоритм. При этом учащийся
освобождается от необходимости выполнять шаги алгоритма, так как их автоматически выполняет
визуализатор.
Визуализатор выполняет обычно следующие функции:
 пошаговое выполнение алгоритма;
 возможность просмотра действия алгоритма при разных наборах входных данных, в том числе и
введенных пользователем;
 возможность просмотра действия алгоритма в динамике;
 возможность перезапуска алгоритма на текущем наборе входных данных.
Динамическая визуализация наглядно демонстрирует такую характеристику алгоритма, как
трудоемкость (особенно при пошаговой демонстрации). Для некоторых алгоритмов (например, машины
Тьюринга) динамический вариант демонстрации вообще представляется более естественным, чем
любой набор статических иллюстраций.
До недавнего времени технология разработки визуализаторов сводилась к эвристике. При этом
каждый алгоритм требовал нового подхода и осмысления реализации визуализатора. Другими словами,
технология разработки визуализаторов отсутствовала, и основные успехи в этой области были
педагогическими [3, 4, 7].
Основным недостатком при построении визуализаторов является то, что обычно используются
только такие понятия, как «входные и выходные переменные», а понятие «состояние» в явном виде не
используется. Однако, по мнению авторов, совершенно естественным кажется, что каждый шаг
визуализации необходимо проводить в соответствующем состоянии или на переходе. Поэтому при
построении программ визуализации целесообразно использовать технологию автоматного
программирования, базирующуюся на конечных автоматах [8].
В настоящей работе показано, что применение программирования с явным выделением состояний
превращает процесс разработки логики визуализаторов в технологию.
Основным требованием к визуализатору является возможность пошаговой реализации алгоритма.
Поэтому предлагаемая технология должна преобразовать исходный алгоритм в набор шагов для
отображения на экране.
Визуализатор «по-крупному» предлагается строить следующим образом:
 по программе строится автомат логики визуализатора (контроллер – controller);
191
 выбираются визуализируемые переменные (модель – model);
 проектируется формирователь изображений и комментариев, который преобразует номер
состояния и соответствующие значения визуализируемых переменных в «картинку» и
поясняющий текст (представление – view).
Такая конструкция визуализатора соответствует одному из основных паттернов проектирования
объектно-ориентированных программ, который обозначается аббревиатурой MVC (Model-View-Controller)
[9].
Предлагаемая технология основана на методе построения конечного автомата по тексту программы
[10]. При этом по указанному тексту строится схема алгоритма, которая на основе соответствующего
кодирования преобразуется в граф перехода конечного автомата.
Исходя из изложенного, сформулируем основные этапы технологии построения визуализаторов:
 1. Постановка задачи.
 2. Решение задачи (в словесно-математической форме).
 3. Выбор визуализируемых переменных.
 4. Анализ алгоритма для визуализации. Анализируется решение с целью определения того, что и
как отображать на экране.
 5. Алгоритм решения задачи.
 6. Реализация алгоритма на выбранном языке программирования. На этом шаге производится
реализация алгоритма, его отладка и проверка работоспособности.
 7. Построение схемы алгоритма по программе.
 8. Преобразование схемы алгоритма в граф переходов автомата Мили.
 9. Формирование набора невизуализируемых переходов.
 10. Выбор интерфейса визуализатора.
 11. Сопоставление иллюстраций и комментариев с состояниями автомата.
 12. Архитектура программы визуализатора.
 13. Программная реализация визуализатора.
Известно, что обычно создание программы разбивается на пять стадий: разработка требований,
анализ, проектирование, реализация и тестирование. В данном случае к разработке требований
относятся первые три пункта технологии. Анализ – пп. 4, 5. К проектированию относятся пп. 6-11. В
отличие от традиционного для объектно-ориентированного программирования подхода, выбор
архитектуры программы относится не к стадии проектирования, а к реализации, так как все предыдущие
пункты технологии не зависят от реализации. Естественно, что к стадии реализации относится и
последний пункт.
При использовании предлагаемой технологии тестирование резко упрощается, а время написания
визуализатора сокращается.
Анализ Интернет-ресурсов в области построения визуализаторов [11-16], а также опыт их разработки
и приема у студентов в рамках учебного процесса в 1999/2000 гг. на кафедре «Компьютерные
технологии» СПбГУ ИТМО, позволяет утверждать, что предложенный подход является «прорывом» в
области построения визуализаторов.
Литература
1. Интернет-школа программирования. http://ips.ifmo.ru/.
2. Казаков М.А., Мельничук О.П., Парфенов В.Г. Интернет-школа программирования в СПбГИТМО
(ТУ). Реализация и внедрение // Всероссийская научно-методическая конференция «Телематика'2002».
СПб.: 2002. – С.308-309. (http://tm.ifmo.ru/tm2002/db/doc/get_thes.php?id=170).
3. Столяр С.Е., Осипова Т.Г., Крылов И.П., Столяр С.С. Об инструментальных средствах для курса
информатики // II Всероссийская конференция «Компьютеры в образовании». СПб.: 1994.
4. Казаков М.А., Столяр С.Е. Визуализаторы алгоритмов как элемент технологии преподавания
дискретной математики и программирования // Международная научно-методическая конференция
«Телематика'2000» . СПб.: 2000. – С.189-191.
5. Кормен Т., Лайзерсон Ч., Ривест Р. Алгоритмы. Построение и анализ. М.: МЦМНО, 2000. – 960 с.
6. Кнут Д. Искусство программирования. Т. 1: Основные алгоритмы. М.: Вильямс, 2001. – 712 с.
7. A Testbed for Pedagogical Requirements in Algorithm Visualizations.
8. Шалыто А.А. Технология автоматного программирования // Мир ПК. 2003. №10. С.74-78.
http://is.ifmo.ru, раздел «Статьи».
9. Гамма Э., Хэлм Р., Джонсон Р., Влиссидес Дж. Приемы объектно-ориентированного
проектирования. Паттерны проектирования. СПб.: Питер, 2001. – 325 с.
10. Шалыто А.А., Туккель Н.И. Преобразование итеративных алгоритмов в автоматные //
Программирование. 2002. № 5. – С.12-26. http://is.ifmo.ru, раздел «Статьи».
11. Gitta D. Tutorial on Visualization.
http://www.siggraph.org/education/materials/HyperVis/domik/folien.html.
12. Owen G. S. Visualization Concepts: Overview.
http://www.siggraph.org/education/materials/HyperVis/concepts/overview.htm.
13. Complete Collection of Algorithm Animations. http://www.cs.hope.edu/~alganim/ccaa/.
192
14. Interactive Data Structure Visualizations. http://www.student.seas.gwu.edu/~idsv/idsv.html.
15. Jawaa examples. http://www.cs.duke.edu/csed/jawaa2/examples.html.
16. Sorting Algorithms. http://www.cs.rit.edu/~atk/Java/Sorting/sorting.html.
XML-РЕЛЯЦИОННЫЕ ПРЕОБРАЗОВАНИЯ
А.В.Аржаник, С.А.Воллосович, А.В.Лямин
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
Тел.: (812) 232-59-14, e-mail: [email protected], [email protected], [email protected]
Для любой информационной системы быстродействие, удобство использования, возможность
модификации, естественность описания предметных областей и протекающих процессов, совместимость
с предыдущими версиями являются существенными параметрами. Для достижения оптимального
соотношения между этими параметрами разработчики вынуждены использовать на разных стадиях
прохождения информации разные модели данных. Поэтому актуальным представляется вопрос о
существовании преобразований между различными моделями представления информации.
В докладе рассматривается задача построения реляционной модели на основе XML-документов.
Большинство современных информационно-управляющих систем основываются на реляционной модели
данных, языком описания которой служит SQL. Эта модель является самой проработанной и позволяет
эффективно хранить информацию. В то же время формат XML широко используется для обмена
документами. Происходит это по нескольким причинам:
 гибкость, доступность и содержательная ориентированность формата;
 возможность стандартизации структуры документов;
 наличие механизмов преобразования XML-документов.
Многие современные версии локальных и клиент-серверных систем управления базами данных
(СУБД) поддерживают разные встроенные виды XML-преобразований. Как правило, они подразумевают
соответствия: одна таблица – один тег XML, одно поле – один тег, вложенный в тег таблицы. Данные
записываются в качестве содержимого элементов.
Клиент-серверная СУБД Oracle имеет несколько возможностей для работы c XML-содержимым. Эти
возможности делятся на два типа: поддержка непосредственного хранения XML в базе данных (в той или
иной форме) и программное манипулирование данными – запросы на выборку, генерирующие XML,
обновление и вставку XML-содержимого, разбор XML-документов.
Как и любые другие данные, XML в Oracle можно хранить в полях CLOB. Этот способ предполагает
основной вид доступа к XML-документу как к единому целому (выборка целиком и вставка целиком). В 9й версии Oracle появился новый тип данных поля – XMLType, специально ориентированный на XML. Есть
возможность создания XMLType-таблиц и отдельных полей. При создании поля есть две возможности:
хранение в структурированном виде (для каждого элемента и атрибута по определённому алгоритму
создаются скрытые поля, обязательно задавать XSD-схему XML) и хранение в неструктурированном
виде (создаётся скрытое поле CLOB, для которого поле XMLType является ярлыком, здесь
использование схемы XSD необязательно). Структурированный вид предполагает более быстрый,
похожий на реляционный (но нетождественный), физический доступ к содержимому, облегчённое
обновление и поиск данных. При структурированном хранении используются те же типы индексирования,
что и при доступе к реляционным данным. Логически возможности доступа расширяются –
использование в SQL операторов existNode, extract и т.д. Однако, этому способу свойственен ряд
ограничений, связанных с преобразованием XSD-сложных типов (complexTypes) и простейших типов
данных. При неструктурированном хранении возможно использование индексирования Oracle Text.
Однако, производительность обоих способов меньше, чем производительность при непосредственном
реляционном доступе.
В центре дистанционного обучения СПбГУ ИТМО в качестве концепции XML-реляционных
преобразований (XML используется как формат обмена с авторами элементами учебно-методических
комплексов, СУБД – как основа системы дистанционного обучения) была выбрана разработанная
оригинальная система правил:
 Обход дерева XML-документа ведется сверху вниз, текущей таблицей становится первый
встреченный элемент, совпавший по названию с именем таблицы.
 Элемент, название которого совпадает с таблицей, содержащий данные в формате PCDATA,
интерпретируется как поле DATA в таблице, название которой совпадает с названием элемента.
 Элемент, название которого не совпадает с таблицей, содержащий данные в формате PCDATA,
интерпретируется как поле в текущей таблице (имя поля есть имя элемента).
 Элемент, имя которого совпадает с названием таблицы, имеющий атрибут IsKey равный "Yes",
заносится только в том случае, если в этой таблице не существует такой записи. Если такая
запись имеется, транслятор генерирует сообщение об ошибке. Сообщение об ошибке
генерируется и в том случае, когда атрибут IsKey установлен в "No" и записи, соответствующей
данному элементу, в таблице нет.
193
 Элемент, имя которого совпадает с названием таблицы и для которого не задан атрибут IsKey,
заносится в таблицу. Если запись уже существует, происходит обновление связей. Иначе в
таблицу заносится новая запись.
 Все атрибуты – это поля в текущей таблице.
 Если атрибут какого-либо элемента совпадает с названием таблицы, то из таблицы TABLE_INDEX
с полями TABLE_NAME, RETURN_COLUMN, INDEX_COLUMN выбирается запись, поле
TABLE_NAME которой совпадает со значением атрибута. Затем, из таблицы с названием
атрибута выбирается значение поля, название которого хранится в поле RETURN_COLUMN
записи, которая удовлетворяет условию INDEX_COLUMN=значение_атрибута.
 Атрибут с названием SRC заносится в поле SRC текущей таблицы, а файл, на который указывает
атрибут, погружается в виде бинарных данных в поле CNT текущей таблицы.
 Элементу с названием ATTACH автоматически добавляется атрибут CRC32 со значением
подсчитанной контрольной суммы по алгоритму CRC32. Этот атрибут заносится в таблицу
ATTACH. Подсчет контрольной суммы внедрен для соблюдения уникальности и устранения
дублирования данных.
 Если поле с названием атрибута отсутствует в текущей таблице, то необходимо перейти вверх по
иерархии XML-документа и осуществить поиск таблицы с нужным полем. Поиск начинается с
таблицы, название которой образовано из имен дочернего и родительского элементов,
разделенных символом "_".
 Если существует таблица с названием, образованным из имен дочернего и родительского
элементов, разделенных символом "_", то осуществляется связь "многие-ко-многим".
 Если таблицы связи нет, происходит попытка использовать связь "многие-к-одному", т.е.
заносится значение поля ID из таблицы с названием родительского элемента в таблицу с
названием дочернего элемента. В таблице с названием дочернего элемента должно быть поле с
названием родительского элемента.
 Если не удалось установить связь "многие-к-одному", заносится значение поля ID из таблицы с
названием дочернего элемента в таблицу с названием родительского элемента. В таблице с
названием родительского элемента должно быть поле с названием дочернего элемента.
 Для элемента, у которого не указано никаких атрибутов, но название совпадает с названием
таблицы, в БД будет занесено только значение поля ID. Для таких элементов всегда должны
существовать вложенные элемент DATA или текстовые данные PCDATA, вложенные в текущий
элемент.
Система последовательно пытается установить между сущностями все возможные типы отношений,
что делает ее гибкой и приспосабливаемой к различным изменениям как структуры базы данных и DTDопределения XML-содержимого.
МОНИТОРИНГ И УПРАВЛЕНИЕ УЧЕБНЫМ ПРОЦЕССОМ СРЕДСТВАМИ
СИСТЕМЫ ДИСТАНЦИОННОГО ОБУЧЕНИЯ
А.В.Лямин, М.С.Чежин
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
Тел.: (812) 232-59-14, e-mail: [email protected], [email protected]
Использование современных информационных технологий в университете должно быть направлено
на повышение эффективности образования. В СПбГУ ИТМО с этой целью разрабатываются и
внедряются информационные подсистемы, предназначенные для автоматизации деятельности
различных подразделений. Одно из направлений развития информационных подсистем это создание
системы дистанционного обучения (ДО), основное назначение которой заключается в повышении
качества обучения за счет активизации самостоятельной работы студентов по изучению дисциплины и
объективности процесса аттестации знаний.
Разработанная в университете система ДО содержит учебно-методические комплексы (УМК),
которые включают в себя такие виды электронных учебно-методических материалов, как электронные
конспекты, аттестующие и обучающие тесты, виртуальные лаборатории и практикумы, информационные
ресурсы. Количество элементов электронных учебно-методических материалов и их объем должны
соответствовать видам учебной работы и их трудоемкости, предусмотренным рабочей программой
дисциплины и должны быть разработаны на основе Государственных образовательных стандартов
(ГОС). При этом описание учебного плана и рабочей программы дисциплины входит в электронный УМК,
и при обращении к системе ДО именно их видит пользователь в первую очередь, что позволяет более
основательно подходить к процессу обучения.
В результате работы с аттестующими тестами, виртуальными лабораториями и практикумами
студенты получают оценки, которые заносятся в базу данных. Формирование оценок осуществляется на
основе правил проведения контроля знаний, разработанных авторами УМК.
Возможности и количество доступной информации, предоставляемые пользователю при работе с
системой, определяться его ролью. В системе должны быть предусмотрены следующие роли: студент,
лаборант, тьютор, автор, декан, ректор, администратор. Роли указаны в порядке возрастания
194
возможностей пользователя при работе с системой. Любой пользователь может иметь несколько ролей,
но при входе в систему выбирается только одна из них.
Все материалы УМК разрабатываются в соответствии с требованиями спецификации XML, а
выходной формат системы удовлетворяет требованиям спецификации HTML 4.01, что позволяет
работать со всеми материалами системы, используя стандартный интернет-обозреватель.
Преобразование форматов осуществляется в соответствии с правилами спецификации XSLT. Система
обеспечивает возможность расширения выходного формата за счет внедрения объектов, построенных
на основе других спецификаций. Интерфейс системы определятся шаблонами, построенными на основе
спецификаций CSS и XSL, причем изменение интерфейса может производиться без остановки системы в
целом.
Программная структура системы включает базу данных, серверное и клиентское программное
обеспечение. База данных системы функционирует под управлением СУБД Oracle. Клиентское и
серверное программное обеспечение реализовано средствами системы программирования Java. Логика
работы системы обеспечиваться средствами СУБД. Взаимодействие с базой данных клиентского
программного обеспечения осуществляется только через серверное программное обеспечение, при этом
сервер системы может обращаться к табличному пространству базы данных системы только через
хранимые процедуры. Система имеет многоуровневые подсистемы безопасности и аудита,
чувствительные к таким параметрам, как IР-адрес, учетная запись и роль клиента, время входа и работы
в системе.
Минимальная конфигурация разработанного программного решения может функционировать на
типичных недорогих серверах класса Ultra SPARC-II с тактовой частотой от 500 МГц, оперативной
памятью от 512 МБ. Минимальный объем дискового пространства, требуемый собственно программными
средствами (без учета информационного наполнения), не превышает 10-15 ГБ. При этом созданное
программное обеспечение допускает увеличение, как нагрузок, так и объемов информационного
наполнения системы простым увеличением количества серверов и их технических параметров без
модификации программного обеспечения.
Работа с обучающими материалами системы ДО может осуществляться с любого компьютера
подключенного к Интернет. Для работы с аттестующими элементами студенты должны использовать
компьютеры, установленные в классах университета. Для упрощения доступа к ресурсам системы ДО в
университете был построен специальный компьютерный класс на основе на технологий фирмы Sun
Microsystems на 60 рабочих мест. Планирование работы данного компьютерного класса осуществляется
с помощью системы автоматического формирования расписания. Каждому студенту университета
устанавливается лимит времени работы в этом компьютерном классе, который определяется исходя из
количества изучаемых дисциплин представленных в системе ДО и их объема. В рамках этого лимита,
используя систему автоматического формирования расписания, студенты могут самостоятельно
записываются на работу с материалами электронных УМК на удобное для них время. Обращение к
системе автоматического формирования расписания осуществляется через Интернет. Система не
только формирует расписание работы класса, но и контролирует доступ студентов к компьютерам.
Использование системы ДО, материалы которой строятся на основе УМК предоставляет получить
единую структуру всех электронных учебно-методических элементов, привести их к единому стандарту и
в результате повысить эффективность и качество обучения, автоматизировать управление учебным
процессом. А организация доступа в компьютерные классы с помощью системы автоматического
расписания позволяет более гибко планировать работу и активизирует самостоятельную работу
студентов.
РАЗРАБОТКА ПРОМЕЖУТОЧНОГО ЯЗЫКА ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ
АВТОМАТОВ
Д.Г.Шопырин
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики
Тел.: (812) 325-31-31 (доп. 13191), e-mail: [email protected]
В программировании с явным выделением состояний (SWITCH-технология [0, 0]) вся
высокоуровневая логика программы реализуется посредством системы взаимосвязанных конечных
автоматов. При этом конечные автоматы заданы некоторым, формально определенном способом.
Другими словами, SWITCH-технология предлагает формальный язык описания конечных автоматов.
Конечный автомат может быть представлен графом переходов (графическое представление) или
программным кодом на одном из универсальных языков программирования (программное
представление). Отметим, что в данной работе не рассматриваются способы представления системы
конечных автоматов.
Основным недостатком графического представления является то, что оно крайне неудобно для
автоматического анализа. Перевод автомата из графического представления в программный код почти
всегда является ручной операцией. Если граф переходов автомата представлен в виде диаграммы
пакета Microsoft Visio, то существует возможность его автоматического преобразования в программный
код (например, с помощью конвертора Visio2SWITCH [0]). Однако в результате получается код на
195
фиксированном языке программирования, формат и идеология которого предопределены
особенностями конвертора. Написание же нового конвертора является весьма трудоемкой задачей.
Недостатком программного представления также является жесткая привязка к языку и идеологии
программирования. Перевод автомата с одного языка на другой (например, с C++ на C#) также является
ручной операцией (так как реализация универсального конвертора представляется практически
неразрешимой).
Итак, на данный момент не существует устоявшегося, удобного и переносимого способа задания
конечных автоматов в стиле SWITCH-технологии. Это в значительной мере ограничивает повторное
использование однажды реализованных автоматов. Существующие способы системонезависимого
представления автоматов не совместимы со SWITCH-технологией [0] (например, не делается различие
между деятельностью и действием в состоянии).
Отсюда следует необходимость разработки нового, системонезависимого, промежуточного формата
представления конечных автоматов. Далее приведены основные характеристики формата AIM
(Automaton Intermediate Module):
 1. Полная совместимость с библиотекой STOOL [0] (которая, в свою очередь, реализует все
базовые возможности SWITCH-технологии).
 2. Синтаксис формата AIM задан на языке XML Schema, стандартном языке описания структуры
XML-документов [0]. На данный момент существует множество свободно распространяемых
инструментальных средств для работы с XML вообще и с XML Schema, в частности, что
значительно упрощает работу с AIM.
 3. Предоставляемая XML-схема полностью определяет синтаксис формата AIM. Другими словами,
корректными AIM-документами являются те, и только те документы, которые удовлетворяются
XML-схеме формата AIM.
 4. Предоставляемая XML-схема контролирует целостность AIM-документа (например, корректный
AIM-документ не может содержать перехода в несуществующую вершину).
 5. Для работы с AIM-документом достаточно наличия одного из распространенных XML-парсеров
[0, 0]. Все данные, хранимые в AIM-документе, являются атомарными. Поэтому не возникает
необходимость дополнительного синтаксического анализа (например, нет нужды разбирать
выражения, соответствующие условиям переходов).
Вследствие пунктов 2-5 написание конвертора из формата AIM в программный код перестает быть
трудоемкой задачей, и вполне может быть выполнено в рамках прикладного проекта. Для реализации
конвертора может быть использован язык XSLT (Extensible Stylesheet Language Transformations),
стандартный язык преобразования данных [0].
Более трудоемкой задачей является построение по AIM-документу соответствующего графического
представления, так как этот процесс связан с решением сложных вычислительных задач (например,
изображение графа на плоскости). Поэтому, предлагается следующий способ работы:
 конечный автомат изначально разрабатывается в виде графа переходов в одном из
распространенных редакторов;
 графическое представление конечного автомата автоматически преобразуется в AIM-документ
(посредством XSLT-преобразования);
 по AIM-документу автоматически строится программное представление конечного автомата;
 любое изменение автомата происходит по цепочке «графическое представление – промежуточное
представление – программное представление».
Кроме того, существует возможность непосредственного выполнения автомата, заданного AIMдокументом. Это позволяет динамически изменять поведение системы посредством изменения AIMдокумента. Кроме того, данная возможность может быть использована для написания распределенных
систем с явным выделением состояний. Компоненты распределенный системы могут обмениваться друг
с другом конечными автоматами, заданными в виде AIM-документа. В ближайшем будущем возможность
интерпретировать AIM-документ будет добавлена в библиотеку STOOL.
Базовой единицей AIM-документа является пакет (package). Каждый пакет содержит один или
более конечных автоматов. Для каждого автомата задается:
 множество входных и выходных воздействий (интерфейс автомата);
 множество формул, используемых в качестве условий переходов между состояниями автомата;
 множество состояний автомата и переходов между ними;
 необязательная информация о группировке состояний и переходов.
Формат AIM в явном виде поддерживает следующие возможности SWITCH-технологии:
 различение деятельности и действия в вершине графа переходов;
 переходы по умолчанию;
 задание приоритетов для переходов;
 группировка состояний и переходов;
 использование формул для задания условий переходов.
Литература
1. Шалыто А.А., Туккель Н.И. Программирование с явным выделением состояний // Мир ПК. 2001. №
8, 9.
196
2. Шалыто А.А., Туккель Н.И. Реализация автоматов при программировании событийных систем.
//Программист. 2002. № 4
3. Головешин А. Использование конвертора Visio2SWITCH, http://www.softcraft.ru/auto/switch/v2s.shtml
4. Шопырин Д.Г. Шалыто А.А., «Объектно-ориентированный подход к автоматному
программированию»
5. Dynamic modification of algorithms, http://sourceforge.net/projects/dmabco/
6. World Wide Web Consortium, http://www.w3.org
7. Microsoft XML Developer Center, http://www.microsoft.com/xml
8. Apache XML Project, http://xml.apache.org/
АНАЛИЗ ПРОИЗВОДИТЕЛЬНОСТИ ВЫЧИСЛЕНИЙ ПРИ ДИНАМИЧЕСКОЙ
ОБРАБОТКЕ СИГНАЛОВ МЕТОДОМ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ
КАЛМАНА
М.А.Таратин, И.П.Гуров, А.С.Захаров
Санкт-Петербургский государственный университет информационных технологий,
механики и оптики, Санкт-Петербург
E-mail: [email protected]
В информационных системах во многих случаях требуется обработка информационных сигналов в
реальном времени или обработка значительных объемов информации с максимальным
быстродействием. Возможным подходом к решению этой задачи является использование дискретной
фильтрации Калмана [1], основанной на рекуррентных вычислительных процедурах. Известны
публикации [2], в которых рассматриваются особенности применения дискретного нелинейного фильтра
Калмана для динамического оценивания частоты и фазы квазигармонического сигнала, однако в этих
работах не приводятся оценки производительности вычислений. Для выполнения вычислений могут
быть использованы специализированные процессоры. Такой подход позволяет обеспечить высокое
быстродействие и необходимую точность вычислений, но обладает существенными недостатками:
трудоемкостью процесса разработки и высокой стоимостью. Другим возможным подходом является
использование для вычислений доступных персональных компьютеров. В последнее время они достигли
достаточно высокой производительности даже при работе с числами с плавающей точкой и могут быть
использованы для решения сложных вычислительных задач.
Целью данной работы является оценка максимальной производительности нелинейной дискретной
фильтрации Калмана при обработке сигналов на однопроцессорном компьютере на базе Intel Pentium 4 с
учетом особенностей его микроархитектуры [3].
Входными данными на каждом шаге рекуррентной фильтрации являются значение сигнала и оценка
значений его параметров с предыдущего шага. Значение сигнала эффективно кэшируется при
последовательном чтении данных, значения параметров сохраняются в кэше или регистрах процессора
с предыдущего шага, поэтому время выполнения операций чтения и записи занимает пренебрежимо
малое время. Кроме этого, вследствие небольшого количества выполняемых операций на каждом шаге
фильтрации, время выполнения операций чтения и сохранения данных, используемых в теле цикла,
является незначительным, так как эти данные также находятся в кэше или регистрах процессора.
Поэтому на каждом шаге фильтрации выполняются операции только с данными из регистров процессора
или кэша (первого или второго уровня). В связи с тем, что операции чтения и записи в Intel Pentium 4
вынесены в отдельный операционный блок и могут выполняться параллельно с другими операциями,
можно считать, что время их выполнения не окажет существенного влияния на общее время выполнения
вычислений. Таким образом, для оценки максимального быстродействия достаточно определить время
выполнения вычислительных операций и не учитывать время выполнения операций чтения и записи
данных. При исключении из процесса вычислений дублирующих операций [2] получим оценку количества
операций, выполняемых на каждом шаге фильтрации согласно рис. 1.
197
1
деление
14
умножение
1
косинус
1
синус
5
вычитание
6
сложение
Рис. 1. Количество вычислительных операций на одном шаге фильтрации
В качестве базового типа вычислений выберем четырехбайтовый тип с плавающей точкой (8 бит
порядок, 24 бита мантисса). Все операции, за исключением вычисления значений функций синуса и
косинуса, можно выполнять с помощью набора векторных инструкций Streaming SIMD Extensions (SSE).
Благодаря тому, что размер представления числа составляет четыре байта, возможна работа со
значениями, упакованными в векторы размерностью четыре. Это позволяет значительно повысить
производительность вычислений.
Оценка времени выполнения каждой из используемых инструкций SSE [4] приведена в табл. 1. Здесь
и далее время выполнения операций выражено количеством тактов процессора перед выполнением
следующей операции того же типа.
Табл. 1. Время выполнения операций (в тактах процессора)
Сложение ADDPS
Вычитание SUBPS
Умножение MULPS
Деление DIVPS
2
2
2
39
Из-за того, что в наборе инструкций SSE отсутствуют тригонометрические операции, для вычисления
значений функций синуса и косинуса приходится использовать блок Floating Point Unit (FPU). Инструкции
FSIN и FCOS можно заменить на FSINCOS, поскольку операнды команд одинаковы. Время выполнения
операции FSINCOS на процессоре Intel Pentium 4 составляет 140 тактов.
Предположим, что при фильтрации возможно изменить последовательность инструкций таким
образом, чтобы загрузка всех выполняющих операции блоков процессора была близка к оптимальной.
При этом минимальное время T выполнения вычислений для одного шага фильтрации определяется
общим временем выполнения операций умножения, деления и вычисления функций синуса и косинуса, а
именно:
T
((14  5  6)  2  39  1)
4
 140  162 .
При использовании процессора Intel Pentium 4 с тактовой частотой 3,2 ГГц обеспечивается
нелинейная фильтрация параметров информационных сигналов с частотой до 20 МГц.
Проведенный анализ показывает, что определяющим фактором, ограничивающим быстродействие,
является время вычислений значений функций синуса и косинуса. Для дополнительного повышения
производительности вычислений возможна замена упомянутых выше инструкций на более быстрые
аналоги, в частности, на инструкции SSE/SSE2. Кроме этого, определив необходимую точность
вычисления операций синус и косинус, возможно использовать массивы предварительно рассчитанных
значений функций синуса и косинуса.
Литература
1. Kalman R.E. A new approach to linear filtering and prediction problems //Trans. ASME, J. Basic Eng.
1960. V.82. P. 35-45.
2. Alarousu E., Gurov I., Hast J., Myllyla R., Prikari T., Zakharov A. Optical coherence tomography
evaluation of internal random structure of wood fiber tissue. In: Sixth International Conference of Quality Control
by Artificial Vision / K.W. Tobin, and F. Meriaudeau, eds. // Proc. SPIE. 2003. Vol. 5132. P. 149-160.
3. Hinton G., Sager D., Upton M., Boggs D., Carmean D., Kyker A., Roussel P. The Microarchitecture of the
Pentium 4 Processor // Intel Technology Journal Q1. 2001. P. 2-11.
4. Intel Pentium 4 and Intel Xeon Processor Optimization, Reference Manual // Intel Corporation. Publ. No.
248966-05. P.c1-c16.
198
ПОРТАЛ СВОИМИ РУКАМИ: ОПЫТ НЕСКОЛЬКИХ ПРОЕКТОВ
А.Г.Абрамов, А.В.Сигалов, И.М.Сторожев
Государственный научно-исследовательский институт информационных
технологий и телекоммуникаций «Информика», филиал в Санкт-Петербурге
Тел.: (812) 331-75-67, e-mail: [email protected], [email protected]
В последнее время во всемирной сети наблюдается массовое появление Web-проектов,
претендующих на статус портала. По сложившейся терминологии Интернет-портал призван
предоставить централизованный доступ к упорядоченной и систематизированной информации по
интересующей тематике, обеспечить эффективную и комфортную работу пользователя с помощью
интуитивно понятного интерфейса. Предполагается наличие удобной с точки зрения организации
процесса информационного наполнения портала системы управления содержанием (контентом).
Сегодня на рынке ИТ-индустрии предлагаются специализированные коммерческие платформы для
построения Интернет-порталов (IBM WebSphere Portal, Oracle9iAS Portal, Plumtree Portal Server, Microsoft
SharePoint Portal Server и пр.), относящиеся к системам высокой степени готовности. Основным
препятствием в процессе адаптации подобных “коробочных” систем к задачам конкретного Web-проекта
является полная или частичная закрытость программного кода. Доработка и пополнение базового
функционала систем на основе предложенных решений в большинстве случаев сопряжено с
необходимостью периодического обращения к консалтинговым службам разработчиков, либо требует
наличия собственного штата высококвалифицированных программистов. Указанные причины, вкупе с
весьма существенной стоимостью базовых лицензий, на сегодняшний день препятствуют широкому
распространению коммерческих платформ, в том числе, и в научно-образовательной среде.
Внешне привлекательными с точки зрения минимизации затрат на разработку собственных проектов
выглядят поддерживаемые коллективами энтузиастов свободно распространяемые портальные системы
с открытым кодом (PHPNuke/PostNuke, Xaraya, Zope и пр.). Вместе с тем, выбравшие в качестве готовых
решений такие системы рискуют столкнуться с рядом специфичных недостатков, среди которых следует
особо отметить общеизвестные проблемы с безопасностью. Недостаточная проработка программной
стратегии, зачастую, разностилевое программирование обеспечивающих функционал системы модулей,
и, как следствие, наличие ошибок в кодах, ограниченность документации значительно увеличивают
время, затрачиваемое программистами на освоение и работу с системой. В итоге, временные затраты и
требуемая квалификация персонала становятся сопоставимыми с ресурсами, необходимыми для
разработки собственных систем. На основе имеющегося опыта реализации проектов, разработка
собственной системы с учетом сильных и слабых сторон имеющихся портальных решений,
представляется полноценной альтернативой последним.
Настоящий доклад представляет подход к реализации портальной системы, при создании которой
преследовалась цель обеспечения относительной простоты разработки и поддержки программного кода
при условии сохранения необходимой функциональности для пользователей.
Общее описание системы
В основу системы положен принцип модульности, предполагающий логическое разбиение структуры
портала на ряд компонентов (подсистем), работа которых обеспечивается путем реализации
функционально законченной программной единицы (модуля, службы) с унифицированным внутренним
строением. Модуль представляют собой практически автономную систему, оперирующую специфичным
для него набором данных и взаимодействующую с внешним окружением посредством определенных
правил. Каждый модуль может предоставлять другим модулям сервис портлетов через специальные
функции, возвращающие HTML-строку с данными контекста портала, за поддержание которых он несет
ответственность (типичный пример – динамически формируемая главная страница портала).
Представляя собой, по сути, слабосвязанную структуру, система дает возможность разработчикам
создавать модули независимо друг от друга, впоследствии легко объединяя их вместе, причем
модификация или добавление новых возможностей никоим образом не затрагивает текущей
функциональности портала.
Традиционно для портальных систем функцию управления модулями берет на себя специальная
координационная среда – “Framework”, которая является единой точкой входа для работы с порталом и
выполняет ряд задач по формированию окружения, необходимого для работы модулей. Взаимосвязь и
обмен данными между модулями осуществляется посредством событий, для приема и обработки
которых также служит Framework. Каждое событие включает в себя обязательный набор переменных и
опционально параметры, специфичные для конкретного модуля. К обязательным переменным
относятся:
 a (action): название модуля, которому адресовано событие (+ возможный суффикс Admin);
 с (client_state): состояние клиента в контексте данного события по отношению к серверу; могут
принимать значения getForm (по умолчанию) и sendForm;
 r (request): название события, передаваемого модулю.
Все действия по обработке событий (пользовательских запросов) производятся внутри модулей
индивидуальным набором методов, реализующих таким образом необходимую функциональность
портала. В связи с этим, на каждый модуль возложено выполнение множества функций от проверки
полномочий пользователя до получения требуемых данных и динамического формирования страниц
портала. Заметим здесь, что разделение событий на “административные” и “пользовательские”
199
производится по значению переменной “action” (например, для новостного модуля эти значения – news и
newsAdmin).
Файловая структура модуля представляет собой единую иерархическую систему с разделением
программного кода и дизайна. При этом программный код модуля подчиняется общей объектноориентированной модели функционирования системы. Внутри модуля происходит разделение на
подзадачи, реализуемые соответствующим набором классов: фрэйм-менеджер визуального
отображения публичных страниц, организация операций с БД, выполнение поисковых запросов и др.
Следует отметить, что рассматриваемый подход не подразумевает привлечения характерных для ряда
портальных платформ искусственных “шаблонных” языков.
Управление правами пользователей
Одним из ключевых элементов любого портального решения является подсистема управления
правами пользователей, которая выполняет задачу обеспечения контролируемого доступа к
информационным ресурсам портала, включая доступ к административным интерфейсам для
манипулирования, управления публикацией данных на портале.
Подсистема управления правами пользователей в рамках рассматриваемого подхода реализована
как один из модулей, по общим правилам построения модулей портала. Подсистема имеет гибкую логику
обработки данных и прозрачную структуру таблиц базы данных. Главными объектами, на которых
построена подсистема, являются, пользователи, группы пользователей, модули и сервисы. Сервис – это
сводное понятие, включающее в себя модуль, роль и группу пользователя. Сервис определяет набор
атрибутов пользователя для модуля, на основе которого впоследствии модуль может строить логику
работы с пользователем. Следует повториться, что каждый модуль сам программно реализует
необходимую функциональность работы с пользователем, основываясь на наборе атрибутов, указанных
в выданном пользователю сервисе.
При управлении контентом на стороне модуля особая роль отводится служебным сведениям,
дополняющим полезную информацию записи в базе данных. Каждая запись имеет специальные
атрибуты (статус, создатель и дата создания записи, пользователь, внесший последнее изменение и
соответствующая дата), которые используются при определении полномочий пользователя
применительно к данной записи. Дополнительно ведется журналирование внесения модификаций, что
позволяет, при необходимости, отследить полный “жизненный путь” записи на портале.
Из вышеизложенного понятно, что административные интерфейсы, реализующие управление
контентом портала, являются составными частями модулей. Вместе с тем, взаимодействие с
подсистемой управления правами пользователей, получение информации о наличии у пользователя
соответствующих полномочий, внесение в записи служебной информации осуществляется стандартным
образом по единым для всего портала правилам. Построенная таким способом подсистема управления
контентом обеспечивает полный набор редакторских функций для оперативной работы с данными без
необходимости привлечения Web-программистов.
Следует заметить, что работа с дизайном портала организуется с помощью специального модуля
(типа Web-менеджера файлов) с возможностью доступа лишь к “ответственному за дизайн” каталогу
конкретного “контентного” модуля в рамках единой системы выдачи прав.
Реализованный функционал системы
Разработка и функционирование системы основаны на использовании следующего свободно
распространяемого программного обеспечения (ПО): традиционный для ОС UNIX Web-сервер Apache,
СУБД PostgreSQL, язык препроцессинга гипертекста PHP.
На сегодняшний день в едином программном стиле реализованы модули “Пользователи”
(управление регистрацией, выдача прав пользователям), “Новости”, “Электронная библиотека” (каталог
полнотекстовых материалов), “Книги” (каталог аннотированных описаний изданий), “Персоналии”
(справочник по персоналиям), “Организации” (справочник по организациям), “Проекты” (информация о
реализуемых проектах в интересующей области), “Интернет-ресурсы” (каталог аннотированных ссылок
на внешние Интернет-ресурсы), “Конференции” (архив материалов конференций, подсистема поддержки
традиционных и виртуальных конференций), “HTML-контент” (отвечает за отображение на портале
статической информации), “Форумы”, “Голосования”, “Списки рассылки”, “Статистика” (получение
статистики обращений к ресурсам портала). Ведется работа над расширением функциональных
возможностей системы путем создания новых модулей.
Поисковые возможности реализуются на уровне модулей с учетом индивидуальной структуры
данных в том или ином конкретном модуле с применением поисковых средств используемой СУБД.
Наряду с этим, в качестве отдельного модуля системы подключен глобальный контекстный поиск по
заданным областям портала с использованием специализированного свободно распространяемого ПО
(пакет Mnogosearch с морфологическими словарями русского языка Ispell).
Внедрение
Настоящая система была, в частности, использована при разработке программной части
информационно-образовательного портала “Гуманитарные науки”, Auditorium.Ru (2001-2002 гг.), портала
“Информационно-коммуникационные технологии в образовании”, http://www.ict.edu.ru (2003-2004 гг.),
ряда корпоративных интранет-систем (2002-2004 гг.), показав себя вполне работоспособной при
распределенной работе над контентом и программными кодами. Следует отметить, что в рамках данной
системы не вызвала затруднений реализация автоматической репликации метаописаний ресурсов на
Федеральный образовательный портал “Российское образование” (http://www.edu.ru).
200
ПОСТРОЕНИЕ ЛОГИЧЕСКОГО ЭЛЕМЕНТА МАРШРУТИЗИРУЮЩЕГО
СЕТЕВОГО УСТРОЙСТВА НА ОСНОВЕ НЕЙРОННОЙ СЕТИ
А.А.Сытник, А.В.Иванов
Саратовский государственный университет им. Н.Г.Чернышевского
Тел.: (8452) 51-55-31, e-mail: [email protected]
В последние несколько лет бурно развивается новая прикладная область математики,
специализирующаяся на искусственных нейронных сетях. Актуальность исследований в этом
направлении подтверждается массой различных применений нейронных сетей. Это автоматизация
процессов распознавания образов, адаптивное управление, прогнозирование, создание экспертных
систем, организация ассоциативной памяти и многие другие приложения.
В данной работе рассматривается вопрос создания управляющего элемента маршрутизирующего
сетевого устройства на базе нейронной сети. Существующие сетевые устройства принимают решения о
маршрутизации пакета на основании непосредственно запомненной таблицы, называемой, как правило,
таблицей маршрутизации, в который для каждого конкретного адреса подсети или хоста существует одна
или несколько записей, указывающая номер порта, с которого пакет следует передать дальше для
наискорейшей доставки получателю. В связи с бурным ростом компьютерных сетей такой подход теряет
эффективность, поскольку из-за большого числа подсетей таблицы маршрутизации становятся
громоздкими не только для синхронизации между соседними устройствами, но и для быстрого поиска по
ним.
Для решения этой проблемы выберем в качестве элемента, принимающего решения о
маршрутизации пакетов, экспертную систему на основе нейронной сети. Поскольку нейронная сеть
обладает ассоциативной памятью, то такой подход позволит существенно сократить время, необходимое
на принятие решения о маршрутизации.
Постановка задачи
Необходимо создать логический элемент маршрутизирующего устройства, способный на основе
некоторой базы данных принимать решение относительно направления пришедшего на вход пакета на
один из выходных портов для достижения цели наискорейшей (наилучшей) доставки пакета адресату. На
вход элемента будет подаваться закодированный каким-либо образом номер (сетевой адрес)
получателя пакета, на выходе же должен сформироваться закодированный каким-либо образом номер
порта, на который следует переслать пакет для его доставки. Кроме того, при подключении устройств к
сети логический элемент будет информироваться специальным сообщением о том, за каким портом
относительно него следует искать новое устройства. Соответственно эта информация будет
использоваться для внесения изменений в базу данных элемента.
Для решения задачи использовалась нейронная сеть в виде однослойного перцептрона, а адрес
получателя и порт назначения представлялся следующим образом:
Для исследования работы полученного логического элемента была разработана программа,
проводящая моделирования методом итераций подключения/отключения в моделируемую сеть
устройств с различными адресами и проверки правильности работы представленного элемента.
Заключение
В ходе моделирования были получены неплохие результаты: на сетях состоящих из нескольких
сотен адресуемых устройств нейронная сеть выбирала правильный маршрут доставки для более 70%
пакетов. При этом, используя всего O(log2N) элементов памяти, в отличие от O(N) для существующих
маршрутизирующих устройств, где N – общее количество адресуемых устройств в сети.
Литература
1. Ф.Уоссермен, Нейрокомпьютерная техника. М.:Мир, 1992.
2. Итоги науки и техники: физические и математические модели нейронных сетей, т.1, М.: ВИНИТИ,
1990.
3. А.М.Богомолов, А.А.Сытник, В.А.Твердохлебов. Автоматные модели и рекурсивный
конструктивизм, Саратов, 1992.
201
Ошибка! Указано неверное имя файла.
ОСОБЕННОСТИ ПОСТРОЕНИЯ ТРЕНАЖНО-МОДЕЛИРУЮЩЕГО
КОМПЛЕКСА ОЦЕНКИ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ ОБУЧАЕМОГО
С.В.Астанин, Э.В.Чепиков
Таганрогский государственный радиотехнический университет
Тел.: (8634) 31-51-18, e-mail: [email protected]
Одной из основных целей создания тренажно-моделирующего комплекса является выявление таких
механизмов человека-оператора, посредством которых возможно управление человеком в случаях его
отклонения от оптимальных режимов работы и жизнедеятельности. Как правило, механизм управления
человеком-оператором связывают с понятием функционального состояния (ФС). Несмотря на обилие
работ в этой области и на признание системного характера ФС, отсутствие системной теории контроля и
управления ФС, затрудняет получение регистрируемых системных показателей человека-оператора,
инвариантных к различным видам деятельности. Для преодоления этих проблем в Таганрогском
государственном радиотехническом университете разрабатывается тренажно-моделирующий комплекс,
предназначенный для экспериментальной проверки теоретических моделей и гипотез, отражающих
системный подход к оценке и управлению ФС обучаемого. Теоретической базой для разработки
комплекса явились работы [1, 2], в которых предложена математическая концепция системного
представления человека как сложной организационной структуры, элементы которой (физиологические,
поведенческие и психологические) взаимодействуют друг с другом в рамках одной организации, цель
которой – сохранение постоянства внутренней среды (гомеостазиса) или определенных значений
ресурса (тонуса). Кроме того, каждый элемент имеет частные интересы, связанные с эффективным
функционированием отдельной подсистемы организма. В зависимости от воздействий внешней среды
каждый элемент может потенциально реализовывать свои интересы с различным качеством, используя
при этом разные значения общего ресурса. Для эффективного функционирования организма в целом,
его элементам необходимо согласовывать свое поведение. Это связано с тем, что «захват» большей
части ресурсов каким-либо элементом может привести к дефициту ресурса для других элементов, что
приводит к болезни или неадекватной реакции (дисбаланс системы) и смерти (разрушение системы).
Данная концепция согласуется с теорией функциональных систем организма человека, разработанной
П.К.Анохиным [3]. Согласно этой теории целостный организм на основе нервных, гуморальных и
информационных механизмов объединяет множество слаженно взаимодействующих функциональных
систем, часто принадлежащих к разным структурным образованиям и обеспечивающих своей
содружественной деятельностью гомеостазис и адаптацию к окружающей среде. Взамен представлений
о человеке как наборе органов, связанных нервной и гуморальной регуляцией, теория функциональных
систем рассматривает организм человека как совокупность множества взаимодействующих
функциональных систем различного уровня организации, каждая из которых, избирательно объединяя
различные органы и ткани, так же, как и потребные предметы окружающей действительности,
обеспечивает достижение полезных для организма приспособительных результатов [4].
Тренажно-моделирующий комплекс строится как человеко-машинная система, в которой человекоператор выполняет управление объектом в среде виртуальной реальности. При этом его деятельность
рассматривается
как
системообразующий
фактор,
объединяющий
поведенческие
и
психофизиологические подсистемы в единую систему, направленную на достижение поставленных
перед оператором результатов. Основная цель экспериментов состоит в определении данных
подсистем, выделении механизмов взаимодействия подсистем и построении концепции управления
человеком-оператором на этой основе.
Деятельность человека-оператора организуется средствами виртуальной реальности, и связана с
управлением техническим объектом в динамически изменяющейся среде. В качестве модели
деятельности используется задача принятия решений, связанная с поиском и уничтожением целей в
условиях ограничения времени. Здесь временной показатель выступает в качестве критерия выполнения
задачи. Кроме того, во внимание принимается цена деятельности, связанная с доходами (затратами) от
реализации принимаемых решений. Цена деятельности может определяться психофизиологическими
изменениями. На первом этапе постановки экспериментов цена деятельности в учет не принимается.
Основной целью первого этапа является выявление индивидуальных стратегий человека-оператора с
последующим управлением им на информационном уровне. Информационное управление состоит в
рекомендациях человеку-оператору по применению и реализации тактических и стратегических
управляющих решений. На этом же этапе формируется база данных информативных параметров
деятельности и поведения человека-оператора.
Второй этап постановки экспериментов связан с психофизиологической оценкой цены деятельности.
Здесь оператор выполняет такую же многошаговую задачу принятия решений, как и на первом этапе.
При этом параллельно с измерением параметров деятельности и поведения снимаются
психофизиологические параметры, которые в дальнейшем обрабатываются для получения
интегральных показателей. При таком съеме параметров важно обеспечить их синхронизацию. Основная
цель данного этапа состоит в определении закономерностей между параметрами деятельности и
психофизиологическими и поведенческими показателями. Эту задачу выполняет модуль индуктивного
вывода, который в процессе обработки базы знаний выделяет интервалы психофизиологических шкал, а
202
также причинно-следственные отношения между психофизиологическими показателями, параметрами
поведения человека-оператора и параметрами деятельности. В случае определения стабильных
причинно-следственных отношений на этом этапе реализуется задача психофизиологического
управления человеком-оператором посредством биобратной связи.
Третий этап заключается во введении в модель поведения психофизиологической цены
деятельности и управлении человеком-оператором на информационном и психофизиологическом
уровнях.
Литература
1. Астанин С.В., Захаревич В.Г. Информационно-советующие комплексы систем гибридного
интеллекта. – Таганрог: Изд. Таганрогского государственного радиотехнического университета, 1997. –
136 с.
2. Астанин С.В. Правдоподобные рассуждения в системах принятия решений. Ч.2. – Таганрог: Изд.
Таганрогского государственного радиотехнического университета, 2000. – 110 с.
3. Анохин П.К. Очерки по физиологии функциональных систем. – М.: Медицина, 1974. – 446 с.
4. Судаков К.В. Теория функциональных систем. Под ред. Нувахова Б.Ш. - М.,1996. – 89 с.
ПОДСИСТЕМА ГЕНЕРАЦИИ ТЕСТОВ МНОГОПОЛЬЗОВАТЕЛЬСКОЙ
СИСТЕМЫ ДЛЯ РАЗРАБОТКИ СЕТЕВЫХ ЭЛЕКТРОННЫХ УЧЕБНИКОВ
В.Д.Автайкин, В.М.Вымятнин
Томский государственный университет
Тел.: (3822) 52-94-94, e-mail: [email protected]
Контроль качества усвоенных знаний является существенным компонентом процесса обучения. В
традиционной, аудиторной, системе он реализуется в аудитории в форме контрольных работ,
коллоквиумов, зачетов и экзаменов. В системах, базирующихся на технологиях дистанционного
обучения, существенная часть контрольных мероприятий возлагается на компьютерные тестирующие
программы.
Подсистема тестирования является весьма важной частью электронного учебника (под этим
термином понимается весь комплекс интерактивных мультимедийных средств, предназначенных для
изучения конкретной дисциплины). Она частично берет на себя ряд функций, в традиционной системе
осуществляемых преподавателем и, в зависимости от педагогической задачи, может реализовывать
различные варианты контроля:
 мягкое самотестирование;
 жесткое самотестирование;
 сертификационное тестирование.
В первом случае обучающийся имеет возможность многократно пытаться ответить на вопрос (пока
не выберет правильный). Во втором для ответа на каждый вопрос теста предоставляется только одна
попытка, однако результат тестирования не являются основанием для выставления оценки. Эти
варианты, как правило, допускают возможность обращения к материалу учебника и реализуются как его
неотъемлемая часть.
Последний вариант предполагает, что результат тестирования учитывается при оценке качества
знаний и может повлечь за собой определенные «оргвыводы». Соответственно, необходимо обеспечить
аутентификацию тестируемого, защиту результатов тестирования от несанкционированной
корректировки, минимизировать влияние «внешних факторов». Таким образом, при создании системы
сертификационного тестирования существенная часть ее программной реализации связана не с
предметным содержанием, а с проблемами защиты информации. По этой причине ее целесообразно
реализовывать в виде отдельного приложения, универсальной оболочки, предметное содержание
которой актуализируется при обращении к соответствующей предметно-ориентированной базе данных.
Программная реализация системы тестирования зависит от того, в каком варианте создается
электронный учебник: в виде локальной версии, распространяемой на CD, или в виде сетевой, доступ к
которой осуществляется с помощью специальной клиентской программы (чаще всего, интернетбраузера). Каждый из вариантов имеет свои достоинства и недостатки. Для работы с локальной версии
не нужно подключение к Интернет, но вся необходимая информация, в том числе и банк вопросов,
должна быть размещена на CD. Кроме того, внесение изменений и добавлений в локальную версию
проблематично. Для работы с сетевой версией необходим телекоммуникационный канал (причем
требования к его пропускной способности тем выше, чем больше используются мультимедиа средства).
Но при этом поддержание курса в актуальном состоянии не представляет проблемы, более того, процесс
работы обучаемого с учебником легко протоколируется.
Одной из проблем, возникающих при создании электронных учебников, является необходимость
обеспечения совместной работы специалиста в предметной области и специалистов в области ИТ.
Многопользовательская среда для разработки сетевых электронных учебников [1], созданная в Томском
государственном университете, в явном виде реализует разделение труда при создании электронных
учебных материалов. Эта среда базируется на технологии клиент-сервер. Серверная часть работает под
203
управлением ОС Linux, реализована на языке PHP, в качестве СУБД используется MySQL. В качестве
клиента используется Web-браузер IE (необходима версия не ниже 5.5). При этом созданный учебник
может функционировать как непосредственно в среде разработки, так и вне ее (это обеспечивается
конвертированием всей необходимой информации из внутреннего кода в HTML).
Подсистема генерации тестов наследует принцип модульности, положенный в основу при
разработке всей системы. Она включает в себя модуль подготовки теста (ориентирован на работу с
преподавателем), модуль визуализации (предназначен для программистов и дизайнеров) и модуль
тестирования (работает с обучаемым).
Первый (авторский) модуль позволяет преподавателю формировать базу тестовых вопросов для
своей предметной области и управлять генерацией тестов (наборов тестовых вопросов). Тестовые
вопросы по отдельным дисциплинам могут быть интегрированы в единую базу – библиотеку вопросов.
Пользователь системы может выбрать необходимые ему вопросы из библиотеки и клонировать их в
свою базу для дальнейшего использования. В состав авторского инструментария входят:
 Редактор вопросов – предназначен для редактирования/удаления вопросов, которые были
клонированы из библиотеки или созданы преподавателем.
 Редактор свойств – позволяет определенной группе вопросов (тесту) задать свойства: название,
тип, доступ и т.д.
 Компоновщик теста – предназначен для распределения вопросов по тестам.
 Компоновщик мультитеста – предназначен для формирования особого вида теста, который
включает в себя несколько тестов.
Инструментальные средства авторского модуля позволяют реализовать основные виды тестовых
заданий (альтернативный, множественный выбор, упорядочение и т.д.).
Второй модуль позволяет дизайнеру и программисту спроектировать пользовательский интерфейс
тестирующей подсистемы. Входящие в него сервисы в существенной степени совпадают с аналогичными
сервисами подсистемы разработки учебника, что позволяют естественным образом обеспечить стилевое
единство оформления электронного учебника и блока тестирования.
Третий модуль обеспечивает тестирование. Работа с электронным курсом в сетевом варианте
предусматривает предварительную регистрацию обучаемого в системе, что позволяет создать базу
данных пользователей и сохранять в ней протоколы работы с курсом и результаты тестирования. Эта
информация, с одной стороны, может быть открыта для преподавателя, сопровождающего обучение по
данной дисциплине, и использована для администрирования учебного процесса, а с другой стороны
использована для настройки системы на пользователя.
Литература
1. Автайкин В.Д., Вымятнин В.М. Многопользовательская система для разработки сетевых
электронных учебников. //Труды X Всероссийской научно-методической конф. «Телематика’2003».
СПб.2003, С.214-215.
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ПРИНЯТИЯ РЕШЕНИЙ НА ОСНОВЕ
ИНСТРУМЕНТАЛЬНОЙ СИСТЕМЫ В РАМКАХ СЕРВИСА НАУЧНОГО
ПОРТАЛА
А.А.Мерцалов
Тульский государственный университет
Тел.: (0872) 35-01-37, e-mail: [email protected]
Одной из актуальных задач, возникающих практически во всех областях деятельности, является
задача принятия решения. Одним из сложных разделов в данном классе задач является принятие
решения в условиях априорной неопределенности. В рамках создаваемого в Тульском областном центре
новых информационных технологий (ТулОЦНИТ) информационного портала поддержки научной
деятельности создан раздел сервисов для решения задач, связанных с принятием решений. Одной из
прикладных программ, доступных зарегистрированному пользователю, является программноинструментальное средство Decision Support Integrated System (DSIS).
Пакет DSIS предназначен для автоматического анализа числовых и текстовых данных с целью
обнаружения в них ранее неизвестных, нетривиальных, практически полезных закономерностей, и
принятия на их основе оптимальных решений в различных областях деятельности.
Главным математическим модулем системы является “Построитель моделей”, основанный на
алгоритме эволюционного синтеза моделей.
DSIS является клиент-серверным приложением. Пользователь работает с клиентской частью пакета
DSIS. Математические модули, реализующие алгоритмы построения модели, принятие решения и
оценки его рациональности, выделены в серверную часть.
Выбор такой архитектуры системы позволяет обеспечивать следующие возможности:
 Гибкое использование любой доступной СУБД.
 Минимизацию трафика между клиентом и сервером.
204
 Использование минимального набора программного обеспечения (ПО) на клиентском компьютере,
установленного изначально на подавляющем большинстве современных компьютеров. Клиенту
не требуется установка дополнительного программного обеспечения.
 Использование стандартных возможностей ПО сервера для обеспечения требуемого уровня
защиты информации.
 Использование стандартных возможностей ПО сервера для обеспечения распределения ресурсов
сервера при обработке большого количества запросов клиента.
 Легкое масштабирование системы от однопользовательского варианта до корпоративной
многосерверной системы.
Серверная часть системы DSIS написана на языках РНР и C. Использование скриптового языка РНР
делает систему мультиплатформенной и позволяет производить гибкую настройку распределения
ресурсов сервера средствами штатного программного обеспечения. Другие компоненты DSIS также
выделены в отдельные динамические библиотеки и доступны из других приложений.
Клиентская часть системы, созданная посредством html, javascript и java, работает под управлением
браузера. Предусмотрена возможность графического представления результатов исследований. На
большинстве современных компьютеров среди стандартного набора программного обеспечения имеется
web-браузер с поддержкой графики (форматы *.gif и *.png), javascript, java и протокола ssl. Этого
достаточно для полнофункционально использования системы DSIS и избавляет пользователя от
необходимости установки дополнительного программного обеспечения.
Исходными данными для системы DSIS могут быть числа, качественные переменные, булевы
переменные и текстовые строки. Исходная информация может быть представлена в виде текстовых
файлов с разделителем, таблиц Microsoft Excel 97/2000, СУБД ORACLE, MySQL, Postgress.
Предусмотрена возможность пакетного анализа данных. Для этого используется скриптовый язык, на
котором программируются все аналитические действия и временная последовательность их
выполнения, а также определяются наборы данных. Скрипт сохраняется в файле и автоматически
запускает исследование в указанный момент времени на определенных данных.
Работа системы DSIS основывается на приближенной лингвистической модели. Построение модели
исследуемой системы производится в полуавтоматическом режиме. Пользователю необходимо
определить и задать вид формируемой модели и указать, какую информацию использовать на каждом
конкретном этапе моделирования. Никакой предварительной обработки исходной информации не
требуется. В процессе моделирования формируется база знаний, на основе которой впоследствии
принимаются решения относительно исследуемой системы. Предусмотрен механизм автоматической
корректировки модели в случае, если она не соответствует исследуемой системе. Соответствие или
несоответствие модели и системы определяется исходя из требуемой точности, задаваемой
пользователем.
Предусмотрена возможность определения рациональности принимаемого решения. Для этого
разработано два алгоритма. Один из них применим для определения рациональности вырабатываемого
системой решения в случае, когда нет накопленного “опыта” работы. Второй использует информацию,
накопленную в процессе работы. Оценка формируемого решения выражается числом, находящемся в
диапазоне от 0 до 1, что априорно показывает вероятность того, что выданное системой решение будет
соответствовать действительности.
Примером использования программного инструментального средства DSIS является создание с ее
применением трехуровневой лингвистической модели для системы медицинской диагностики сердечнососудистых заболеваний в ГУП НИИ Новых медицинских технологий” (г. Тула).
Первый уровень определяет терм выходной лингвистической переменной “Категория заболеваний”
на основе показаний пациента: симптомы, жалобы, внешний осмотр.
Второй уровень определяет вид заболевания – терм выходной лингвистической переменной “Вид
заболевания” на основе результатов лабораторных, инструментальных исследований, а также на основе
оценки предрасположенности заболеваний, прогнозируемых лингвистической моделью состояния
здоровья пациента (МСП).
Третий уровень определяет подвид заболевания в виде терма выходной лингвистической
переменной “Подвид заболевания” на основе лингвистической модели МСП с учетом дополнительных
результатов инструментальных исследований.
Система DSIS построения математических моделей и принятия решения на их основе входит в
состав программного обеспечения портала поддержки научной деятельности http://www.nauka.tula.ru.
Работа выполнена при поддержке гранта РФФИ, проект №04-07-96700-р204Центр_В.
205
ИСПОЛЬЗОВАНИЕ КОРПОРАТИВНЫХ ТЕХНОЛОГИЙ В ЗАДАЧАХ
ПРОГРАММИРОВАНИЯ WEB-ПРИЛОЖЕНИЙ
В.И.Никитин, С.О.Решетников
Тульский государственный университет
Тел.: (0872) 35-01-37, e-mail: [email protected], [email protected]
Современные сетевые инфраструктуры нового поколения для науки и образования должны
основываться на современных технологиях. В частности, по множеству причин целесообразно
проектировать системы дистанционного образования на базе web-приложений. В связи с этим возникает
необходимость быстрой и качественной их разработки. Суть предложенного решения, которое с
математической точки зрения сводится к следующему: все задачи, решаемые при разработке webприложения, образуют некое множество, элементы которого можно разделить на три подмножества:
задачи разработки структуры данных; задачи разработки алгоритмов компонентов пользовательского
приложения; задачи проектировании визуального интерфейса, представленного в виде html-документа.
Над элементами (задачами) каждого из трех подмножеств определены сюръективные функции f1, f2, f3,
областью значений которых будут множество шаблонов страниц для отображения данных на экране
пользователя Zt, множество компонентов пользовательского приложения Za и множество структур
данных Zd соответственно.
При использовании традиционного подхода программирования web-приложений, структуры данных
(элементы множества Zd) определяют структуру шаблонов страниц (элементы множества Zt) и,
соответственно, структуры компонентов (элементы множества Za) приложения. То есть элементы
множества Za и элементы множества Zt зависят от элементов множества Zd, а соответственно,
элементы множеств Za и Zd зависят друг от друга.
Исследования показали, что, зная внутренние отношения между элементами множества Zd, можно
определить их взаимодействие с элементами Za еще на стадии начала разработки алгоритма. Более
того, унифицировав структуру выходных данных приложения, снимается зависимость элементов Zt от
Zd, что позволяет сократить время и трудозатраты на разработку web-приложений за счет исключения из
процесса их проектирования операций, связанных с генерацией html-документов непосредственно в
алгоритме, реализующем логику web-приложений.
На множестве структур данных определены отношения, которые в свою очередь определяются
структурой, представленной в виде дерева. Из множества Zd можно выделить такое подмножество R,
элементы которого своими свойствами будут описывать структуру других элементов из этого же
множества, но уже непосредственно использующихся в реализации задач разработки алгоритмов
компонент пользовательского приложения. Таким образом, методика выделения задач для отдельных
разработчиков при проектировании web-приложений начинается с определения общего множества
задач. Далее из него выделяются в подмножества задачи проектирования структур данных приложения,
задачи разработки компонент приложения и задачи создания пользовательского интерфейса.
Выполняются функции для построения множеств Zd, Za, Zt. Содержательно, задача построения
структур данных Zd решается следующим образом: используя подмножество операторов R, далее
вычисляется значение функции f, аргументами которой являются операторы R и набор некоторых
ограничений (требований), определяемых алгоритмом разрабатываемого web-приложения.
В ходе работы компонентов приложения структуры данных загружаются в оперативную память
сервера и при необходимости, находясь там, могут быть подвержены изменениям, не соответствующим
тем, что были описаны элементами из R. Однако перед дальнейшим сохранением таких структур в базе
данных необходимо восстановить соответствие с R, выполнив соответствующую функцию, физический
смысл которой – проверить структуры данных на соответствие свойствам элементов из множества R и в
случае несоответствия выполнить требуемые модификации.
Операции, определенные на множестве структур данных, разделены на две группы: базовые, т.е.
необходимые для работы с деревом отношений в целом, и специальные (назовем их
пользовательскими), используемые только в рамках алгоритма данного приложения.
Базовыми операциями считаются перемещение по дереву, копирование и удаление отдельных
ветвей дерева, определение дочерних и родительских элементов дерева, разделение дерева на
поддеревья и т.д. Операции, определенные пользователем (специальные), являющиеся задачами из
множества задач разработки алгоритмов компонентов пользовательского приложения, могут
представлять собой как набор базовых операций, так и набор операций, разработанных для конкретного
приложения.
Для обеспечения гибкости управления иерархической системой элементов множества Zd (объектов
приложения) предусматривается механизм связей и наследования. Под связью здесь понимается некий
управляющий элемент, содержащий указание на то, что объект, к которому он принадлежит, имеет
определенную логическую зависимость от объекта, с которым он связан. В отличие от связи,
наследование представляет собой физическую зависимость двух объектов, т.е. один объект является
продолжением, расширением другого.
В процессе установки связей и определении наследования выделяется ряд ограничений:
 операцию наследования можно применить только между элементами или группой элементов
одной ветви дерева отношений;
206
 установить простую связь возможно только между элементами, принадлежащими любым
подмножествам, но не между самими подмножествами.
Путем выделения в отдельное множество Zt шаблоны страниц и построения дерева отношений
между структурами данных Zd определяются связи между элементами множеств Zd и Za. Далее,
определения зависимости между собой задач, определенных на первой стадии алгоритма, строится
граф G их отношений, для чего выполняются кофункции функциям f1, f2, f3.
На основе анализа связных областей графа G выделяются подмножества задач, входящие в эти
области. Задачи каждого подмножества могут выполняться отдельным разработчиком, т.к. для
организации его работы потребуется минимум информации о задачах из другого подмножества. Тем
самым будет обеспечена возможность быстрого и качественного проектирования web-приложений за
счет применения корпоративной технологии.
Работа выполнена при поддержке гранта РФФИ, проект №04-07-96700-р204Центр_В.
АНАЛИЗ КЛАСТЕРНЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ С ПОМОЩЬЮ
ТЕСТА HINT
Т.Д.Гильфанов
Уфимский государственный авиационный технический университет
E-mail: [email protected]
Распространение вычислительных кластеров значительно возросло в последнее время, когда стало
возможным и экономически выгодным строить высокопроизводительные вычислительные системы из
готовых компонентов. Это вычислительные узлы на базе материнских плат персональных машин или
рабочих станций и высокоскоростные коммутационные сети. Также растет важность применения
оценочного тестирования в таких системах. Оценочное тестирование имеет по крайней мере две цели –
обеспечить необходимой информацией пользователя и разработчика вычислительной системы.
Большинство эталонных тестов ориентировано на фиксированную нагрузку вычислительной
системы, т.е. объемы требуемой при тестировании памяти и вычислений в процессе тестирования не
меняются. Поскольку вычислительная техника развивается достаточно быстро, то часто
фиксированность объема нагрузки на ресурсы приводит к короткому времени актуальности теста.
Хорошим подспорьем этим тестам является тест с изменяемой нагрузкой HINT, который позволяет
оценивать производительность вычислительной системы в разных режимах использования памяти
(первичный кэш, вторичный кэш, основная память и т.д.).
Результатом работы теста является функция производительности в единицах QUIPS (Quality
Improvements per Second – качественные усовершенствования в секунду) либо от времени работы теста,
либо от используемой в процессе счета памяти.
В первой части доклада описано выполнение теста HINT для одиночной однопроцессорной
вычислительной системы. Установлено, что форма кривой теста HINT одинакова для любой машины,
независимо от ее производительности. Максимальное значение QUIPS достигается, когда задача
выполняется в первичном кэше. В качестве примера описано выполнение теста HINT в некоторой
гипотетической компьютерной системе с тремя режимами памяти: первичный кэш 16 Кб с неудачей при
промахе 3 цикла, вторичный кэш – 1 Мб и основная память 64 Мб со временем доступа 70 нс.
Рассчитаны время, необходимое для 100000 итераций, и средняя величина QUIPS, которая составила
0,159 MQUIPS.
Во второй части доклада рассмотрено выполнение теста HINT в кластерной вычислительной
системе. Описаны типы распараллеливания задач в кластерных вычислительных системах. Также
описан способ распараллеливания теста HINT в кластерах. Определена формула времени выполнения
теста HINT в кластерах. Время выполнения включает две составляющие: общее время вычислений и
время связи между узлами кластера. Вторая составляющая зависит от коммуникационной среды
кластеров и применяемых протоколов передачи данных.
Для оценки коммуникационной среды кластерных вычислительных систем был рассмотрен
инструментарий NetPIPE (сетевой протокол независимой оценки эффективности), который применяется
для тестирования широкого диапазона сетевых аппаратных средств, включая ATM, FDDI, Myrinet, Gigabit
Ethernet. Приведены графики зависимости пропускной способности различных систем с адаптерами Fast
и Gigabit Ethernet от длины передаваемых сообщений. Использующийся при этом стек протоколов –
TCP/IP.
Пропускная способность увеличивается при увеличении размера передаваемых сообщений и
асимптотически приближается к некоторому пределу. Также выявлено, что при увеличении размера
пакета Gigabit Ethernet с 1500 до 9000 байт, пропускная способность увеличивается с 350 до 814 Мбит/с.
Приведен график пропускной способности при обмене сообщениями системы MPI. Пропускная
способность при использовании этой системы падает почти вдвое.
В третьей части доклада рассмотрено выполнения теста HINT вычислительным кластером POW!er,
данные о котором взяты c сайта http://www.computernerd.com. Кластер состоит из 9 компьютеров: 8
вычислительных узлов и один главный компьютер, объединенных сетью с помощью коммутатора
Fast/Gigabit Ethernet. Работает кластер под управлением системы программирования MPI и ОС Linux Red
Hat 2.2.5-15. Приведены графики производительности при использовании теста HINT для двух
207
конфигураций кластера: 9-процессорной без использования SMP-операций и 18-процессорной с
использованием 2-х процессорных SMP-систем. Задержка получения начальной производительности
кластеров составляет 100 мкс при применении 9 процессоров без использования операций SMP и 124
мкс при применении 18 процессоров с операциями SMP. Выявлено, что применение двухпроцессорных
SMP-вычислительных узлов в кластерной системе не позволяет двукратно увеличить
производительность по сравнению с однопроцессорными узлами. Причиной этому является общая шина
– тот ресурс, который разделяют процессоры, оперативная память и контроллеры ввода-вывода.
Четвертая часть доклада посвящена анализу применения протоколов транспортного уровня в
кластерах. Наиболее распространенным базовым стеком протоколов является TCP/IP. В данном разделе
описываются его недостатки: большая задержка при приеме первого пакета, отсутствие поддержки на
транспортном уровне передачи широковещательных сообщений, которые распространены при
выполнении теста HINT. Указан способ устранения начальной задержки со 100 до 30 мкс – применение
протокола BOBNET, который имеет способность поддерживать полный стек протоколов TCP/IP. Для
уменьшения нагрузки при приеме/передаче широковещательных пакетов возможно применение
транспортного протокола RMTP.
В результате проведенного анализа приходим к выводу, что выполнение теста HINT в кластерных
системах позволяет достаточно объективно определять их производительность и недостатки. При всех
своих достоинствах (дешевизна, масштабируемость), недостатками кластерных систем являются
непредсказуемый характер сетевого трафика и конфликты в сети, высокое время ожидания сообщений.
Поэтому скорость кластеров меньше скорости мультипроцессорной системы при одинаковом количестве
процессоров.
Литература
1. http://hint.byu.edu/summary.html
2. http://www.scl.ameslab.gov/AHINT
3. http://www.scl.ameslab.gov/netpipe/
4. Эйсымонт Л.К. Оценочное тестирование высокопроизводительных систем: цели, методы,
результаты и выводы.
5. http://www.computernerd.com/cluster1.html
6. David M. Halstead, Brett Bode, Dave Turner, Ames Laboratory “Giga-Plant Scalable Cluster”
7. http://www.ctc.msiu.ru/program/t-system/diploma/node20.html
8. Sanjoy Paul Krishan K. Sabnani Bell Laboratories Holmdel, “Reliable Multicast Transport Protocol”
МОДЕЛИРОВАНИЕ ФИЗИЧЕСКИХ ПРОЦЕССОВ НА КЛАСТЕРНЫХ
СИСТЕМАХ УГАТУ
М.Б.Гузаиров, Р.К.Газизов, Р.А.Хисамутдинов
Уфимский государственный авиационный технический университет (УГАТУ)
Тел.: (3472) 23-36-22, e-mail: [email protected]
Создание Башкирского регионального центра высокопроизводительных вычислений (БРЦ ВВ),
оснащенного двумя кластерными системами (на основе 12 серверов на базе процессоров Alpha 21164 и
на основе 32 двухпроцессорных Intel серверов), инициировало внедрение новых вычислительных
технологий в научные исследования, проводимые в УГАТУ и институтах РАН, расположенных в г. Уфе.
При этом, как правило, происходит либо адаптация соответствующего последовательного
программного обеспечения к многопроцессорным системам, либо в основе новых параллельных
программных продуктов лежат готовые пакеты параллельных программ.
Традиционными задачами, решаемыми с использованием ресурсов БРЦ ВВ, являются следующие:
 Математическое моделирование физических процессов в энергетических установках.
Проводятся расчеты процессов газообмена и сгорания-расширения в цилиндрах ДВС, а также
исследование неустановившихся реагирующих турбулентных течений сжимаемого газа. C
использованием кластерных систем выполнено численное моделирование течения газовой смеси
в областях, моделирующих геометрию рабочей камеры двухтактного двигателя в период
газообмена, с целью выявления зависимости качества продувки двухтактных двигателей от
конструктивных особенностей перепускных каналов и окон (УГАТУ).
 Исследование эволюций нелинейных волн в двухфазных средах пузырьковой структуры в
многомерных случаях. Моделируются эволюция импульсных нелинейных возмущений и
процессы образования ударных волн в газожидкостной среде пузырьковой структуры (Институт
механики УНЦ РАН и Башгосуниверситет).
 Динамика распределения давления в нефтяном пласте при наличии дизъюнктивных
нарушений геологической структуры. На основе фактических данных об отборах жидкости и
закачке воды решаются задачи идентификации ряда параметров нефтяных пластов и
восстановления динамики распределения давления в них применительно к месторождениям,
содержащим большое (1000 и более) количество скважин (УГАТУ).
208
 Расчет многомерных неустановившихся неизотермических турбулентных течений
сжимаемой жидкости в областях сложной геометрической конфигурации. Реализован
параллельный алгоритм решения уравнений Навье–Стокса, основанный на полу-неявной по
давлению конечно-разностной аппроксимации; в основе распараллеливания алгоритма положена
идея геометрического параллелизма (УГАТУ и Институт механики УНЦ РАН).
В последний год появилось несколько новых научных направлений, ориентирующих свои методики
вычислений на многопроцессорные технологии. Это:
 разработка методов и алгоритмов расчета полей магнитной анизотропии в неоднородных
мелкозернистых и ультрамелкозернистых (нанокристаллических) материалах с дефектами на
многопроцессорных вычислительных системах (на основе динамических методов (молекулярная
динамика), стохастических методов (Монте-Карло), перколяционного моделирования) (УГАТУ);
 моделирование атомной структуры металлических трикристаллов и нанокристаллов методами
молекулярной динамики (УГАТУ и Башгосуниверситет);
 вычисление многомерных интегралов на многопроцессорных вычислительных комплексах с
использованием кубатурных формул; тестирование соответствующей программы показало
эффективность распараллеливания близкой к единице (Институт математики с ВЦ УНЦ РАН);
 изучение методов управления вычислительными процессами на кластерных системах, связанных с
миграцией процессов, и позволяющих реагировать на изменения среды и регулировать
балансировку загрузки всех узлов кластера (УГАТУ);
 моделирование свойств твердых тел методами молекулярной динамики с использованием
программы ParaDyn для кластерных систем БРЦ ВВ (УГАТУ).
Опыт, накопленный за время работы Центра высокопроизводительных вычислений, показывает, что
работа по внедрению многопроцессорных вычислительных систем в научные исследования не
исчерпывается только адаптацией существующего программного обеспечения к нуждам пользователей,
разработкой инструкций пользователя, справочной документации по кластеру. Одной из важнейших
составляющих деятельности Центра является повышение квалификации специалистов, использующих
высокопроизводительные вычислительные технологии в своих исследованиях.
Поэтому сегодня остается актуальной задача о методической поддержке высокопроизводительных
вычислительных методов для научных исследований, проводимых в УГАТУ и институтах РАН. Несмотря
на все имеющиеся сложности, число исследовательских групп, использующих вычислительные
мощности БРЦ ВВ в своих разработках, с каждым годом увеличивается.
В связи с постоянным ростом необходимости использования новых высокопроизводительных
вычислительных технологий в научных и технических задачах появилась заинтересованность
организаций, занимающихся научными исследованиями, в квалифицированных специалистах. Поэтому
непрерывно растет как потребность организаций в выпускниках вузов, владеющих такими знаниями, так
и потребность специализированных кафедр, ответственных за подготовку инженерных кадров, на чтение
соответствующих учебных дисциплин.
В настоящее время в УГАТУ подготовкой в области высокопроизводительных вычислительных
технологий и систем занимаются сотрудники кафедры высокопроизводительных вычислительных
технологий и систем (ВВТиС). Наряду со штатными сотрудниками кафедры, к преподаванию
привлекаются сотрудники-совместители Института математики с ВЦ УНЦ РАН, Института механики УНЦ
РАН.
В учебном процессе, связанном с подготовкой будущих специалистов в области
высокопроизводительных вычислений по направлению «Прикладная математика», основное внимание
уделяется не методике (технологии) работы с кластерными системами, а корректности применения
высокопроизводительных методов в математическом моделировании. Становится очевидным тот факт,
что высокопроизводительные вычисления являются не самоцелью, а лишь одним из инструментов,
достаточно мощным, для решения широкого класса задач естествознания. Вместе с тем, широта
возможных применений параллельных вычислительных технологий ставит на повестку дня вопрос о
необходимости внедрения соответствующих разделов во многие традиционные дисциплины
специальности: вычислительные методы, базы данных и СУБД, компьютерная графика. Одним из
возможных путей решения таких вопросов является открытие новых специальностей по подготовке
кадров в области высокопроизводительных вычислений.
В настоящее время назрела необходимость перехода от работы в рамках общего компьютерного
«ликбеза» в области высокопроизводительных вычислительных технологий для специалистов различных
профилей к специализированному обучению в этой области с введением новых специальностей и
специализаций. Предлагаемое открытие новых специальностей является насущной необходимостью для
дальнейшего развития высокотехнологичного компьютерного образования не только в УГАТУ, но и в
других вузах России.
209
ИНТЕРНЕТ КОНТРОЛЬ СЕРВЕР: НАЗНАЧЕНИЕ, ПРИНЦИПЫ РАБОТЫ,
АРХИТЕКТУРА
И.В.Алексеев
Ярославский государственный университет
Тел.: (0852) 79-77-31, e-mail: [email protected]
Интегрированное решение «Интернет контроль сервер» стало результатом более чем годового
сотрудничества коллектива компании А-реал Консалтинг (http://www.a-real.ru/) и сотрудников
Ярославского государственного университета (http://www.uniyar.ac.ru/). Интернет контроль сервер
рассчитан на применение в сетях среднего размера, имеющих выделенное Интернет-подключение и
сочетает в себе мощные средства учета трафика, управления доступом пользователей и защиты сети с
простотой настройки, управления и поддержки.
Для чего нужен Интернет контроль сервер
Чем крупнее организация, тем сложнее заблаговременно оценить требуемую ширину канала,
ежемесячный объем потребления, потребности в защите информации и отчетности по потреблению.
Потом, как правило, либо постепенно, либо сразу (если возникают проблемы с безопасностью и/или
перерасходом трафика), руководство организации приходит к необходимости планирования и контроля
за Интернет-подключением.
Интернет является мощнейшим инструментом современности, и как очень мощный инструмент, в
любой организации требует тщательного контроля. Только тогда он будет использоваться по
назначению, и приносить пользу, а не вред. Предотвратить возникновение проблемы всегда проще, чем
потом долго и трудно с ней бороться.
Требования к системе управления Интернет-подключением
Чтобы эффективно бороться с вышеописанными рисками, необходима система, выполняющая три
важнейшие функции:
 Управление доступом в Интернет. Для того чтобы вы смогли указать кто из сотрудников, когда и
куда может иметь доступ. Это сократит непроизводительные потери рабочего времени и повысит
безопасность.
 Учет потребления Интернет-ресурсов. Если сотрудники организации будут знать, что за
израсходованный трафик нужно отчитываться, то это уменьшит трафик и предотвратит нецелевое
расходование средств компании.
 Защита сети от утечки информации, атак хакеров, сетевых вирусов и червей. Этот компонент
необходим для обеспечения информационной и экономической безопасности бизнеса.
Функции Интернет контроль сервера
Интернет Контроль Сервер – это аппаратно-программный комплекс, сочетающий в себе функции
маршрутизатора, межсетевого экрана и системы учета и контроля трафика. А-реал интернет контроль
сервер, включенный между локальной сетью и сетью Интернет, решает все задачи, связанные с
обеспечением работы сети и выхода в Интернет, а именно:
 Полный учет потребленной из Интернет информации. По каждому пользователю или отделу,
по источнику информации и времени доступа к ней. Можно проводить внутреннюю тарификацию
пользователей, отделов и даже сторонних организаций, предоставляя им доступ в Интернет. По
каждому источнику трафика и по каждому пользователю можно выставить индивидуальный
тариф.
 Управление индивидуальными правами доступа пользователей. Сервер позволяет задавать
общие для всех, групповые и индивидуальные для конкретных пользователей правила доступа к
сети Интернет, повышая эффективность работы персонала и блокируя доступ к нежелательной
информации, делегировать управление группами пользователей администраторам отделов.
 Защита вашей сети. Межсетевой экран, встроенный в А-реал интернет контроль сервер,
обеспечит надежную защиту сети от наиболее распространенных угроз безопасности в сети
Интернет, а также сможет изолировать друг от друга сети отделов или клиентов.
Принципы работы
Интернет Контроль Сервер представляет собой маршрутизатор, устанавливаемый между
корпоративной сетью клиента и Интернет-каналом провайдера. Физически А-реал интернет контроль
сервер – это не требующий обслуживания компьютер (только системный блок), который располагается
вместе с другим активным сетевым оборудованием клиента. На внешнем интерфейсе должен быть
установлен (маршрутизируемый) адрес, выданный провайдером, на внутреннем интерфейсе
устанавливается немаршрутизируемый и/или маршрутизируемый адрес из блока выданного
провайдером.
Весь сетевой трафик контролируется как на внешнем, так и на внутреннем интерфейсе системы.
Запросы, сформированные пользователями сети, перехватываются интернет контроль сервером и
обрабатываются в соответствии с установленными правилами доступа для каждого сотрудника, отдела
и/или для компании в целом.
210
Статистика по использованию ресурсов Интернет снимается с прокси-сервера, встроенного в
интернет контроль сервер, а также на основании перехвата IP-пакетов на внешнем и внутреннем
интерфейсах интернет контроль сервера.
Кроме маршрутизации трафика интернет контроль сервер выполняет также большое количество
других функций, суть которых сводится к тому, чтобы обеспечить полное решение потребностей
компании в сервисах, связанных с эксплуатацией сети Интернет.
Межсетевой
экран,
встроенный
в
интернет
контроль
сервер,
блокирует
попытки
несанкционированного доступа через Интернет подключение извне, в частности: активность сетевых
вирусов и червей, хакерскую активность, и т.д.
Все функции А-реал интернет контроль сервера управляются из единого WWW-интерфейса
пользователя, который построен так, чтобы не вызвать затруднений даже у начинающего пользователя.
Архитектура системы
Интернет контроль сервер реализован на базе стандартных компьютерных компонентов.
Операционная система FreeBSD, которая была доработана для удаления из нее ненужных в работе и
небезопасных компонентов. Методов перехвата трафика используется несколько: через библиотеку
PCAP и через перенаправление потоков средствами IPFW. Трафик перехватывается и анализируется
как на внешних (смотрящих в сторону провайдера), так и на внутренних (обращенных к локальной сети)
интерфейсах. Дополнительный уровень детализации получается путем анализа файлов-отчетов проксисервера. Информация, снимаемая с сетевых интерфейсов, после предварительной обработки поступает
в СУБД, откуда в виде отчетов просматривается пользователями. Таким образом, строится точная,
хорошо сбалансированная и надежная система.
Интернет контроль сервер даст вам возможность сосредоточиться на своей основной деятельности,
выполняя работу по учету ресурсов и контролю соединения в автоматическом режиме.
Дополнительную информацию вы сможете найти в Интернет, и в частности на сайте компании Ареал Консалтинг: http://www.a-real.ru/icontrol.html, http://xserver.a-real.ru.
Статья подготовлена по материалам деятельности Центра Интернет Ярославского госуниверситета
при поддержке грантами РФФИ № 02-07-90062, РФФИ № 03-07-90185 и № 04-07-90114.
СИСТЕМА РАСПРЕДЕЛЕННЫХ ВЫЧИСЛЕНИЙ GLOBUS С ПОДДЕРЖКОЙ
ПРОТОКОЛА IPv6
М.Н.Захарова, А.И.Русаков, И.В.Алексеев
Ярославский государственный университет им. П.Г.Демидова
Тел.: (0852) 79-77-30, e-mail: [email protected]
На протяжении нескольких последних лет Grid технология обеспечивает совместное использование
компьютерных ресурсов в распределенных сетях. На текущий момент проект Globus является одним из
наиболее продвинутых академических проектов в области технологии Grid. Его программная часть
Globus Toolkit является основой Grid систем. Актуальной проблемой является объединение технологии
Grid и IP следующего поколения – IPv6. Лидирующие позиции в процессе внедрения IPv6 в Globus Toolkit
версии 3(GT3) занимает University College London (UCL) на базе проекта 6net и University of Southampton
(UoS) в сотрудничестве с командой развития Globus в Аргонне.
Globus Toolkit разработан под Интернет протокол версии 4, который используется уже на протяжении
двадцати лет. IP следующего поколения, IPv6, как ожидают, постепенно заменит IPv4. Перенесение
Globus на новый протокол принесет значительные преимущества в Grid технологии: значительно
увеличенное адресное пространство потенциально расширяет масштаб Grid системы; поддержка
мобильности позволит расширить совместные эксперименты на базе Grid сетей; механизмы
автоконфигурации упростят управление распределенными Grid сетями. Кроме того, множество новых
технологий будет развернуто на основе IPv6 в ближайшем будущем.
Внедрение протокола IPv6 в Globus Toolkit версии 2 было начато UCL и UoS в середине 2002 г. и к
концу года достигло состояния рабочей системы. Однако в январе 2003 вышла новая версия программы
GT3. GT3 настолько отличалась от GT2, что UCL совместно с командой разработчиков из Аргонны решил
закончить работу над GT2 немедленно, даже без полностью рабочей системы, и сконцентрировать силы
на GT3.
Основные компоненты системы Globus
Безопасность. Механизмы безопасности системы обеспечиваются службой Grid Security
Infrastructure (GSI) посредством сервисов авторизации и аутентификации. Generic Security Service API
(GSSAPI) – стандарт IETF для систем безопасности, GSAPI – IP независимая, как часть GSSAPI.
Управление ресурсами. Первым краеугольным камнем системы является система управления Grid
ресурсами, она включает в себя пакеты Globus Resource Allocation Manager (GRAM) and Globus Access to
Secondary Storage (GASS). GRAM использует Uniform Resource Identifiers (URIs) для определения
местонахождения удаленных рабочих серверов. Программа обращается к функциям низшего уровня для
получения URIs и построения сети соединений. IPv6 адрес поддерживается в URIs на основе RFC 2732.
211
Информационные сервисы. Вторая важная часть Globus Toolkit – информационные сервисы,
которые предоставляют информацию о Grid ресурсах посредством утилит GT3 Index Services. Grid Index
Information Service (GIIS), как верхний уровень GRID Services основывается на его IP поддержке.
Управление данными. Третье основное направление системы – доступ и управление данными
распределенной сети, которое включает в себя средства передачи файлов между доступными системе
Grid устройствами: GridFTP и Reliable File Transfer (RFT). Для обеспечения IPv6 поддержки команды FTP:
PORT и PASV заменены EPRT и EPSV.
Программы, необходимые для системы Globus
Java Development Kit (JDK). JDK версии 1.4 и выше обеспечивает поддержку Интернет протокола
версии 6. Java SDK 1.4 и выше работают как с IPv4, так и IPv6 адресами.
Jakarta Ant. Apache Ant – средство разработки на основе Java, является необязательным,
необходимо для проведения разработок. Это средство разработки более высокого уровня, потому
отсутствует зависимость от протокола.
Java DataBase Connectivity (JDBC) database. JDBC – база данных, которая используется для
работы Reliable Transfer Service (RFT) and Master Managed Job Factory Service (MMJFS). На сегодняшний
момент рекомендуется использование Postgresql 7.3 с установкой дополнительных IPv6-программных
изменений.
Apache Axis SOAP (distributed with GT3). Apache Axis – реализация SOAP ("Simple Object Access
Protocol").
IBM WSDL4J (distributed with GT3). Web Services Description Language для Java Toolkit (WSDL4J)
позволяет создавать, отображать и управлять WSDL документами.
Globus Java CoG Kit (distributed with GT3). Java (Commodity Grid) CoG Kit [Jcog] обеспечивает
доступ к GRID сервисам посредством Java структуры.
Public-key Infrastructure (PKI). Public-key Infrastructure (PKI) совмещает программное обеспечение,
технологии шифрования и средства обеспечения безопасности Интернет-соединений. PKI разработки
University of Murcia’s поддерживает IPv6.
Xindice (distributed with GT 3.0). Как встроенная база данных Apache Xindice не предполагает
TCP/IP соединений. Программа IP независима.
Экспериментальная среда и тестирование
На базе Ярославского государственного университета за последние несколько лет создан фрагмент
распределенной вычислительной сети, охватывающий все учебные корпуса университета, а именно,
физического факультета, математического, факультета вычислительной техники и информатики,
биологического, экономического, а также Ярославский технический университет, институты РАН и другие
академические и научные учреждения региона.
Вместе с тем будет обеспечена возможность эффективного удаленного доступа для научных
учреждений Ярославской региональной сети к высокопроизводительным вычислительным ресурсам
суперкомпьютерных центров системы науки и образования России, подключенных к магистральной сети
высокопроизводительных ресурсов.
Группой исследователей направления распределенных вычислений Ярославского государственного
университета был создан и апробирован фрагмент сети на базе протокола IPv6 и программы Globus. Для
создания экспериментальной среды и тестирования системы Globus использовались серверы на базе
Alpha процессоров Alpha21264 и операционная система TRU64 Unix 5.1А. Основные этапы работы
включали в себя:
 Обеспечение поддержки IPv6 операционной системой;
 Построение IPv6 сети;
 Установка и настройка сопутствующих пакетов программных средств: Java SDK 1.5, JDK 1.5,
PostgreSQL (JDBC), TOMCAT4;
 Настройка IPv6 конфигурации GT3;
 Проведение тестовых IPv6 расчетов.
Работа проведена с целью анализа проблематики внедрения протокола нового поколения в системы
распределенных ресурсов, являющейся в настоящее время одной из главных направлений развития
возможностей глобализации вычислительной среды.
Созданный региональный центр информационных ресурсов науки и образования и в дальнейшем
планирует способствовать высокоэффективному использованию суперкомпьютерных ресурсов в
важнейших фундаментальных и прикладных направлениях науки и техники, успешно развивающихся в
Ярославском государственном университете и других научно-образовательных организациях региона.
Статья подготовлена по материалам деятельности Центра Интернет Ярославского госуниверситета
при поддержке грантами РФФИ № 02-07-90062, № 03-07-90185 и № 04-07-90114.
212
КОДИРОВАНИЕ, ОПИСАНИЕ, ОБСЛУЖИВАНИЕ КОНТЕНТА В ФОРМАТЕ
SMIL
В.А.Капранов, С.А.Горохов
Ярославский государственный университет им. П.Г.Демидова
Тел.: (0852) 79-77-23, e-mail: [email protected]
Вопросы кодирования и размещения статичного, основанного на HTML, академического контента,
включающего и мультимедиа элементы, но являющегося по сути "электронной книгой", отработаны и
изучены. Существенными элементами, теряемыми при таком способе представления материала,
являются живой авторский способ изложения (как отражение видения и понимания) предмета, часто
самоценный и необходимый для передачи не только профессиональной информации, способов
оформления и представления материала, но и этикета и стиля профессионального общения,
необходимого для интеграции специалиста в профессиональную среду. Технически задача фиксации
"информационного поля" живого изложения является проблемой записи и воспроизведения (синтеза в
приложении просмотра) потоков данных, сопровождающих лекцию, – видео и звука (изображение и голос
лектора), графического ряда (элементы презентаций), анимационного ряда (выписываемые
формулы/пояснения, графики, иллюстрации), текста. Ассоциированной является проблема описания,
размещения (в Интернет/Интранет, на CD/DVD носителях), сопровождения, эффективного обслуживания
запросов на такого рода контент из глобальной сети. Также возникает задача кодирования
(архивирования) такого рода контента "живьем", когда все элементы присутствия на лекции эффективно
(с учетом доступного качества связи) передаются удаленному участнику, с возможностью передать свое
мнение, участвовать в опросе, и т.д.
В УЦИ ЯрГУ отработаны все технические элементы перечисленных задач. В качестве базовой
выбраны технологии описания синхронного поведения потоков данных, фиксированных в стандарте W3C
SMIL 2, и кодирования и размещения контента от RealNetworks (HelixCommunity). Контент кодируется как
SMIL 2 медиа презентация, в которой объединены изохронные потоки – видео/звук (в масштабируемом
по полосе пропускания формате), графика, текст; в эти потоки данных внедряются URL-ссылки (вообще
говоря, динамические во времени). Через программу RealPlayer происходит просмотр материала, причем
в случае работы через Сеть происходит настройка связки "клиент-сервер" на оптимальное качество
воспроизведения (отработаны также механизмы адаптации контента под априорные условия просмотра
клиента, фиксируемые в его описании). Для данного решения характерны мультиплатформенность,
защита контента (главным образом в случае работы с ним через Сеть).
Реализация QoS/QoE требует, помимо возможностей нижележащей IP-сети, применения
избыточного кодирования (FEC и масштабируемое по полосе кодирование), перекодирование "на лету".
Расширение клиент-серверной модели на глобальную сеть производится введением дополнительных
серверных агентов (медиа-прокси и медиа серверов), связанных пиринговыми отношениями на
прикладном уровне, т.е. с созданием контент-сети, надстроенной над нижележащими уровнями,
являющейся средой для транспорта и временного хранения (кэширования) медиа-контента. Задача
обеспечения ее масштабируемости, качества услуг, уменьшения накладных расходов, экономии полосы
определяет стратегию размещения серверных агентов, механизмы связности между ними, избыточность
маршрутов. Т.е. в любом месте такой сети может быть инжектирован медиа поток (группа потоков), и он
будет оптимальным образом доставлен клиентам наряду с хранимыми (доступными в режиме "по
запросу") потоками.
В отличие от предлагаемых в последнее время дорогих решений данные технологии являются
компонентными, более управляемыми, контролируемыми и, таким образом, более "простыми" в
сопровождении, в том числе обновлении контента в течение его жизненного цикла.
Таким образом реализованы учебные курсы по политологии, медицине, архитектуре (академический
рисунок), теоретической физике. Традиционными являются живые трансляции конференций, одна из
последних, по гастроэнтерологии, собрала географию из 26 городов России и зарубежья
(http://medialab.uniyar.ac.ru).
Работа выполнялась при поддержке гранта РФФИ № 04-07-90114-в "Создание экспериментального
фрагмента сети доставки контента регионального уровня".
ИССЛЕДОВАНИЕ ЗАВИСИМОСТИ ОТКАЗОВ В ОБСЛУЖИВАНИИ И
СЛОЖНОСТИ WWW-ТРАФИКА НА ПРИМЕРЕ ОБРАЗОВАТЕЛЬНОГО
УЧРЕЖДЕНИЯ
И.А.Морошкин
Государственное учреждение Ярославской Области Центр телекоммуникаций и
информационных систем в образовании, Ярославль
Тел./факс: (0852) 32-88-91, e-mail: [email protected]
Одной из причин, по которым исследования трафика привлекают столь пристальное внимание,
являются попытки выявить определенные закономерности, которые позволили бы спроектировать
213
часы
Mbite
Рис. 1.
Ãðàôèêèê
Î áù àÿ ï ðîî äî
î ñòüñ ðàáî
òû 2003
â êëàññàõ
Ãðàô
2.1.Ñòàòèñòèêà
áùëæèòåëüí
åãî òðàô èêà
àï ðåëÿ
ã.
Основн
Öåí
òðà
Èí
òåðí
åò
трафик
ï î ô åâðàëü 2004 ã.
ые
общее время работы
группы
пользов
ателей
35000
8000 иновые, либо модернизировать существующие протоколы и системы обмена информацией для более
основн эффективной работы сети.
ые30000
7000
Центр телекоммуникаций и информационных систем в образовании был создан в 1995 г., как
сервис
воплощение идей внедрения современных компьютерных и телекоммуникационных технологии в
ы 25000
6000
образовании. Основными функциями Центра являются: поддержание функционирования областной
сети, включающей более 120 организаций, создание информационных
20000
5000 образовательной
образовательных ресурсов, поддержание областного образовательного сервера (http://www.edu.yar.ru),
15000
4000 дистанционное образование посредством телекоммуникаций. Исследование www трафика данной сети
явилось основой для данной работы.
10000
3000
Как известно, трафик в компьютерных сетях довольно "хорошо" описывается случайными
величинами с распределением с тяжелым хвостом, что обусловлено свойством "накопления ошибки",
5000 когда рост объемов трафика и задержек обработки запросов достигает критического уровня и происходит
2000
"крушение" системы. В связи с этим возникла гипотеза о наличии зависимости числа отказов в
10000 обслуживании запросов и сложности трафика. На протяжении годового периода времени был
апр
май
июн
июл
авг
сен
окт Фиксировались
ноя
дек http-запросы,
янв
фев
исследован
WWW-трафик
пользователей
данной
сети.
длительность их
0
обслуживания и отказы в обслуживании. В качестве критерия сложности трафика была использована
апр
май оценка
июн энтропии
июл
сен год
окт
ноя
дек случайных
янв
фев
2003-2004
статистическая
и авг
размерностей
последовательности
величин
(Тимофеев
Е.А., ЯрГУ, "Статистическая оценка энтропии и размерностей", Ярославль, 2001). Случайной величиной
была взята длительность обслуживания
http-запроса.
Результатом исследований стало выявление
2003-2004
год
зависимости увеличения числа отказов с ростом сложности трафика. Установленная зависимость также
демонстрировала оправданную реакцию на изменение ширины внешнего канала связи исследуемой
сети.
Таким образом, подтверждается, что нерегулярность запросов и длительность обслуживания
явились главными факторами отрицательного результата обслуживания запроса. Данный результат
возможно учесть при проектировании информационных систем, например WWW-сайтов. В настоящее
время очень популярна идея разделения содержания и представления, однако это требует ощутимых
затрат времени на генерацию финального документа синтезированного из двух наборов информации:
содержания и формы представления. Для решения проблемы длительности обслуживания запроса была
разработана технология условно названная "виртуальным динамизмом контента". Суть технологии
состоит в том, что вместо генерации представления данных по запросу была применена генерация
представления данных по изменению. Такая концепция применима при числе изменений не более
одного в секунду (достаточная оценка), для каждого представления, иначе система делается
неэффективной по сравнению с традиционной, из-за необходимости поддерживать синхронизации
перекрестных связей. Также побочным плюсом системы оказалась отсутствие проблем доступа к данным
поисковыми роботами в процессе индексирования, так как представления информации существуют, как
условно-статический документ, изменяемый системой при изменении исходных данных.
Предложенная концепция построения информационной системы учитывает особенности трафика, а
именно исследованную зависимость, что позволяет нам обеспечить качественный и эффективный
доступ, оптимизированный для низкоскоростных соединений, при обеспечение целостности, точности и
актуальности данных.
214
Скачать