Загрузить архив - Проблемы информатики и моделирования

реклама
УДК 615.47
О.Г. АВРУНИН, канд. техн. наук (г. Харьков)
ОПЫТ РАЗРАБОТКИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ
ВИЗУАЛИЗАЦИИ ТОМОГРАФИЧЕСКИХ ДАННЫХ
У роботі розлядаються принципи розробки програмного забезпечення для відображення
интроскопічних даних. Висвітлюються основні питання вторинної обробки томографічних
зображень, а також створення об'ємних реконструкцій внутрімозкових структур. Виконується
обґрунтування основних медико-технічних вимог щодо сучасного програмного забезпечення для
візуалізації даних томографічних досліджень.
The work is devoted to design of visualisation software for medical visualisation. The root principles of
design, main issues of imaging processing and structure of actual tomography visualisation software are
described. Main medical-technical requirements for tomography visualisation software are justified.
Актуальность темы. Одним из главных направлений современной
радиологии является совершенствование компьютерных технологий для
повышения эффективности интроскопических исследований [1, 2]. При этом
переход на качественно новый уровень диагностики возможен путем
уменьшения лучевой нагрузки на пациента, повышения информативности и
снижения общей стоимости обследования. В настоящее время все большая
роль
в
диагностике
патологий
внутренних
органов
отводится
томографическим методам исследования: рентгеновской компьютерной (РКТ)
и магнито-резонгансной (МРТ) томографии, позволяющим реконструировать
объемные структуры по множеству параллельных сечений.
Диагностические данные, полученные в результате томографического
обследования пациента, являются наиболее значимыми для выбора тактики
лечения особенно при патологиях головного мозга [2 – 4]. При этом на первый
план выступает процесс зрительного восприятия интроскопической картины,
полученной в результате работы специализированных вычислительных
процедур. Поэтому актуальной является задача разработки методов,
алгоритмов и соответствующего программного обеспечения, позволяющего с
высокой достоверностью визуализировать реконструированные анатомические
структуры, а также выполнять обработку данных для получения необходимой
диагностической информации.
Постановка задачи. Проведенный анализ доступных программных
продуктов ведущих фирм производителей томографической техники показал,
что большинство программных средств не позволяют обеспечить работу с
объемным представлением анатомических объектов, а также объединять в
себе функции двумерной и трехмерной визуализации с соответствующими
возможностями автоматизированной и/или интерактивной постобработки
первичных интроскопических данных. Поэтому в предлагаемой работе, на
3
основании опыта разработки нескольких программных продуктов для
медицинской визуализации [5], проводится обоснование медико-технических
требований к программному обеспечению для отображения томографических
данных, рассматриваются принципы разработки и основные характеристики,
которыми должны обладать соответствующие программные средства.
Этапы разработки программного обеспечения для визуализации
томографических данных. Процесс разработки программного продукта для
отображения интроскопических данных можно разделить на несколько этапов:
– этап
концептуального
проектирования,
во
время
которого
формулируются медико-технические требования к разрабатываемому
продукту, проводится предварительная оценка стратегии обработки данных и
основных возможностей программы;
– этап методологической разработки, на котором проводится
обоснование и выбор методов и алгоритмов для реализации конкретных
функций разрабатываемого программного обеспечения;
– этап практической реализации, при завершении которого создаются
законченные программные модули и β-версия программного продукта;
– этап тестирования и отладки программного обеспечения, во время
которого устраняются все выявленные недоработки и создается законченная
α-версия программного продукта с комплектом соответствующей
документации.
Дальнейшее совершенствование программного продукта проводится с
учетом его использования в медицинской практике.
Основные медико-технических требования, предъявляемые к
программному обеспечению для визуализации томографических данных.
Структурную организацию программных продуктов данного типа можно
представить в виде 3-х основных функциональных модулей (см. рис. 1):
– интерфейсного
модуля,
обеспечивающего
взаимодействие
с
пользователем, медицинскими базами данных, а также реализующего
коммуникационные возможности телемедицинских функций [6];
– модуля обработки данных, выполняющего вторичную обработку
исходных томографических данных, включающую различные виды коррекции
и сегментации изображений томографических срезов, формирование структур
для последующей визуализации, проведение измерительных процедур;
– модуля визуализации, выполняющего непосредственное отображение
структур, сформированных в блоке обработки данных, с максимально
возможным приближением к реальности.
Рассмотрим подробно медико-технические требования, предъявляемые к
вышеуказанным модулям.
Интерфейсный модуль должен реализовывать принципы работы с
пользователем (специалистом-радиологом) в интерактивном режиме с
максимальным удобством и отсутствием неиспользуемых в контексте
4
выполняемой задачи интерфейсных элементов. Загромождение главной формы
различными интерфейсными элементами и наличие большого числа
немодальных окон, как правило, приводит к снижению эффективности работы
интерфейса.
Интерфейсный модуль
Блок взаимодействия с
медицинскими базами
данных
Блок реализации
интерфейса
пользователя
Набор
вспомогательных
утилит
Модуль обработки данных
Блок 2D обработки
Блок 3D обработки
Модуль визуализации
Блок 2D визуализации
Блок 3D визуализации
Рис. 1. Обобщенная структурная схема программного
обеспечения для визуализации томографических данных
Пример организации интерфейса пользователя разработанной автором
программы 3D VIEW приводится на рис. 2. Главное рабочее окно программы
поделено на 3 области: в главном меню происходит выбор основных режимов
работы и базовых функций программы; в левой части окна (в зависимости от
режима работы и типа исходных данных) в 4-х окнах просмотра выполняется
двухмерное (2D) отображение томографических срезов и мультипланарных
реконструкций, а также построение трехмерных (3D) изображений с
возможностями динамического изменения размеров окон, центрирования и
панорамного просмотра, геометрического преобразования изображений; в
правой части окна располагаются наборы контекстных (адаптивно
изменяющихся в зависимости от выбранного режима) управляющих
интерфейсных элементов. Дополнительными функциями данного модуля
являются поддержка протоколов взаимодействия с медицинскими базами
данных (локальными и удаленными), телемедицинских функций и работа со
5
специализированными медицинскими (DICOM) и стандартными (BMP, TIFF и
др.) форматами графических файлов.
Рис. 2. Расположение основных интерфейсных
элементов в рабочем окне программы 3D VIEW
В модуле обработки данных реализуются методы двухмерных (2D) и
трехмерных (3D) преобразований исходных томографических изображений,
содержащих полутоновую информацию об интенсивности отдельных
пикселей. Двухмерная обработка предусматривает работу с изображениями
отдельных томографических срезов и включает в себя различные виды
яркостно-контрастной коррекции, методы линейной и нелинейной фильтрации
изображений, настраиваемых в соответствии с пользовательскими
установками. Обработка данных, помимо улучшения визуального восприятия
изображений, должна обеспечивать возможность проведения процедуры
сегментации – выделения на изображении областей, принадлежащих
структурам, обладающим общими свойствами, в качестве которых для
томографических изображений выбираются: интенсивность, конфигурация,
размеры и локализация.
Сегментация выполняется в соответствие с выражением [1]:
6
b( x, y )  c( x, y );

c( x, y )  α i при ( x, y )  Di , i  1, 2, ..., n,
(1)
где b( x, y ) и c( x, y) – исходное и сегментированное изображения; α i –
идентификатор плоской области
Di ; n – количество областей.
Результирующее изображение c( x, y) согласно выражению (1) будет
представлять собой конечное множество поименованных однородных
областей, пригодных для дальнейшего анализа. Также к методам
2D-обработки можно отнести процедуры измерения геометрических
характеристик (расстояний, угловых величин) и показателей плотности в
указываемых областях интереса.
В блоке 3D-обработки выполняется реконструкция трехмерных данных
методами представления поверхностей или объема. В первом случае
построение поверхностей выполняется путем лофтинга контурных сечений
объектов, полученных в результате 2D-сегментации. Для работы с объемными
данными используются различные по информационному содержанию
воксельные модели (voxel – volume element), представляющие собой
отображение пространства в виде трехмерного растра [8]. Так как
томографические изображения содержат полутоновую информацию об
интенсивности отдельных пикселей (а также известна толщина среза), то
первичной моделью представления объемных данных является полутоновая
воксельная модель, содержащая информацию об интенсивности в каждом
элементе объема. Следующим этапом является построение сегментированного
объемного представления, содержащего информацию о принадлежности
элементов объема конкретному объекту, оно называется обобщенной
воксельной моделью:
v( x, y, z )  u ( x, y, z );
(2)

u ( x, y, z )  λ i при ( x, y, z )  U i , i  1, 2, ..., n,
где v( x, y, z ) и u( x, y, z ) – исходное и сегментированное изображения;  i –
идентификатор пространственной области U i . Частным случаем обобщенной
воксельной модели (2) является бинарная воксельная модель w( x, y, z ) , которая
необходима, например, при визуализации костных повреждений:
v( x, y, z )  w( x, y, z );



1; при ( x, y, z )  U i ;
w( x, y, z )  0; при ( x, y, z )  U .

i


В модуле визуализации выполняется отображение исходных и
результирующих данных, а также реализуется возможность интерактивной
коррекции, полученных на предыдущих этапах моделей. К двумерным
7
методам визуализации относится алгоритм создания мультипланарных
реконструкций (MPR), позволяющий выполнять формирование сечений
исследуемого объекта произвольной плоскостью, задаваемой пользователем.
Трехмерное отображение томографических данных выполняется согласно
алгоритмам реалистичной поверхностной (SSD) и объемной (VR)
визуализации с возможностью вывода только выделенных структур,
объединения нескольких объектов в одной полупрозрачной модели,
формирования частичного разреза. С помощью соответствующих аффинных
преобразований реализуются функции масштабирования, смещения и
вращения визуализируемых объектов. В модуль также необходимо включить
алгоритмы визуализации проекций максимальной интенсивностей для
отображения сосудов при ангиографических исследованиях, а также
реализацию режима псевдорентгеновского изображения.
Выводы. Разработка и совершенствование программного обеспечения
для визуализации томографических данных имеет большое практическое
значение, так как от наглядности отображения информации во многом зависит
правильность постановки диагноза и последующих лечебных мероприятий.
При этом синтез реалистичных трехмерных изображений анатомических
структур
является
первостепенной
методологической
задачей.
Алгоритмическая основа программного обеспечения должна быть
ориентирована на максимальную степень автоматизации с минимальным
числом параметров, определяемых вручную. Интерфейс программного
продукта должен моделировать логику пользователя, освобождая его от
множества рутинных операций. Практическую реализацию алгоритмов
трехмерной визуализации целесообразно выполнять с помощью мощной
графической библиотеки, например, OpenGL, DirectX. Перспективой работы
является разработка методологии и соответствующего программного
обеспечения для проведения виртуального операционного планирования.
Список литературы: 1. Лучевая диагностика: клинико-организационное руководство / Под ред.
А.А. Важенина, М.В. Ростовцева. – Челябинск: Изд. “РЕКПОЛ”, 2004. – 152 с. 2. Jannin P.,
Fleig O. A data fusion environment for multimodal and multi–informational neuronavigation // Comput.
aided surg.  2000.  Vol. 5. – № 1.  Р. 1  10. 3. Привалова Е.С. Возможности компьютерной
томографии в нейрохирургической практике // Український медичний часопис. – 2000. – № 4 (18).
– С. 81 – 89. 4. Туpкин А.М., Белова Т.В. Использование тpехмеpной pеконстpукции в
нейpоpентгенологии // Вопросы нейрохирургии им. Н.Н. Бурденко. – 2000. – № 3. – C. 23 – 26.
5. Аврунин О.Г., Семенец В.В., Масловский С.Ю. Визуализация вентролатерального ядра таламуса
головного мозга человека // Радиоэлектроника и информатика. – 1998. – № 1–2. – С. 132 – 134.
6. Пронин И.Н., Родионов П.В. и др. Программное обеспечение для работы с данными в формате
DICOM на IBM PC в нейрорентгенологии // Медицинская визуализация. – 2002. – № 2. – С. 138 –
144. 7. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. – М.:
Машиностроение, 1990. – 330 с. 8. Хилл Ф. OpenGl. Программирование компьютерной графики.
Для профессионалов. – СПб.: Питер, 2002. – 1088 с.
Поступила в редакцию 14.04.2006
8
УДК 537.311.322
Р.М. БАЛАБАЙ, канд. фіз.-мат. наук, КДПУ (м. Кривий Ріг),
О.Ю. ЧЕРНОНОГ, КДПУ (м. Кривий Ріг)
АДСОРБЦІЙНІ ЗМІНИ НА ПОВЕРХНІ СТІНОК ПОР
ПОРУВАТОГО КРЕМНІЮ В ПРОЦЕСІ
ВИСОКОТЕМПЕРАТУРНОГО СТАРІННЯ:
КОМП’ЮТЕРНЕ МОДЕЛЮВАННЯ
Досліджуються зміни в атомній будові поверхні стінок пор поруватого кремнію з кисневим
адсорбентом при підвищенні температури від 300 K до 1200 K статистичним методом МонтеКарло. Активні перебудови починаються з температур порядку 500 K. Перебудови, що
відповідають плавленню – з температури 1100 K.
Alterations in the atomic arrangement of the surface of the pore walls of the porous silicon with oxygen
adsorbent under raising temperature from 300 K to 1200 K are studied by the statistic Monte-Carlo
method. Active atomic reconstructions are began off 500 K. Atomic reconstructions that corresponding to
melting are began off 1100 K.
Постановка задачі і аналіз літератури. На початку 90-х років шляхом
електрохімічного травлення осколку кремнієвого кристалу в HF кислоті була
отримана сітка вільних кремнієвих ниток [1 – 3]. Нитки сформувалися рівномірно
з великим відношенням висоти до ширини. Висоти були порядку мікрометрів,
тоді як типові ширини були порядку нанометра, приводячи їх до співвідношення
1000 : 1. Після опромінювання цих кремнієвих шарів зеленим світлом аргонового
лазера згенеровані електронно-діркові пари рекомбінували через заборонену зону
з червоним світінням. Ця здатність квантово-розмірних шарів, створених певним
чином, до емісії видимого світла може привести до розвитку дешевої
оптоелектроніки, що базується на використанні кремнію.
До теперішнього часу розроблено багато моделей, що намагаються
пояснити цей ефект. Найбільш авторитетних серед них дві. Одна, створена
Тенхеном, зв’язує люмінесценцію із захопленням екситонів кремнієвими
кластерами квантових розмірів [1]. Інша – світіння, що спостерігається, приписує
активним хімічним сполукам, що утворюються на сильно розвинутій поверхні
кремнієвих нанокристалів [4]. У будь-якому випадку очевидно, що визначальну
роль у цьому процесі відіграє атомна будова одержуваних зразків.
Мета цієї роботи – дослідження змін в атомній будові пористого
кремнію при підвищенні його температури.
Суть досліджень. В процесі досліджень було використано статистичний
метод Монте-Карло. Міжатомна взаємодія описувалася трьохцентровим
потенціалом Кіттінга:
9
E
1
3
[ xi  x j

2 ij 8(d1 ) 2
2
 (d1 ) 2 ]2  
ijk
3
[( x j  xi )( xk  xi )  d1d 2 cos ]2 ,
8d1d 2
де d1, d2 – відстані відповідно між атомами i і j, i і k; θ – кут зв'язку; xn – позиція
n-го атома; α і β – силові константи, що характеризують розтягуючі і згинаючі
властивості зв'язку. Об’єм моделювався стандартними періодичними
граничними умовами, що накладалися на грані куба зі стороною 21.68 Å, який
містив 514 атомів.
Комп'ютерний експеримент починався з кімнатної температури, при якій
«виготовлявся» поруватий кремній у такий спосіб.
Спочатку досліджуваний куб був заповнений атомами кремнію в позиціях
випадково зміщених від ідеальних кристалічних не більше ніж на 10 % у
кількості, що відповідає щільності кристалічного кремнію – 2.42∙103 кг/м3.
Потім випадковим чином вилучалося з куба 25 % атомів і така атомна система
релаксувалась процедурою Монте-Карло протягом 10000 кроків до структури,
при якій енергія системи змінювалася в межах обраної похибки. Отримана в
результаті атомна конфігурація вважалася поруватим кремнієм і являла собою
суміш двох фаз кристалічного кремнію і порожнеч, що спостерігалося на
перетинах куба уздовж площин (100), (110), (111) і збігалося з результатами
інших комп'ютерних експериментів [5] і експериментальними фактами [6].
Наступним кроком нашого моделювання було покриття стінок пор
атомами кисню, який є найбільш ймовірним адсорбентом і на стадії
електрохімічних реакцій при створенні пористого кремнію, і при подальшому
його природному старінні. Для цього «сканувалася» атомна система кремнію і
при відсутності на відстані зв’язку, що відповідає величині dSi–Si із потенціалу
Кіттінга, одного з чотирьох атомів, вакансія замінювалась киснем.
Далі така система знову піддавалась релаксації по процедурі МонтеКарло при температурі 300 K, після чого починалося моделювання термічного
впливу на пористий кремінь. У процесі нагрівання через кожні 50 K
виконувалося 10000 зсувів атомної системи. При цьому амплітуда зсувів для
кожної температури вибиралася відповідно до емпіричної формули
Si
O
( Å)   0 T T0 , де To = 0.0025 aбс. од., δ0 ≈ 0.25 Å, δ0 ≈ 0.40 Å.
Використання цієї формули забезпечує те, що приймається приблизно 1/3
зрушень атомів при кожній температурі, що вважається найбільш
оптимальною часткою для процесу релаксації по методу Монте-Карло.
Протягом усього процесу нагрівання з метою фіксування змін в атомній
конфігурації спостерігався один раз обраний фрагмент стінки пори.
Описаний вище експеримент починався кілька разів. Сумарні результати
приводяться на рис. 1 – 3. Із вигляду кривих зміни енергії системи з
температурою (рис. 1) можна зробити висновок про температуру плавлення
пористого кремнію, вона нижче температури плавлення кристалічного
кремнію і складає 1100 K.
10
Е, neV/atom
Т, К
Рис. 1. Еволюція повної енергії системи атомів поруватого кремнію
з підвищенням температури
Ґрунтуючись на отриманих даних, можна припустити, що активні зміни
будови поверхні стінок пор спостерігаються після температури 500 K (див.
рис. 2a, 3a). До температури 500 K позиції атомів Si і O поблизу поверхні пори
досить стабільні, після неї – відбувається помітне перегрупування атомів
(див. рис. 2b, 3b).
Зміни, що спостерігаються, у геометричних характеристиках зв'язків типу
O-Si-O, O-Si-Si є причиною зміни коливальних властивостей таких атомних
ланцюжків, що приводить до модифікації спектрів випромінювання і
поглинання поруватого кремнію.
a)
b)
Рис. 2. Зміни в розташуванні атомів на поверхні стінки пори з підвищенням
температури (результати однієї з серій моделювання). Лінія, що зображає зв’язок між
атомами приводилась, якщо відстань між ними була меншою за 0.3d Si  Si
11
Отримані нами результати не суперечать дослідженням методами
адсорбційної ІК-спектроскопії, люмінесцентної спектроскопії та ОЖЕспектрального аналізу адсорбційних змін (адсорбенти: кисень, вуглець, OHгрупа) на поверхні поруватого кремнію в процесі природного і
високотемпературного старіння [7, 8], у яких спостерігалися зміни в
спектральних характеристиках досліджуваних зразків.
a)
b)
Рис. 3. Зміни в розташуванні атомів на поверхні стінки пори
з підвищенням температури (результати іншої серії моделювання)
Висновок. Таким чином, результати комп’ютерного моделювання
дозволяють припустити, що активна зміна в атомній будові поверхні стінок
пор починається при температурі 500 K, фазовий перехід, що відповідає
плавленню поруватого кремнію, при температурі 1100 K.
Список літератури: 1. Iyer S.S., Collins R.T., Canham L.T. Light emission from porous silicon // Mol.
Res. Sain., Pittsburgh. – 1992. – P. 54 – 68. 2. Takagahara T., Takeda K. Teory of rhe quantum
confirement effect on excitions in quantum dots of indirect gap materials // Phys. Rev. B. – 1992. – № 46.
– P. 15578 – 15581. 3. Teschke O., Alvarez F., Tessler L., Kleinke M.U. Nanosize structures connectivity
in porous silicon and its relation to PL efficiency // Appl. Phys. Lett. – 1996. – № 63. – P. 1927 – 1929.
4. Takeda Y., Hyodo S., Suzuki N., Motohiro T., Hioki T., Noda S. An oligosilane bridge model for the
jrigin of the intense visible photoluminescence of porous silicon // J. Appl. Phys. – 1993. – № 33. –
P. 581 – 585. 5. Балабай Р.М., Бобылев А.В., Волошин В.А. Исследование атомной структуры
пористого кремния методом Монте-Карло // Тезисы докладов 1-ой Украинской научной
конференции по физике полупроводников (с международным участием). – ОГУ, Одесса. – 2002. –
С. 130. 6. Kanemitsu Y., Uto H., Masumo Y., Matsumoto T., Fukagi T., Mimura H. Microstructure and
optical properties of free standing porous silicon films // Phys. Rev. B. – 1993. – № 48. – P. 2827 – 2831.
7. Орлов А.М., Скворцов А.А., Клементьев А.Г., Синдяев А.В. Адсорбционные изменения на
поверхности пористого кремния в процессе естественного и высокотемпературного старения
// Письма в Журн. теорет. физики. – 2001. – № 27. – С. 76 – 83. 8. Кашкаров П.К.,
Константинова Е.А., Петрова С.А. и др. К вопросу о температурной зависимости
фотолюминесценции пористого кремния // Физика техн. проц. – 1997. – № 31. – С. 745 – 748.
Надійшла до редакції 14.04.2006
12
УДК 615.84
В.Н. ГЕМБА, ХНУРЭ (г. Харьков),
О.М. ДАЦОК, канд. техн. наук, ХНУРЭ (г. Харьков),
Н.П. МУСТЕЦОВ, канд. техн. наук, ХНУРЭ (г. Харьков)
МОДЕЛЬ ВЛИЯНИЯ ФИЗИЧЕСКОГО ПОЛЯ НА
БИОЛОГИЧЕСКИЙ ОБЪЕКТ
Робота присвячена механізмам дії низкоінтенсивних електромагнітних полів на біологічні об‘єкти.
Пропонована модель, яка адекватна експериментальним результатам.
The article discusses mechanisms of low energy electromagnetic field influence to biological entity. The
considered models are adequate to known experimental results, some original principles are proposed for
physiotherapy apparatus building.
Постановка проблемы. В физиотерапии, как правило, применяют
низкоинтенсивные воздействия физическими полями для лечения заболеваний
как локального, так и общего характера, при этом биологический эффект
проявляется в течение некоторого времени после воздействия. Воздействие
электромагнитными полями малой интенсивности (ЭМПМИ) может
приводить к «ответу», имеющему ярко выраженный резонансный характер,
поэтому при некоторых значениях частоты и (или) амплитуды реакция
организма имеет ярко выраженные особенности. Для обозначения этой
особенности обычно используют термин «резонансный ответ». Однако
наличие такого ответа, по мнению авторов, вовсе не подразумевает наличие
резонансного поведения структурных элементов живой материи –
биологического объекта (БО). Обосновать это утверждение можно, хотя бы,
принципиально низкой добротностью некоего условного колебательного
контура внутри БО. Существует, однако, и другой механизм получения
эффектов, подобных резонансным, хорошо известный в теории синергетики и
хаотической динамики – так называемые индуцированные шумом
переходы [1].
Ранее в [2] предложены модели на основании аттракторов и странных
аттракторов [3, 4], иллюстрирующие поведение БО при воздействии ЭМПМИ.
Основаны эти модели на гипотезе [2], что при воздействии ЭМПМИ
происходит
изменение
флуктуационной
(шумовой,
хаотической)
составляющей естественных биологических процессов, причем амплитуда
основного колебания существенно превышает амплитуду флуктуационной
составляющей. Вопреки интуитивным представлениям, такое увеличение
приводит не к деструктивным процессам в организме, а к их стабилизации, что
отображается в модели как переход аттрактора к новой квазистационарной
орбите.
13
Один из вопросов, требующий дополнительного обсуждения –
определение границ нормы для системы, представленной в виде
аттрактора [5].
В работе [6] модель условного биологического процесса описана
уравнениями вида:
dx/dt=σ[x(t) {(1+ а∙cos(2πft))(1+d∙Random[0\1])} – y(t)];
dy/dt=(r+с) {(1+ а∙cos(2πft))(1+d∙Random[0\1])} x(t) – y(t) – x(t) z(t);
dz/dt=–b z(t) – x(t) {(1+ а∙cos(2πft))(1+d∙Random[0\1])} y(t),
где а – амплитуда периодического ЭМПМИ; f – частота периодического
ЭМПМИ; d – амплитуда хаотичного ЭМПМИ; Random[0\1] – случайная
функция, которая изменяется от 0 до 1; с – амплитуда постоянного ЭМПМИ;
σ, r, b – константы биологического процесса; x(t), y(t), z(t) – функции,
описывающие биологический процесс в координатах x, y, z. Начальные
условия: x(0) = 0, y(0) = 0, z(0) = 0.
Графическое решение уравнений представляет собой фазовые портреты в
трехмерном пространстве, отображающие эволюцию системы [6]. Оказалось,
что система чувствительная к изменению частоты воздействия, причем не
монотонно, а по принципу «частотных окон» – есть зоны (параметров), где
влияние не ощущается. Существуют зоны, где влияние ощущается и имеет
одинаковый характер при разных амплитудах воздействия. В некоторых зонах
влияние ощущается и имеет различный характер при разных амплитудах.
Реакция системы в основном сводится к переходу на новые
квазипериодические орбиты при определенных частотных и амплитудных
параметрах, что и воспринимается внешним наблюдателем как резонансный
ответ. Параметры новой орбиты зависят от параметров воздействия и
начального состояния объекта. Характерно, что время нахождения в любом
подсостоянии также изменяется и его можно оценить по количеству петель в
различных плоскостях аттрактора.
Флуктуационная составляющая как бы «прощупывает» пространство
возможных состояний и по законам устойчивости переводит организм из
состояния «болезнь» в состояние «нормы» («здоровья»), как оптимальное для
организма. Напротив, переход организма к абсолютно стабильному процессу
(полное отсутствие флуктуационной составляющей) является для организма
столь же опасным, как и затухание колебаний вообще. В процессе без
флуктуационной составляющей организм, многократно «пробегая» по одному
и тому же жизненному циклу, вырабатывает свои ресурсы, не может
подключить новые (нет «рыскающего», поискового фактора флуктуационной
составляющей) и, в конечном итоге, также неминуемо погибает, как и при
затухании основных колебательных процессов. С точки зрения теории
14
аттракторов процесс без флуктуационной составляющей может быть
охарактеризован как предельный цикл [6].
Целью работы является разработка модели, адекватно отражающей
поведение биологического объекта при низкоинтенсивном терапевтическом
воздействии.
Предлагаемая модель. Предлагается модель анализа описанных
процессов, основанная на теории устойчивости. Предполагаем ее
использование для различных частотных диапазонов, в том числе для
воздействия на точки акупунктуры. Подобные модели используются для
анализа устойчивости колебаний в генераторах хаотических колебаний с
положительной обратной связью [6]. Будем исходить из того, что БО (точнее –
аттрактор, описывающий поведение некоторого квазипериодического
колебания в этом объекте) в состоянии нормы находится в некотором
равновесном состоянии. Это состояние, с одной стороны, ограниченно
предельными возможностями организма, а с другой – минимальными
энергетическими
потребностями,
необходимыми
для
поддержания
жизнедеятельности. Затухающие колебания, которые приводят к гибели БО, не
рассматриваем. Представим аттрактор в виде шарика катающегося в
потенциальной яме. Границы этой ямы характеризуют предельные
возможности БО (в модели – предельный цикл аттрактора). На шарик
воздействуют внешние факторы (окружающая среда, режим питания и т.д.),
которые и обеспечивают флуктуацию потенциальной ямы. Таким образом, на
фоне значительных квазипериодических возникают дополнительные
хаотические колебания, которые можно рассматривать как аналог
адаптационных процессов БО. Кривая распределения этой энергии для
состояния нормы приведена на рис. 1.
Множество
возможных состояний
живого БО
Запредельные
возможности
Рис. 1
На рис. 2 и 3 показано распределение энергии для состояния
нехронического и хронического заболеваний соответственно. В состоянии
нехронического заболевания глубина потенциальной ямы находится выше
состояния нормы. Хроническое заболевание характеризуется тем, что БО
находится в потенциальной яме на уровне или ниже нормы. При воздействии
15
ЭМПМИ, в первом случае переход системы в состояние нормы более
вероятен, чем во втором.
Норма
Норма
Норма
Нехроническое
заболевание
Хроническая
болезнь
Рис. 2.
Рис. 3.
Предложенные модели хорошо совпадают с известными [7]. При
использовании ЭМПМИ сдвиги в сторону выздоровления пациента наступают
через несколько дней после начала сеанса лечения и зачастую проходят через
кризис, что вполне соответствует модели (рис. 2). Этап, на котором эффект не
наблюдается – «расшатывание» аттрактора в состоянии нехронического
заболевания; этап кризиса – переход через пик между заболеванием и нормой;
длительный эффект выздоровления – нахождение в норме.
Воздействие ЭМПМИ на здоровый организм практически не дает
эффектов, что также соответствует модели. При низкоинтенсивном
неповреждающем воздействии не создается новых потенциальных ям типа
«заболевание». При этом, естественно, должно происходить изменение
флуктуационной составляющей, но для аттрактора нормы (рис. 1) переходить
некуда – нет и заметных эффектов. Исходя из этого, можно предположить, что
при воздействии ЭМПМИ происходит не переход к новым биологическим
процессам, а изменение существующих.
Применение ЭМПМИ имеет очень мало противопоказаний, что также
согласуется с моделью. Поскольку, строго говоря, мы не знаем, на какой
параметр происходит воздействие, а выздоровление идет по сценарию
устойчивости, через возвращение к наиболее оптимальному состоянию, т.е.
организм как бы «сам себя излечивает», то и противопоказания минимальны.
В этой связи необходимо отметить принципиальную разницу между
медикаментозным лечением сильнодействующими химическими препаратами
и лечением при помощи ЭМПМИ.
Рассмотрим биологический процесс в виде аттрактора типа «круг»
(рис. 4). Предположим, что в результате заболевания он переходит в аттрактор
типа «эллипс» (рис. 5). По традиционной схеме лечения (сильнодействующее
лекарство) по узким дугам эллипса «наносится» дозированный удар. Если
дозировка и условия применения препарата подобраны удачно, то наступает
выздоровление (возврат аттрактора к типу «круг»). В противном случае мы
16
снова получаем эллипс, но в другой плоскости (т.е. другое заболевание или
осложнение).
Фармацевтический
препарат
Аттрактор
нормы
Аттрактор
Аттрактор болезни
болезни
Воздействие ЭМПМИ
Рис. 4.
Рис. 5.
При применении ЭМПМИ (рис. 5) воздействие идет «не силовым»
способом, исходно стремятся не к обратной деформации эллипса, а к
изменению флуктуационной составляющей, и далее, через адаптационный
механизм, по законам устойчивости – возврат к кругу. Естественно, второй
путь для организма будет более щадящим, и более универсальным, и во
многих случаях, более эффективным. Однако это не означает, что у таких
приборов нет противопоказаний. Учет возможных не очевидных
противопоказаний выходит за пределы нашего рассмотрения. Однако заметим,
что процесс выздоровления проходит через обострение (не обязательно
данной болезни, более правильно обозначить это состояние термином
«разлад»). В некоторых случаях, когда такой эффект нежелателен, лучше
отказаться от применения ЭМПМИ.
Заметим, что медицинское понимание хронического заболевания и его
оценка с точки зрения модели различны. Медицина обычно считает
заболевание хроническим, если оно не прекращалось или повторялось в
течение некоторого промежутка времени. С точки зрения модели хроническим
будет заболевание, для которого потенциальная яма приблизилась либо
превысила норму (рис. 3). Поскольку в этом случае переход к норме весьма
затруднен либо невозможен (нужно слишком сильно раскачивать условный
шарик), то и ожидать существенных эффектов не приходится. Более логичным
представляется использование ЭМПМИ после или совместно с
лекарственными препаратами. Поскольку те параметры, которые оказались
неэффективны, никак не влияют на аттрактор болезни, а эффективные
проявляют себя только в состоянии болезнь.
Предлагаемая модель может объяснить эффект плацебо (пустышка,
мнимый эффект). Опыт применения ЭМПМИ [8] свидетельствует о том, что,
как и всякое лечебное средство, все физиотерапевтические приборы с
использованием ЭМПМИ обладают эффектом плацебо. Однако, поскольку под
17
термином ЭМПМИ скрывается великое множество различных параметров
поля, универсальная методика в ближайшее время вряд ли будет разработана.
Хотя проверка пациента на эффект плацебо указывает обычно на
психические, а не функциональные реакции для конкретного пациента.
Выводы. Предложена модель, описывающая процесс эволюции
биологического
объекта
при
воздействии
низкоэнергетическим
электромагнитным полем. Модель позволяет объяснить терапевтический
эффект воздействия на биологический объект физическим полем на основе
теории устойчивости.
Модельное рассмотрение позволило объяснить индивидуальность
физиотерапевтического эффекта при лечении различных заболеваний.
Список литературы: 1. Хорстхемке В., Лефевр Р. Индуцированные шумом переходы: Теория и
применение в физике, химии и биологии. – М.: Мир, 1987. – 400 с. 2. Гемба В.Н. Теория
информации и физические механизмы взаимодействия низкоинтенсивных электромагнитных
полей с биологическими объектами // Электроника и связь. – 1999. – № 6. – Т. 1 – С. 202 – 206.
3. Мун Ф. Хаотические колебания. – М.: Мир, 1990. – 312 с. 4. Неймарк Ю.И., Ланда П.С.
Стохастические и хаотические колебания. – М.: Наука, 1987. – 424 с. 5. Агафонов Б.Е.,
Живлюк Ю.Н., Черников Ф.Р. Детерминированный хаос в динамике водородной связи
// Биофизика. – 1995. – Т. 40. – № 3. – С. 497 – 505. 6. Алдонин Г.М. Синергетика и биоритмы
// Биомедицинская радиоэлектроника. – 1999. – № 1. – С. 51 – 56. 7. Видыбида А.К.
Избирательность и чувствительность кооперативной системы при наличии теплового шума.
// Биофизика. – 1992. – Т. 37. – № 2. – С. 374 – 377. 8. Беляков С.В., Бецкий О.В., Яременко Ю.Г.
Состояние и тенденции развития аппаратуры для КВЧ-терапии // Биомедицинская
радиоэлектроника. – 1998. – № 3. – С. 50 – 56.
Поступила в редакцию 31.03.2006
18
УДК 519.21
Н.Н. ГОРА, ген. директор ГП Харьковский приборостроительный завод
им. Т.Г. Шевченко,
А.В. ВОВК, ХНУРЭ
ВЫВОД СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ,
ОПИСЫВАЮЩЕЙ ПРОЦЕСС ОБРАБОТКИ
МНОГОКОМПОНЕНТНОЙ СМЕСИ
Розглянуто процес формування багатокомпонентної суміші, яка представляє собою масив часток,
утримуваних у рідкому середовищі. Вироблені висновок та аналіз системи диференційних рівнянь,
описуючих цей процес. Установлено, що її можна розщепити на системи менших порядків, якщо
власні значення головної матриці цієї системи можна розбити на дві групи так, щоб власні
значення, які належать різним групам, не збігалися.
Process of formation of a multicomponent mix which represents a file of the particles contained in the
liquid environment is considered. The conclusion and the analysis of system of the differential equations
describing this process is made. It is established, that it can be split on systems of smaller orders if
eigenvalues of the main matrix of this system can be spread out on two groups so that eigenvalues
belonging to different groups, did not coincide.
Постановка проблемы. Рассматривается процесс формирования
многокомпонентной смеси, содержащейся в некотором объёме V .
Предполагается, что исходная смесь представляет собой массив частиц,
содержащихся в жидкой среде. Её компонентами являются частицы, размеры
которых лежат в произвольных границах. Формирование смеси производится
при воздействии на неё возмущений, локализованных в малых частях
занимаемого ею объёма. Помимо детерминированных возмущений
рассматриваются и случайные возмущения. Предполагается, что их дисперсии
достаточно малы.
Производится
вывод
системы
дифференциальных
уравнений,
описывающих этот процесс. Показано, что её можно расщепить на системы
меньших порядков. Предполагается, что собственные значения матрицы A0 (t )
можно разбить на две группы так, чтобы собственные значения из разных
групп не совпадали на исследуемом промежутке [a, b] .
Анализ литературы. Подробное описание рассмотренных в этой статье
способов обработки исходного сырья приведено в [1 – 2]. В работах [3 – 4]
детально исследован процесс формирования многокомпонентных смесей.
Свойства случайных возмущений и их вклад в эволюцию процесса
подробно рассмотрены в работах [5 – 7].
В работе [8] была исследована задача о расщеплении системы
обыкновенных дифференциальных уравнений, содержащих малый параметр,
на системы меньших порядков. Предложенный в этих работах подход
19
позволяет выписать дифференциальные уравнения для каждой из полученных
систем с любой заданной точностью.
Цель статьи. Вывод и исследование системы дифференциальных
уравнений, описывающей процесс формирования многокомпонентной смеси.
Решение задачи о расщеплении полученной системы дифференциальных
уравнений с малым параметром на системы меньших порядков.
Процесс формирования фракций многокомпонентной смеси.
Рассмотрим процесс обработки жидкой смеси с помощью импульсов
(возмущений), воздействие которых на малые части занимаемого ею объёма
приводит к разрушению частиц, содержащихся в ней. Целью работы является
получение «из обломков» частиц отдельных фракций компонент смеси,
которые могут быть использованы в дальнейшем. Предложенный способ
формирования компонент применяется и для получения из исходной массы
частиц массивов частиц, основные характеристики которых (дисперсность,
полидисперсность, пористость) лежат в заданных границах.
Обычно переработка жидкой смеси производится с целью получения её
компонент с заданными характеристиками. Если обработка исходной смеси
производилась с помощью возмущений, тождественных по своим
характеристикам, и возмущения были равномерно распределены во времени и
в занимаемой ею объёме V , то полученная в результате смесь будет
однородной в V . Предполагается, что её обработка указанным способом
производилась достаточно долго. Если обработка смеси в разных частях
объёма V неодинакова, то полученная смесь будет неоднородной – её
свойства в различных частях V будут различны.
Одной из характеристик многокомпонентной смеси является вектор
распределения компонент k (M ) . Он имеет вид
k (M )  ( K1 (M ), , K n (M )) .
Здесь каждый компонент K i (M ) , ( i  1, 2, , n ) есть отношение
(1)
mi ( M )
m( M )
массы mi i -компонента из малого объёма V (M ) , содержащего точку M , к
сумме масс m1    mn  m(M ) всех компонент, содержащихся в объёме
V (M ) , который выбираем настолько малым, что массы компонент в нём
распределены равномерно (с точностью до величин, большего порядка
малости, чем m1 (M ), , mn (M ) ).
Считаем, что: а) добавки в обрабатываемую смесь, такие как вода и
катализаторы (вводимые в смесь в процессе её обработки) не относятся к её
компонентам; б) сильные возмущениях малых объёмов вязкой смеси
существенно уменьшают её вязкость на промежутках их действия.
20
Исследуем процесс П(t ) изменения компонент
подвергающейся возмущениям.
Обозначим через V i объёмы из V такие, что:
Vi  V ( i  1, 2, 3 ), Vij  Vi V j   .
жидкой
смеси,
(2)
Сформулируем следующие утверждения:
– Если многократно возмущать объёмы V i импульсами, тождественными
с точки зрения их воздействия на смесь, то при многократном их повторении,
в каждом V i сформируется смесь, которая при дальнейшей её обработке этими
импульсами изменяться уже не будет (незначительные изменения могут быть
вызваны процессами диффузии).
– Если возмущать области V i и V j так, чтобы возмущения происходили в
V i , V j поочередно, то при достаточно большом числе их реализаций
распределения компонент смеси в областях V i , V j , на пересечении Vij   ,
будут мало различаться между собой. Это различие будет тем меньше, чем
больше возмущений было реализовано на V i и V j .
– Если указанным возмущениям многократно подвергать все пары
объёмов V i , V j , для которых Vij   , то при дальнейших возмущениях
любого V i распределения компонент V изменяться уже не будут.
Отсюда следует, что к некоторому моменту времени T распределения
компонент процесса П(t ) , ( t  T ) на пересечениях V ij любой пары V i , V j не
будут зависеть от того, с каким элементом этой пары его связать.
Отметим, что сформулированные утверждения не имеют места, если
возмущения настолько сильны, что их многократное повторение приводит к
чрезмерному измельчению частиц. Таким образом, процесс П(t ) может быть
стабилизирован только с помощью специально подобранных импульсов.
Уравнение процесса формирования компонент смеси. Изменение
компонент происходит за счёт возмущений, локализованных в отдельных
частях V i объёма V .
Возмущениям
подвергаются
все
объёмы
V i , но характеристики
возмущений (степень их воздействия на смесь) в разных V i неодинаковы. В
каждом V i эти характеристики являются функциями точки M  Vi . Указанные
различия обусловлены стремлением сформировать в каждом V i смесь,
распределение компонент которой по своим свойствам отличалось бы от
смесей в V j  Vi .
Каждой точке M  V ставится в соответствие её окрестность O(M ) ,
21
удовлетворяющая следующим условиям: объёмы
O(M ) на несколько
порядков меньше объёмов из (3) (см. ниже); число частиц в O(M ) достаточно
велико. Далее за размер частицы в точке M принимается усреднение
размеров всех частиц, содержащихся в O(M ) .
Возмущения, действующие на смесь, подобраны так, что при
многократном их повторении в различных частях V , будет получена смесь с
заданным предельным распределением частиц по размерам. Это предельное
распределение U (M ) является функцией точки M (точнее функцией O(M ) –
окрестности этой точки).
Считаем, что скорости изменения характеристик смеси, происходящие
под действием возмущений, неодинаковы в разных V i . Сила действия
возмущений в V i убывает с ростом i . Отсюда следует, что скорости
сходимости к предельному распределению в V i убывают с ростом i .
Возмущения во всех V i производятся с одинаковой частотой.
Процесс обработки смеси в каждом V i производится следующим
образом. Объём V i разбивается на N i объёмов
(3)
Vi,1 , Vi,2 , , Vi, Ni , i  1, 2, 3 .
В каждом из них искомая функция U (M , t ) , описывающая процесс
формирования компонент, заменяется её усреднением (средним значением).
Таким образом, каждому объёму Vr ( 1  r  N i ) из (3) ставится в соответствие
усреднение wr (t ) функции U ( M , t ) по Vr . При этом параметр t (время)
предполагается фиксированным. Считаем, что величины объёмов из (3)
приблизительно одинаковы. Смесь, содержащаяся в них, подвергается
возмущениям в разные моменты времени. Точность аппроксимации функции
U (M , t ) её средними значениями по объёмам (3) возрастает с ростом N i .
При реализации возмущений в объёмах V i ( i  1, 2, 3 ) основная масса
смеси остаётся в каждом из них. Для объёмов из (3) это утверждение неверно,
поскольку их величины малы. При возмущении каждого Vr из (3) часть смеси,
содержавшейся в нём, перемещается в соседние с Vr объёмы. При этом
усреднения wr (t ) будут изменяться.
Получим дифференциальные уравнения, описывающие
формирования смеси в объёме V i ( i  1, 2, 3 ). Пусть
Wi (t )  ( wi ,1 , wi , 2 ,  , wi , N i (t ))
процесс
(4)
– векторы, компонентами которого являются усреднения функции U ( M , t ) по
каждому объёму из (3).
22
Вычислим производные от компонент векторов Wi (t ) . При этом считаем,
что возмущения, которым подвергается смесь в каждом объёме Vr ( 1  r  N i )
из (3), приводят к перемешиванию смеси в V i . Таким образом, усреднение
из (3) является функцией усреднений
w (t ) по любому V
(wi,1 , wi,2 , , wi, Ni (t )) . Поэтому
~ (t )
~ (t ) w
~ (t ) ni w
~ (t ) dw
dw
β
α
.
(5)
 α   ~α 
dt
t

w
(
t
)
dt
β 1
β
~ (t ) являются усреднениями функций w (t )
В уравнениях (5) функции w
r
r
по временным промежуткам, содержащим несколько десятков возмущений.
Аргумент t в (5) является центром каждого такого промежутка.
~ (t ) из (4) является решением системы
Вектор Wi (t ) с компонентами w
α
дифференциальных уравнений
dWi (t ) Wi (t )
(6)

Ai (t )Wi (t ) .
dt
t
Здесь матрица Ai (t ) порядка N i  N i имеет вид
~ (t )
w
; α  β , α, β  1, , N i .
Ai (t )  ~α
w (t )
β
Объединяя уравнения (6) по всем V i ( i  1, 2, 3 ), получим систему
дифференциальных уравнений, описывающую процесс формирования смеси в
объёме
V 
3
Vi .
i 1
Матрица системы имеет блочно-диагональный вид:
 A1



(7)
A
A2
.


A3 

Размерности блоков в матрице (7) равны N1  N1 , N 2  N 2 , N 3  N 3 .
Матрица, стоящая в блоке имеет вид
~ (t )
w
α
(8)
~ (t ) ; α, β  1,  , N i .
w
β
Элементы матрицы A, не принадлежащие этим блокам, равны нулю.
Диагональные элементы матрицы (7), отвечающие разным объёмам V i ,
V j , не совпадают: если возмущения объёма V i превосходит возмущение V j ,
23
то диагональные элементы матрицы (7) для V i будут больше, чем её элементы
для V j . Отсюда для разных блоков имеем
~ (t ) w
~ (t )
w
α
α

(9)
~ (t ) w
~ (t ) .
w
β
β
Поэтому собственные значения матриц Ai , отвечающих различным блокам
матрицы (7), не совпадают. Это обстоятельство будет использовано ниже.
Вклад случайных возмущений в эволюцию процесса. Считаем, что
множество всех возмущений δ i процесса  на s 0 , t 0  конечно. Через
t i , τ i  ,
 i , Vi обозначим промежутки времени, на которых действуют δ i ,
процессы, которые δ i порождают, и их фазовые пространства.
Предполагается, что: все Vi являются областями, а τ i – точками фокусировки
процессов  i на Vi ; δ i (i  1, 2, 3) являются независимыми. Через I (Vi )
будем обозначать индикаторные функции множеств Vi . Положим
Vi
 V j  Vij . Считаем, что на
V (Vi ) задана функция распределения k (M , t )
процесса  i  , если для любого события B из V (Vi ) и любого t  s 0 , t 0 
PM  B    k N , t dV N .
B
Здесь вероятность PM  B  вычисляется в момент t . Предполагается, что
начальное распределение k M , s 0  процесса  на V задано. Выясним, как
изменяется функция распределения вероятностей k N , t  процесса  при
очередном возмущении δ i . Все функции k N , t  , I (V ) предполагаются
непрерывными на V .
Пусть Vi выбрано произвольно, множество V j содержит все фазовые
 
  – моменты фокусировки на V j .
элемент из τ j  , для которого  i   i .
пространства, для которых P(Vij )  0 , τ j
Обозначим через ν i наибольший
Положим β  max vi , t i .
Пусть k M , β i I (Vi ) , k M , τ i I (Vi ) – функции распределения на Vi в
моменты времени β i , τ i . Тогда, чтобы получить функцию распределения
процесса  на V в момент τ i , следует переопределить её на Vi , заменив
k M , β i I (Vi ) на k M , τ i I (Vi ) . Для M  V \ Vi , k M , β i   k M , τ i  .
Усреднения функций k M , β i  , k M , τ i  по Vi совпадают:
24
 k M , β i dVM   k M , τ i dVM .
Vi
Это
следует
из
условия
Vi
нормировки
выполняется при всех t  s 0 ,  и равенства
 k M , t dVM
 1,
которое
V
k M , β i I (V \ Vi )  k M , τ i I (V \ Vi ) .
Это равенство имеет место, поскольку на β i , τ i  все возмущения кроме
δ i сосредоточены лишь на V \ Vi , а δ i действуют на Vi .
Любая точка M V с вероятностью 1 содержится в бесконечном
множестве областей Vi ; до любого момента t ( t   ) происходит лишь
конечное число возмущений. Для любой Vi найдётся хотя бы одна V j , i  j ,
не совпадающая с Vi , для которой P(Vij )  p  0 . Здесь p не зависит от i, j .
Если все перечисленные условия выполняются, то при бесконечном числе
возмущений всех областей Vi фокусировка на V будет иметь место. Если же
число возмущений всех Vi будет достаточно большим, то распределения на
всех Vi будут лишь незначительно отличаться от их предельных значений.
Упрощение исследуемой системы. Рассмотрим задачу о расщеплении
полученной выше системы дифференциальных уравнений на подсистемы
меньших порядков.
Исследуемая система имеет вид
(10)
ε hY   A(t , ε)Y  f .
Здесь Y – невырожденная (n  n) -матрица, её столбцами являются
решения системы (10), h  0 – целое число. Элементами вектора f являются
величины σ i dη i (t ) , i  1, , n . Здесь dη i (t ) ( i  1, , n ) есть белый шум, σ i
– случайные величины с заданными функциями распределения.
Предполагается, что: компоненты dη i (t ) вектора f некоррелированы;
матрица A(t , ε) имеет асимптотическое разложение

A(t , ε) ~  Ar (t )ε r , ε  1 .
(11)
r 0
Все исследуемые далее функции и матрицы предполагаются
голоморфными по переменной t .
Пусть в точке t 0 , исследуемого промежутка [a, b] , невозможно разделить
собственные значения матрицы A0 (t ) на группы, не имеющие общих
элементов. Предположим, что в этом случае существует малая -окрестность
25
точки
t 0 такая, что собственные значения из разных групп не будут совпадать
на промежутках [a, t 0  δ] , [t 0  δ, b] .
Рассмотрим исходную систему (10) на промежутке [a, t 0  δ] .
Пусть Y  T (t )Y * , тогда:
~
(12)
A(t, )  T 1 (t ) A(t , )T (t )   hT 1 (t )T (t ) .
Если собственные значения λ i ( i  1, , n ) матрицы A0 (0) можно
разбить на три группы, λ k 1 , , λ k l , λ k l 1 , , λ n так, чтобы собственные
значения из разных групп не совпадали, то существует трёхдиагональная
матрица T (t )
T12 (t )
0 
 I


T (t )   T21 (t )
I
T23 (t )  ,
 0
T32 (t )
I 

с помощью которой матрицу A0 (t )
 A011 (t ) A012 (t ) A013 (t ) 


A0 (t )   A021 (t ) A022 (t ) A023 (t ) 
 31

A (t ) A032 (t ) A033 (t ) 
 0

можно привести к блочно-диагональному виду
~11
A
0
0 
0 (t )

~
~ 22
A0 (t )   0
A0 (t )
0 .
~ 33 

0
0
A0 (t ) 


~
~
~
Здесь A011 (t ) , A022 (t ) , A033 (t ) – квадратные матрицы порядков k , l , m ;
~
~
~
собственные значения матриц A011 (0) , A022 (0) , A033 (0) не совпадают в
некоторой окрестности нуля.
Элементы матрицы T (t ) можем найти, решая систему линейных
алгебраических уравнений.
После проведенных преобразований случайный вектор примет вид g .
Обозначим Y  P(t , ε)Z , при условии, что det P0 (t )  0 .
Уравнение (10) относительно новой неизвестной можно записать так
~
ε h P(t , ε)Z  ε h P(t , ε)Z   A(t , ε) P(t , ε)Z  g .
~
Обозначим B(t , ε)  P 1 (t , ε) A(t , ε) P(t , ε)  ε h P 1 (t , ε) P(t , ε)  g . Тогда
система (10) преобразуется к виду:
(13)
ε h Z   B(t , ε)Z  g .
Из (13) получим
26
~
 h P(t, ε)  A(t, ε) P(t, ε)  P(t, ε) B(t, ε)  g .
Матрицы функций P(t , ε) и B(t , ε) в (14) представим в виде


r 0
r 0
P(t , ε)   Pr (t )ε r , B(t , ε)   Br (t )ε r .
(14)
(15)
Подставим ряды из (15) и (11) в (14) и сравним коэффициенты при
одинаковых степенях ε . Уравнение (14) имеет место при выполнении
следующих условий:
~
(16)
A0 (t ) P0 (t )  P0 (t ) B0 (t )  0 ;


r 1
~
~
A0 (t ) Pr (t )  Pr (t ) B0 (t )   Ps (t ) Br  s (t )  Ar  s (t ) Ps (t )  Prh (t ) .
s 0
(17)
В (17) r  0 ; последний член при r  h опускаем.
~
Считаем, что B0 (t )  A0 (t ) , P0 (t )  I . Тогда (16) примет вид
~
~
A0 (t ) Pr (t )  Pr (t ) A0 (t )  Br (t )  H r (t ) , r  0 .
(18)

Здесь H r (t ) зависит только от Pj (t ) , B j (t ) и Pj (t ) с номерами j  r .
Из (18) находим
 H r11 (t ) H r12 (t ) H r13 (t ) 


(19)
H r (t )   H r21 (t ) H r22 (t ) H r23 (t )  .
 31

32
33
H (t ) H r (t ) H r (t )
 r

Уравнения (18) можно последовательно разрешить при помощи матриц
Pr (t ) , Br (t ) , которые имеют вид
 0
 Br11 (t )
Pr12 (t )
0 
0
0 


21
23
22
(20)
Pr (t )   Pr (t ) 0
Pr (t )  , Br (t )   0 Br (t ) 0  .




32
33
0
Pr (t ) 0
0
0
Br (t )




Матрица Pr (t ) в (20) является трёхдиагональной.
Установлено, что замена
 

Y    Pr (t )ε r  Z
 r 0

переводит уравнение (10) в дифференциальное уравнение
 

ε h Z     B r (t )ε r  Z  g .
 r 0

Матрицы Br (t ) этой системы имеет блочно-диагональный вид (20).
Таким образом, исходная система, состоящая из n уравнений, может
быть расщеплена на три подсистемы меньших порядков: k , l , m .
Аналогичные преобразования могут быть проведены и на промежутке
27
t 0  δ, b .
При достаточно малом δ решения исследуемой системы можно заменить
их линейными приближениями.
Выводы. Научная новизна состоит в следующем. Произведён вывод
системы дифференциальных уравнений, описывающей процесс формирования
многокомпонентной смеси. Проведено исследование этой системы.
Установлено, что её можно расщепить на системы меньших порядков.
Практическая ценность работы заключается в том, что полученные
результаты позволяют производить общий анализ процессов, происходящих в
многокомпонентных смесях. Это даёт возможность предсказать эволюцию
таких процессов при условии, что их основные характеристики известны.
Предполагается, что при решении системы (5) содержащиеся в ней
производные заменяются разностными отношениями: дифференциалы
искомых функций в (5) заменяются соответствующими разностями. Их
нахождение основано на обработке опытных данных.
Список литературы: 1. Белянин П.Н. Применение порошковых матeриалов. Состояние и
перспективы // Проблемы машиностроения и надёжность машин. – 1996. – № 2. – С. 3 – 16.
2. Коллинз P. Течение жидкостей через пористые материалы. – М.: Мир, 1964. – 350 с.
3. Фигуровский Н.И. Седиментационный анализ. – М.: Изд-во АН СССР, 1982. – 332 с.
4. Грановский М.Г., Лавров И.С., Смирнов О.В. Электрообработка жидкостей. – Л.: Химия, 1976. –
216 с. 5. Дикарев В.А. Стабилизация распределений марковского процесса при возмущениях
континуальных компонент // Доклады НАН Украины. – 2003. – № 6. – С. 47 – 53. 6. Дикарев В.А.,
Герасин С.Н., Слипченко Н.И. Стабилизация вероятностей состояний марковского процесса при
локальных возмущениях его фрагментов // Доклады НАН Украины. – 2000. – № 8. – С. 90 – 93.
7. Дикарев В.А., Герасин С.Н. Конкурирующие возмущения в задаче о фокусировке распределений
марковских процессов / 10-я Международная конференция «Математика. Экономика.
Образование». – Новороссийск, 2002. – С. 151. 8. Вазов В. Асимптотические разложения решений
обыкновенных дифференциальных уравнений. – М.: Мир, 1968. – 464 с.
28
УДК 651.326
В.М. ГУСЯТИН, канд. техн. наук, ХНУРЭ,
В.Н. СИДОРОВ, ХНУРЭ
ОПИСАНИЕ И МОДЕЛИРОВАНИЕ M-КОМПОНЕНТНЫХ
ГАЗОДИНАМИЧЕСКИХ ОБЪЕКТОВ В СИСТЕМАХ
ВИЗУАЛИЗАЦИИ
Пропонується модель опису багатокомпонентних газодінамічних об'єктів, що дозволяє визначати
параметри об'єкта в будь-який момент часу в будь-якій області простору. Результати можуть бути
використані при розробці систем візуалізації реального часу для авіаційних і космічних
тренажерів.
The model of the description of the multicomponent gas dynamic objects, allowing to determine
parameters of object at any moment in any area of space is offered. Results can be used at system
engineering visualization real time for aviation and space simulators.
Постановка проблемы. При формировании изображения в системах
синтеза визуальной обстановки значительное внимание уделяется
отображению различных газодинамических как природных, так и
искусственных явлений (например, марево нагретого воздуха, газовая струя
реактивного двигателя и др.), большинство из которых представляют собой
многокомпонентную среду. Адекватное отображение этих явлений в системах
визуализации
значительно
повышает
реалистичность
получаемого
изображения и помогает приблизить режим обучения пилота на тренажере к
большей реальности.
Анализ литературы. В настоящее время визуализация таких явлений как
дым, пар сводится к визуальной их имитации [1 – 3], что в значительной мере
затрудняет как описание самих объектов, так и расчет их взаимодействия с
окружающей средой. В статье рассматривается метод описания
газодинамического объекта, базирующийся на моделировании физических
процессов, которые протекают в нем. В соответствии с методом возможно
определение параметров газодинамического поля в любой момент времени в
любой области пространства. Метод является многокомпонентной
интерпретацией «метода крупных частиц», который изложен в [4 – 6].
Цель статьи – разработка метода описания многокомпонентных
газодинамических объектов с целью последующей их визуализации.
Метод крупных частиц применительно к m-компонентному
газодинамическому объекту. Основная идея «метода крупных частиц»
состоит в расщеплении по физическим процессам исходной нестационарной
системы уравнений Эйлера, записанной в форме законов сохранения [4 – 6].
29
Среда здесь моделируется системой из жидких крупных частиц. Расчет
каждого временного шага (вычислительного цикла) в свою очередь
разбивается на три этапа:
1. Эйлеров этап, когда пренебрегаем всеми эффектами, связанными с
перемещением содержимого i,j-ой ячейки расчетной сетки (потока массы через
границы ячейки нет). Учитываем эффекты ускорения жидкости лишь за счет
давления; здесь для крупной частицы определяются промежуточные значения
искомых параметров потока  (u , v , E ) (рассмотрен двумерный случай, u и
v – скорости по соответствующим осям, E – энергия ячейки).
2. Лагранжев этап, где при движении жидкости вычисляются потоки
массы через границы эйлеровых ячеек.
3. Заключительный этап – определяются в новый момент времени
окончательные значения газодинамических параметров потока (u, v, E, )
(  – плотность вещества в ячейке) на основе законов сохранения массы,
импульса и энергии для каждой ячейки и всей системы в целом на
фиксированной расчетной сетке.
Для описания многокомпонентной среды первый этап «метода крупных
частиц» разбивается на три пункта:
1) вычисление общего давления смеси газов в ячейках координатной
сетки;
2) вычисление промежуточных значений скорости;
3) вычисление промежуточных значений энергии ячеек координатной
сетки.
Исходя из этого, для первого этапа имеем следующие соотношения.
Давление вычисляется как сумма парциальных давлений [7] всех компонентов
смеси. Таким образом, для двухкомпонентной среды получаем:
(1)
p  p1  p 2 ,
где p – общее давление смеси газов; p1 , p 2 – парциальные давления первой
и второй составляющих газодинамического объекта.
Для m-компонентной среды имеем:
(2)
p  p1  p 2  ...  p k  ...  p m ,
где
p1 ,
p2 ,
pk ,
pm – парциальные давления составляющих
m
газодинамического
объекта;
–
количество
компонентов
в
многокомпонентной среде.
Используя уравнение Менделеева-Клапейрона, для двухкомпонентной
среды получаем:
m
 R
m
p   1  T1  2  T2.   ,
(3)
M2
 M1
 V
где p – общее давление смеси газов; m1 , m 2. – соответствующие массы
первой и второй компонент газодинамического объекта, находящиеся в одной
30
ячейке координатной сетки в «методе крупных частиц»;
M1 , M 2 –
соответствующие молярные массы компонент; T1 , T2. – соответствующие
температуры первой и второй компонент; R – газовая постоянная; V – объем
ячейки координатной сетки.
Для m-компонентной среды имеем:
R
m
m
m
m
p   1 T1  2 T2. ... k Tk .  ...  m Tm.  ,
M
M
M
M
2
k
m
 1
V
(4)
где p – общее давление смеси газов; m1 , m 2. , m k , m m – соответствующие
массы компонент газодинамического объекта, находящиеся в одной ячейке
координатной сетки в «методе крупных частиц»; M 1 , M 2 , M k , M m –
соответствующие молярные массы компонент; T1 , T2. , Tk . , Tm. –
соответствующие температуры компонент; R – газовая постоянная; V –
объем ячейки координатной сетки.
Для второго этапа вычисление промежуточных скоростей и энергии
выполняется для каждого компонента многокомпонентной среды. При этом
учитывается, что суммарное давление воздействует на весь объем ячейки
координатной сетки. Для простоты изложения формул рассмотрим
двухкомпонентную среду и плоский случай. Вычисления для m-компонентной
среды аналогичны приведенным за исключением того, что выполняются для m
компонент.
pin1 2, j  pin1 2, j
t
(uin, j )1  (uin, j )1 
;
n
x
( i , j )1  ( in, j ) 2
(vin, j )1  (vin, j )1 
pin, j 1 2  pin, j 1 2
y
t
( in, j )1
 ( in, j ) 2
;
 ( pin1 2, j )1 (uin1 2, j )1  ( pin1 2, j )1 (uin1 2, j )1
( Ein, j )1  ( Ein, j )1  

x

( pin, j 1 2 )1 (vin, j 1 2 )1  ( pin, j 1 2 )1 (vin, j 1 2 )1  t
 n ;

y
 ( i , j )1
(uin, j ) 2  (uin, j ) 2 
(vin, j ) 2  (vin, j ) 2 
pin1 2, j  pin1 2, j
x
t
( in, j )1
pin, j 1 2  pin, j 1 2
y
t
( in, j )1
31
 ( in, j ) 2
 ( in, j ) 2
;
;
(5)
 ( p in1 2, j ) 2 (u in1 2, j ) 2  ( p in1 2, j ) 2 (u in1 2, j ) 2
( E in, j ) 2  ( E in, j ) 2  

x

(5)
( p in, j 1 2 ) 2 (v in, j 1 2 ) 2  ( p in, j 1 2 ) 2 (v in, j 1 2 ) 2  t


,
y
 ( in, j ) 2
где (u in, j )1 , (vin, j )1 – скорости первой компоненты на начало n-й итерации
относительно
соответствующих
осей
координат;
(u in, j )1 ,
(vin, j )1
–
промежуточные значения скоростей первой компоненты газодинамического
p in1 2, j ,
p in1 2, j ,
объекта по соответствующим осям координат;
p in, j 1 2 , p in, j 1 2 – давление двухкомпонентной среды на границах ячейки;
( in, j )1
–
плотность
первой
компоненты
в соответствующей
ячейке
координатной сетки; ( E in, j )1 – значение энергии первой компоненты на
момент начала n-й итерации; ( E in, j )1 – промежуточное значение энергии
первой компоненты; x , y – линейные размеры ячейки координатной сетки;
t – квант времени итерации; i , j – индексы ячейки координатной сетки для
которой производятся вычисления.
Для второй компоненты формат величин аналогичен.
Расчет второго и третьего этапов «метода крупных частиц» производится
аналогично конечным разностям однокомпонентного случая [6] за
исключением того, что вычисления должны проводиться применительно к
каждой из компонент многокомпонентной среды.
Как и при описании первого этапа ограничимся двухкомпонентной
средой и плоским случаем.
Тогда второй этап метода крупных частиц имеет вид»:
n
n

 ( n ) (ui , j )1  (ui 1, j )1 yt , если (u n )  (u n )  0,
i, j 1
i, j 1
i 1, j 1
2
(M in1/ 2, j )1  
n
n
(u )  (ui 1, j )1
 ( in1, j )1 i , j 1
yt , если (uin, j )1  (uin1, j )1  0,
2

(6)
 n (vin, j )1  (vin, j 1 )1
 ( )
yt , если (vin, j )1  (vin, j 1 )1  0,
i, j 1

n
2
(M i , j 1 / 2 )1  
(v n )  (vin, j 1)1
 (in, j 1 )1 i , j 1
yt , если (vin, j )1  (vin, j 1 )1  0,
2

32
n
n
 n
 ( ) (ui , j )2  (ui 1, j )2 yt , если (u n )  (u n )  0,
i, j 2
i, j 2
i 1, j 2
2
(M in1 / 2, j )2  
n
n
(u )  (ui 1, j )2
 (in1, j )2 i , j 2
yt , если (uin, j ) 2  (uin1, j )2  0,
2

(6)
 n
 ( )
yt , если (vin, j )2  (vin, j 1 )2  0,
i, j 2

n
2
(M i , j 1 / 2 )2  
(v n )  (vin, j 1 )2
 (in, j 1 )2 i , j 2
yt , если (vin, j )2  (vin, j 1 )2  0,
2

(vin, j )2
 (vin, j 1 )2
где (M in1 / 2, j )1 , (M in, j 1 / 2 )1 , (M in1 / 2, j ) 2 , (M in, j 1 / 2 ) 2 – потоки масс
первой и второй газовой компоненты через границы ячейки.
Третий этап «метода крупных частиц». Уравнения этого этапа
представляют собой законы сохранения массы М, импульса Р и полной
энергии Е, записанные для данной ячейки в разностной форме:
 (M ) ;
)  ( P )   (P ) ;
)  ( E )   (E ) ;
)  ( M )   (M ) ;
)  ( P )   (P ) ;
)  ( E )   (E ) .
( M n 1 )1  ( M n )1 
( P n 1
( E n 1
n
1
n
( M n 1
( P n 1
( E n 1
n
гр 1
1
1
n
гр 1
1
n
2
2
n
2
2
n
2
n
гр 1
2
n
гр 2
(7)
n
гр 2
n
гр 2
n
)1 – масса первой компоненты газодинамического объекта,
Здесь (M гр
которая пересекла за время t одну из границ рассматриваемой ячейки;
суммирование производится по всем сторонам ячейки. Аналогичным образом
n
( Pгрn )1 и
(Eгр
)1 .
понимаются


Для второй компоненты расчет величин аналогичен.
Таким образом, по завершению расчетов третьего этапа мы получаем
распределение параметров газодинамического поля на момент времени
t n1  t n  t , то есть на конец итерации. Полученные на третьем этапе
значения являются исходными для вычислений параметров поля на
следующей итерации «метода крупных частиц».
Сходимость предложенного метода и корректность построения конечных
разностей проверена моделированием двухкомпонентной среды с помощью
разработанного авторами прикладного программного обеспечения. Результаты
моделирования совпадают с теоретическим описанием физических процессов.
33
Моделирование проводилось на декартовой координатной сетке размерностью
160×160×220. Линейные размеры ячеек координатной сетки составляли 0,1 м.
В соответствии с критерием устойчивости метода [6] квант времени взят
0,0001 с. При проведении моделирования в течение 60000 итераций
неустойчивости метода не выявлено, что говорит о том, что при выбранном
соотношении линейных размеров и кванта времени метод не расходится.
Следовательно, можно использовать один критерий устойчивости метода как
для однокомпонентной, так и для многокомпонентной сред в областях
дозвуковых течений.
Выводы.
Предложен
метод
описания
многокомпонентных
газодинамических сред с целью использования результатов в системах
визуализации.
Создано
прикладное
программное
обеспечение,
подтверждающее правильность перехода к конечным разностям. Определены
критерии устойчивости «метода крупных частиц» для многокомпонентных
сред. Дальнейшим развитием предложенной работы является построение
моделей физико-химических газодинамических объектов, подобных,
например, горению веществ.
Список литературы: 1. Foley J.D., van Dam A., Feiner S.K., Hughes J.F. Computer Graphics
(principles and practice) by Addison-Wesley Publishing Company, Inc. 1996. – 1175 p. 2. Иванов В.П.,
Батраков А.С. Трехмерная компьютерная графика. – М.: Радио и связь, 1995. – 224 с.
3. Мартинес Ф. Синтез изображений. – М.: Радио и связь, 1990. – 192 с. 4. Годунов С.К.,
Забродин А.В., Иванов М.Я. Численное решение многомерных задач газовой динамики. – М.:
Наука, 1976. – 401 с. 5. Белоцерковский О.М., Давыдов Ю.М. Метод крупных частиц в газовой
динамике. – М.: Наука. 1982. – 500 с. 6. Белоцерковский О.М., Давыдов Ю.М. Метод «крупных
частиц» для задач газовой динамики. Инф. бюл. СО АН СССР "Численные методы механики
сплошной реды ", 1970. – Т. 1. – С. 27. 7. Матвеев А.Н. Молекулярная физика: Учеб. пособие для
вузов. – М.: Высшая школа. 1981. – 400 с.
Поступила в редакцию 15.04.2006
34
УДК 681.513:620.1
В.Д. ДМИТРИЕНКО, д-р техн. наук, НТУ "ХПИ",
В.И. НОСКОВ, канд. техн. наук, ГП «Электротяжмаш»,
И.П. ХАВИНА, НТУ "ХПИ"
АЛГОРИТМЫ ОБУЧЕНИЯ ДИСКЕТНЫХ СЕТЕЙ АРТ БЕЗ
АДАПТАЦИИ ВЕСОВ СВЯЗЕЙ РАСПРЕДЕЛЕННЫХ
РАСПОЗНАЮЩИХ НЕЙРОНОВ
Проаналізовані недоліки існуючих нейронних мереж адаптивної резонансної теорії (АРТ).
Запропоновані нові алгоритми навчання цих мереж без адаптації вагових зв'язків розподілених
нейронів, що розпізнають. На прикладах продемонстрована працездатність нових алгоритмів
навчання.
Lacks of existing neural networks adaptive resonant theories (ART) are analysed. New algorithms of
training these networks without adaptation of weights of connections distributed recognizing neurons are
offered. It is shown on examples of working capacity of new training algorithms.
Постановка проблемы и анализ литературы. Системы управления на
основе искусственных нейронных сетей многими авторами рассматриваются
как альтернатива классическим системам управления. В настоящее время
известен целый ряд возможных архитектур для построения нейросетевых
систем управления, а также систем управления, где нейрорегуляторы работают
параллельно обычным регуляторам [1  5]. Большой интерес к нейросетевым
системам управления связан с тем, что они имеют ряд полезных свойств,
которых трудно добиться с помощью других методов. В частности, речь идет о
робастности систем управления, об определении управлений в условиях, когда
неточно известна модель объекта, более гибком реагировании на
изменяющиеся внешние условия, возможности обработки данных различной
природы. Можно также отметить, что для нейросетевых моделей не
существует ограничений, связанных с нелинейностью системы, ее порядком
или видом применяемого функционала.
Для идентификации и управления в реальном времени динамическими
объектами, содержащими в своих структурах "черные" и "серые" ящики
применяются нейронные сети, основанные на аппроксимации нелинейностей,
например, рядами Вольтера, Винера, полиномами Колмогорова-Габора,
нелинейными разностными уравнениями. Однако в тех случаях, когда
управление "черным" или "серым" ящиком должно осуществляться на
распознавании ситуаций, которые определяются некоторым множеством
динамических процессов, несмотря на большое число работ в этой области, до
сих пор удовлетворительных систем управления разработать не удалось. Это
связано с особенностью обучения нейронных сетей, которая, как правило,
требует наличия всей исходной информации, поскольку обучение новому
образу методом обратного распространения ошибки или генетическими
35
алгоритмами, или другими методами требует, как правило, полного
переобучения сети. Невозможность с помощью уже известных нейронных
сетей решить проблему восприятия новой информации при сохранении уже
имеющейся (т.е. решить проблему стабильности  пластичности) привело к
разработке принципиально новых конфигураций нейросетей  сетей
адаптивной резонансной теории (АРТ). Эти сети в определенной степени
решают противоречивые задачи чувствительности (пластичности) к новым
данным и сохранения полученной ранее информации (стабильности). Поэтому
проблемы распознавания конкретных режимов динамических объектов и
адаптация системы в процессе эксплуатации могут решаться на основе
нейросетей АРТ [6  10]. Однако известные дискретные нейронные сети АРТ
имеют и существенные недостатки, если требуется запоминать сотни или
тысячи реализаций одного и того же динамического процесса, так как матрица
весов связей между S- и Y-нейронами размерностью n  m (n  число
S-нейронов входного слоя; m  число распознающих Y-нейронов) хранит
только одно изображение, полученное в результате пересечения
запоминаемых динамических процессов. При малых значениях параметра
сходства в режиме распознавания память нейронной сети АРТ не имеет
необходимого объема информации (наборов фрагментов изображений) для
принятия обоснованных решений, а при больших значениях параметра
аналогичные изображения, отличающиеся небольшим числом второстепенных
деталей, запоминаются как прототипы разных классов изображений с
помощью разных Y-нейронов. Это делает практическое использование этих
сетей сомнительным из-за чрезмерно большого числа Y-элементов
распознающего слоя.
Другой недостаток сетей АРТ  связан с наличием только одного способа
обучения нейронной сети путем адаптации весов связей распознающих
нейронов, что может приводить к искажению или потере, хранящейся в
памяти сети информации. Еще одним недостатком сети АРТ-1 является
отсутствие режимов обучения сети с учителем, а также возможности влиять на
конечные результаты обучения..
В работах [10, 11] были предложены алгоритмы обучения дискретных
нейронных сетей АРТ с участием учителя, с новыми способами формирования
информации в весах связей распознающих нейронов и с запрещением
адаптации весов связей части распознающих нейронов, выделенных в
отдельный слой. Решение конкретных практических задач с помощью новых
нейронных сетей подтвердило их работоспособность и показало
целесообразность совершенствования методов их обучения.
Целью статьи является разработка новых алгоритмов обучения
дискретных нейронных сетей адаптивной резонансной теории, позволяющих
расширить область их применения.
36
Архитектура и алгоритмы функционирования сети АРТ-1. Детально
архитектура и алгоритмы функционирования сети описаны в работах [9  11].
Здесь же мы коснемся только самого необходимого. Архитектура сети АРТ-1
приведена на рис. 1. Эта сеть относит предъявленное входное изображение к
одному из запомненных классов только в том случае, если оно достаточно
похоже на прототип этого класса, то есть на изображение, хранящееся в весах
связей нейронной сети. Если такое свойство, установленное с помощью
специального параметра сходства между двумя изображениями, имеет место,
то найденный прототип модифицируется, чтобы стать более похожим на
предъявленное сети входное изображение. При отсутствии достаточного
сходства между предъявленным изображением и прототипами всех
имеющихся классов, оно запоминается сетью как прототип нового класса. Это
возможно благодаря тому, что информация об изображениях-прототипах
хранится локально, только в весах связей одного распознающего нейрона, и
сеть имеет значительное число неиспользуемых распознающих нейронов,
избыток которых уменьшается по мере поступления новой входной
информации. Наличие избыточных распознающих нейронов является
принципиальной особенностью нейронных сетей АРТ, поскольку при их
отсутствии новые входные изображения просто теряются. Таким образом,
локальное хранение информации и наличие избыточных распознающих
нейронов позволяет запоминать новую информацию (новые образы), не
искажая или теряя уже имеющуюся [8 – 11].
Y1
...
...
Ym
W ji2
W ij1
Z1
...
Yj
G2
...
Zi
Zn
G1
R
S1
...
...
Si
Sn
Рис. 1. Архитектура нейронной сети АРТ-1
37
Основу архитектуры нейронной сети составляют три слоя нейронов:
 слой чувствительных S-нейронов, воспринимающих входную
информацию в виде черно-белых изображений или бинарных входных
векторов;
 слой бинарных интерфейсных Z-нейронов; Z- и S-элементы
объединяются в поле F1 входных обрабатывающих нейронов;
 слой распознающих Y-нейронов.
Кроме этого имеются еще три управляющих нейрона: R, G1 и G2 .
Выход каждого бинарного нейрона Si ( i  1, n ) входного слоя связан
однонаправленной связью с единичным весовым коэффициентом с бинарным
нейроном Z i ( i  1, n ) интерфейсного слоя. Выходные сигналы всех
чувствительных элементов поступают также на входы управляющих нейронов
R, G1 и G2. Каждый интерфейсный нейрон Z i ( i  1, n ) связан со всеми
элементами Y j ( j  1, m) распознающего слоя и с управляющим нейроном R.
Связи с весовыми коэффициентами Wij1 (i  1, n; j  1, m), 0  Wij1  1 передают
сигналы с выхода каждого Z-элемента на входы каждого Y-нейрона. Бинарные
связи с весовыми коэффициентами W ji2 ( j  1, m ; i  1, n; ) связывают выход
каждого распознающего нейрона со входом каждого интерфейсного нейрона.
Информация о запомненных изображениях хранится в весах связей W 1 , W 2
распознающих нейронов.
Нейроны Y-слоя с помощью дополнительной нейронной сети, на рис. 1
не показанной, образуют слой конкурирующих нейронов.
Z- и Y-нейроны получают сигналы из трех источников: Z-нейроны  от
управляющего нейрона G1 и от нейронов слоев S и Y; Y-нейроны  от
управляющих нейронов G2, R и от Z-нейронов. Z- и Y-элементы переходят в
активное состояние по правилу "два из трех", то есть только при наличии
сигналов из двух различных источников.
Для обучения дискретных нейронных обычно используется метод
быстрого обучения, при котором равновесные веса связей нейронов
определяются за одно предъявление входного изображения [9  11].
В исходном состоянии перед началом обучения все нейроны сети имеют
нулевые выходные сигналы. При подаче на вход сети первого бинарного
изображения S1  ( S11, S21 , ..., Sn1 ) S-элементы, получившие единичные входные
сигналы, переходят в активное состояние. Их единичные возбуждающие
сигналы переводят в активное состояние управляющие нейроны G1 и G2, а
также поступают на входы соответствующих интерфейсных нейронов.
Поскольку Z-нейроны переходят в активное состояние по правилу "два из
трех", то в активное состояние перейдут только те Z-элементы, которые
38
получат единичные входные сигналы как от нейрона
G1, так и от
соответствующего S-элемента. Возбуждающие сигналы с выходов Z-элементов
по связям с весами Wij1 (i  1, n; j  1, m) поступят на входы всех
распознающих нейронов. Y-нейроны в активное состояние также переходят по
правилу "два из трех", получая возбуждающие сигналы как от Z-нейронов, так
и от управляющего нейрона G2. Входные и выходные сигналы распознающих
нейронов рассчитываются по соотношениям:
n
U вхY j   Wij1 U вых Z i , U вых Y j  U вхY j ,
j  1, m .
i 1
Затем в Y-слое происходит выделение единственного нейрона J с
максимальным выходным сигналом. Если оказывается, что в Y-слое имеется
несколько элементов с одинаковым максимальным сигналом, то в качестве
нейрона-победителя выделяется Y-нейрон, имеющий минимальный индекс. В
результате латерального процесса на выходах Y-нейронов появятся следующие
сигналы: U вых YJ  1, U вых Y j  0, j  1, m , j  J .
Единичный возбуждающий сигнал нейрона-победителя YJ поступает на
входы всех интерфейсных нейронов и этот же единичный сигнал переводит в
неактивное состояние нейрон G1 . Поскольку интерфейсные элементы
переходят в активное состояние по правилу "два из трех", то единичные
выходные сигналы появятся на выходах только тех Z-нейронов, которые
получат возбуждающий сигнал как от нейрона YJ , так и от S-элемента.
Возбуждающие сигналы с выходов элементов входного слоя и тормозящие с
выходов Z-слоя поступят на входы управляющего нейрона R, который
рассчитывает параметр сходства изображений
p  Uвых Z / Uвых S 
n
(

i 1
n
U
U вых Zi ) /(
i 1
вых Si
), где
D
 норма вектора D. В зависимости от
величины параметра сходства нейрон либо переходит в активное состояние,
либо остается пассивным. При пассивном управляющем R-нейроне в сети
АРТ-1 наступает резонанс и происходит адаптация весов связей WiJ1 ,
WJi2 (i  1, n) нейрона-победителя с помощью входного изображения. Если
управляющий нейрон R  активен, то его единичный выходной сигнал
затормаживает нейрон-победитель YJ ( UвыхTJ  1 ), исключая его из участия
в соревнованиях распознающих нейронов при текущем входном изображении.
После этого в выходном слое определяется новый нейрон-победитель. Если ни
одно из изображений, хранящихся в весах связей распределенных Y-нейронов,
не оказывается близким ко входному, то все распределенные нейроны будут
39
заторможены и нейроном-победителем окажется нераспределенный элемент с
минимальным индексом, который и запомнит предъявленное изображение.
Недостатки нейронной сети АРТ-1. Поясним недостатки сети АРТ-1 с
помощью следующего примера.
Пример 1. Пусть требуется с помощью сети разделить на два класса
множество векторов: M = { S1  (1, 1, 1, 1, 0, 0, 0, 0),
S 2  (0, 1, 1, 1, 0, 0, 0, 0),
S 3  (1, 0, 1, 1, 0, 0, 0, 0),
S 4  (1, 1, 0, 1, 0, 0, 0, 0),
S 5  (1, 1, 1, 0, 0, 0, 0, 0),
S 6  (0, 0, 0, 0, 1, 1, 1, 1),
S 7  (0, 0, 0, 0, 0, 1, 1, 1),
S 8  (0, 0, 0, 0, 1, 0, 1, 1),
S 9  (0, 0, 0, 0, 1, 1, 0, 1), S10  (0, 0, 0, 0, 1, 1, 1, 0)}.
Классификация приведенных векторов может быть выполнена многими
способами. Один из наиболее напрашивающихся  отнести к первому классу
векторы S 1 , S 2 , ..., S 5 , а ко второму классу  векторы S 6 , S 7 , ..., S 10 , то
есть сформировать классы векторов, отличающихся друг от друга не более,
чем двумя компонентами. Попробуем получить эту классификацию с
помощью нейронной сети АРТ-1. Возьмем сеть с параметрами: m = 6 – число
Y-нейронов в распознающем слое сети; n = 8 – число нейронов во входном
слое сети; р = 0,5 – параметр сходства; выбирается такое числовое значения
исходя из того, что векторы S 1 , S 2 , ..., S 5 и S 6 , S 7 , ..., S 10 в каждом классе
отличаются друг от друга не более, чем двумя компонентами, а параметр
сходства рассчитывается только с помощью единичных компонент векторов;
Wij1  1 /(1  n)  0,111  начальные значения весов связей Wij1 (i  1, 8; j  1, 6) ;
W ji2 = 1  начальные значения весов связей W ji2 ( j  1, 6; i  1, 8) .
В процессе обучения нейронной сети получаются следующие результаты.
Последовательное предъявление нейронной сети первых пяти векторов
S 1 , S 2 , ..., S 5 и расчет равновесных весов связей [9  11] приведет к
следующим матрицам весовых коэффициентов:
W1 
0
0,500 0,111 0,111 0,111 0,111
0
0,500 0,111 0,111 0,111 0,111
0 0 1 1 0 0 0 0
1 1 0 0 0 0 0 0
1 1 1 1 1 1 1 1
0,500
0
0,111 0,111 0,111 0,111
0,500
0
0,111 0,111 0,111 0,111
0
0
0,111 0,111 0,111 0,111
0
0
0,111 0,111 0,111 0,111
1 1 1 1 1 1 1 1
0
0
0,111 0,111 0,111 0,111
1 1 1 1 1 1 1 1
0
0
0,111 0,111 0,111 0,111
40
, W2 
1 1 1 1 1 1 1 1
.
Нетрудно проверить, что последующая подача на вход нейронной сети
как векторов S 6 , S 7 , ..., S 10 , так и векторов S 1 , S 2 , ..., S 5 не приведет к
изменению первых двух столбцов матрицы W 1 и первых двух строк матрицы
W 2 . Таким образом, анализ результатов примера показывает, что сеть АРТ-1
не может решить поставленную задачу классификации векторов
S 1 , S 2 , ..., S 10 . Дополнительный анализ показывает, что разбиение векторов
S 1 , S 2 , ...,
зависит и
Например,
S 1 , S 2 , ...,
S 5 на два класса при заданной величине параметра сходства
от порядка их предъявления в обучающей последовательности.
нетрудно получить следующие классификации K r векторов
S5 :
K 1  {{S 1 , S 2 , S 3}, {S 4 , S 5}} (получена в приведенных расчетах);
K 2  {{S 1 , S 2 , S 4 }, {S 3 , S 5}} ; K 3  {{S 1 , S 2 , S 5 }, {S 3 , S 4 }} ;
K 4  {{S 1 , S 3 , S 5 }, {S 2 , S 4 }} и т.д.
Неудача с решением задачи классификации указанного множества
векторов
связана
с
особенностями
архитектуры
и
алгоритма
функционирования нейронной сети АРТ-1. Во-первых, сеть в весах связей
распознающего нейрона запоминает пересечение бинарных входных векторов.
Во-вторых, близость бинарных векторов определяется с помощью параметра
сходства, учитывающего только единичные элементы сравниваемых векторов.
В анализируемом примере пересечением бинарных векторов S 1 , S 2 , ..., S 5 (а
также векторов
компонента:
S 6 , S 7 , ...,
S 10 ) является вектор со всеми нулевыми
S 0  S1  S 2  S 3  S 4  S 5  S16  S 7  S 8  S 9  S10  (0, 0, 0, 0, 0, 0, 0, 0).
Таким образом, при пересечении рассматриваемых множеств векторов
полностью утеряна информация об единичных компонентах бинарных
векторов. Запоминание информации в виде пересечения входных бинарных
векторов или изображений в нейронной сети также приводит к потере
информации. При малых значениях параметра сходства может теряться
основная часть информации по классифицируемым или распознаваемым
изображениям. В связи с этим возникает идея о запоминании информации в
виде объединения, а не пересечения бинарных изображений или векторов. В
этом случае в рассматриваемом примере имеем: S1  S 2  S 3  S 4  S 5  S1.
Запоминание единственного вектора S 1 приводит к получению матриц
весов связей W 1 , W 2 , с помощью которых могли бы правильно
41
распознаваться первые пять входных изображений, если бы после
предъявления входных векторов не было адаптации весов связей, меняющей
память сети.
Однако запоминание объединения бинарных векторов без учителя также
имеет свои недостатки, поскольку могут легко появляться матрицы весов
связей, имеющих в своих столбцах (матрица W 1 ) или строках (матрица W 2 )
для распределенных Y-нейронов минимальное число нулевых элементов или
даже не имеющих их совсем. Поэтому при запоминании объединения
бинарных векторов необходима коррекция работы алгоритма или участие
учителя [10, 11].
Примеры успешного использования при обучении нейронной сети
пересечения или объединения входных изображений указывают на то, что,
видимо, могут быть получены обучающие изображения и с помощью
комбинации этих операций, а также с использованием других операций над
бинарными множествами, в частности, операции "НЕ".
Таким образом, можно сделать вывод о том, что адаптация весов связей
сети в том виде, в котором она применяется в нейронной сети АРТ-1, может
быть недостатком сети. Недостатком, как показал рассмотренный пример,
может быть и отсутствие учителя.
Алгоритмы обучения без адаптации весов связей распределенных
распознающих нейронов. Вначале покажем целесообразность использования
в дискретной нейронной сети АРТ режимов обучения без адаптации весов
связей распределенных распознающих Y-нейронов. Прежде всего, на примерах
проиллюстрируем работоспособность и достоинства предлагаемого метода
обучения сети.
Пример 2. Пусть требуется с помощью нейронной сети АРТ-1 при
величине параметра сходства p = 0,5 выполнить классификацию множества
векторов:
S1  (1, 1, 1, 1, 0, 0, 0, 0),
S 2  (0, 1, 1, 1, 0, 0, 0, 0),
S 3  (1, 0, 1, 1, 0, 0, 0, 0),
S 4  (1, 1, 0, 1, 0, 0, 0, 0),
S 5  (1, 1, 1, 0, 0, 0, 0, 0),
S 6  (0, 0, 0, 0, 1, 1, 1, 1),
S 7  (0, 0, 0, 0, 0, 1, 1, 1),
S 8  (0, 0, 0, 0, 1, 0, 1, 1),
S 9  (0, 0, 0, 0, 1, 1, 0, 1),
S10  (0, 0, 0, 0, 1, 1, 1, 0), S11  (0, 0, 1, 0, 0, 0, 0, 0), S12  (0, 0, 0, 1, 0, 0, 0, 0),
S13  (0, 0, 0, 1, 1, 0, 0, 0), S14  (0, 0, 0, 0, 1, 0, 0, 0), S15  (0, 0, 1, 0, 0, 1, 0, 0),
где первые десять векторов взяты из примера 1.
Для классификации возьмем сеть АРТ-1, начальные значения весов
связей Wij1 , W ji2 ( j  1, 7; i  1, 8) и параметры n, p, которой совпадают с
параметрами сети примера 1, а число Y-нейронов сети равно семи.
42
Анализ примера 1 показывает, что для определения числа выделенных
классов входных векторов достаточно одной из матриц W 1 , W 2 , поэтому в
дальнейшем будем использовать только матрицу W 2 как более компактную.
В процессе обучения нейронной сети получаются следующие результаты.
Как следует из результатов примера 1, после предъявления первых десяти
изображений S 1  S 10 матрица W 2 весовых коэффициентов будет иметь вид:
0 01 1 0 0 0 0
1 10 0 0 0 0 0
0 0 0 0 0 0 1 1
W2  0 0 0 0 1 1 0 0 .
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
Анализ матрицы W 2 показывает, что первые десять изображений
разбиты
на
четыре
класса.
После
предъявления
изображения
11
S  (0, 0, 1, 0, 0, 0, 0, 0) получим, что победителем будет нейрон Y1 .
Адаптации весовых коэффициентов этого нейрона уменьшит в первой строке
матрицы W 2 число ненулевых значений весов связей до одного.
Последовательное
предъявление
нейронной
сети
изображений
S 12  S 15 , S 1 приводит к распределению нейронов Y5 и Y6. Затем только при
предъявлении на вход сети изображения S 9  (0, 0, 0, 0, 1, 1, 0, 1) произойдет
распределение седьмого Y-нейрона и появлению в седьмой строке матрицы
W 2 пяти нулевых элементов: w71  w72  w73  w74  w77  0 . После
предъявления изображения S10  (0, 0, 0, 0, 1, 1, 1, 0) матрица W 2 примет вид
0 0 1 0 0 0 0 0
1 1 0 0 0 0 0 0
0 0 0 0 0 0 1 1
W2  0 0 0 0 1 0 0 0 .
0 0 0 1 0 0 0 0
0 0 1 1 0 0 0 0
0 0 0 0 1 1 0 1
43
Последующие предъявления изображений
S 11  S 15 ,
S 1  S 10 уже не
2
изменят элементы матрицы W .
Таким образом, с помощью нейронной сети АРТ-1 при величине
параметра сходства p = 0,5 за две эпохи выполнена классификация исходного
множества векторов. Получено семь классов, однако необходимо отметить
следующее: в множествах {S1, S 2 , ..., S 5} , {S 6 , S 7 , ..., S10} векторы отличаются
друг от друга не более, чем двумя единичными компонентами, то есть при по
парном сравнении векторов параметр сходства не меньше 0,5. Поэтому было
бы логичнее, чтобы на основе каждого множества был сформирован один, а не
два класса изображений.
Проанализируем полученную матрицу W 2 . Сопоставление элементов
строк матрицы W 2 с векторами S 11, S 12 , S 14 показывает, что три класса
изображений сформированы этими векторами, имеющими минимальное число
единичных компонент. Четыре остальных строки матрицы W 2 сформированы
парами изображений, имеющих по три единичных компонента. Отсюда
следует предположение, что сеть АРТ можно обучать без адаптации весов
связей путем предъявления некоторой упорядоченной последовательности
входных изображений: S k , S k 1, S k  2 , ..., S q 1, S q .
Порядок предъявления изображений определяется величиной нормы
входного вектора, причем первыми сети предъявляются изображения с
минимальной нормой, то есть S k  S k 1  S k 2  ...  S q1  S q .
Пример 3. Выполним обучение сети АРТ с параметрами, заданными в
примере 2, последовательностью изображений S 11, S 12 , S 14 , S 13 , S 15 , S 2  S 5 ,
S 7  S 10 , S 1, S 6 , упорядоченных по величине их нормы. При этом полагаем,
что при наступлении резонанса адаптации весов связей не происходит.
S 11, S 12 , S 14
При
предъявлении
изображений
последовательно
распределяются распознающие нейроны Y1, Y2 , Y3 и матрица весов связей
приобретает вид
0
0
0
2
W  1
0
0
0
1
10
01
0 0
1 1
0
0
1
1
0
0
0
1
0
0
0
1
0
0
0
1 .
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
44
Входные изображения S13  (0, 0, 0, 1, 1, 0, 0, 0), S15  (0, 0, 1, 0, 0, 1, 0, 0)
при величине параметра сходства p = 0,5 относятся соответственно ко
второму и первому классу изображений и не вызывают изменений в матрице
W 2 . Входное изображение S 2  (0, 1, 1, 1, 0, 0, 0, 0) вызывает распределение
четвертого Y-нейрона и соответствующие изменения в четвертой строке
матрицы весовых коэффициентов. Предъявление изображений S 3  S 5 не
вызывает распределения новых Y-нейронов, поскольку все изображения при
p = 0,5 относятся к четвертому классу. Пятый нейрон распознающего слоя
распределяется
при
поступлении
на
вход
сети
изображения
S 7  (0, 0, 0, 0, 0, 1, 1, 1) . Это приводит и к изменению матрицы W 2
0
0
0
2
W  0
0
0
0
0
1
0
10
01
0 0
1 1
0 0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
0 .
1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
Нетрудно убедиться, что предъявление изображений S 8  S 10 , S 1 , S 6 , а
также любых других из входной последовательности не приводит к
изменению матрицы W 2 .
Таким образом, при данном способе обучения дискретной нейронной
сети классификация векторов выполнена за одну эпоху. При этом она более
соответствует исходным данным, чем классификация векторов, полученная в
примере 2, то есть с помощью обычно алгоритма нейронной сети АРТ-1.
Следовательно, алгоритм обучения дискретной сети нейронной сети АРТ
последовательностью изображений, упорядоченных по возрастанию величины
их нормы, и без адаптации весов связей при наступлении резонанса
действительно работоспособен.
Теперь покажем на примере целесообразность использования в
дискретной нейронной сети АРТ режима обучения без адаптации весов связей
распределенных
распознающих
Y-нейронов,
когда
предъявляется
k
k 1
k 2
последовательность входных изображений: S , S , S , ..., S q 1 , S q ,
упорядоченных по убыванию величины нормы входного вектора, то есть
S k  S k 1  S k 2  ...  S q1  S q .
45
Пример 4. Выполним обучение нейронной сети АРТ с параметрами,
заданными в примере 2, последовательностью изображений S 1 , S 6 ,
S 2  S 5 , S 7  S 10 , S 13, S 15, S 11, S 12 , S 14 , упорядоченных
по
возрастанию
величины их нормы. При этом полагаем, что при наступлении резонанса
адаптации весов связей не происходит. Параметр сходства в этой сети
определим отношением p  U вых Z / U вых Y , то есть зависимостью, отличной
от параметра сходства в сети АРТ-1. Это связано с тем, что число единичных
компонент во входных изображениях никогда не превосходит число
единичных компонент, хранящихся в весах связей победившего Y-нейрона.
При предъявлении изображений S 1 , S 6 последовательно распределяются
распознающие нейроны Y1, Y2 . Входные изображения S 2  S 5 , S 7  S 10 при
величине параметра сходства p = 0,5 относятся соответственно к первому и
второму классу изображений и не вызывают изменений в матрице W 2 .
Входные изображения
S13  (0, 0, 0, 1, 1, 0, 0, 0), и S15  (0, 0, 1, 0, 0, 1, 0, 0)
вызывают
распределение
третьего
и
четвертого
Y-нейронов
и
соответствующие изменения в матрице весовых коэффициентов
1
0
0
2
W  0
1
1
0
0
0
1
1
0
0
1
1
1
0
1
0
1
0
1
1
0
1
0
1
0
1
1
0
1
0
0
1
0
1
0
0 .
1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
Предъявление
0, 0, 0, 0),
изображений
S14  (0, 0, 0, 0, 1, 0, 0, 0)
S11  (0, 0, 1, 0, 0, 0, 0, 0),
не
вызывает
S12  (0, 0, 0, 1,
распределения
12
распознающих Y-нейронов, поскольку изображения S , S
14
новых
при p = 0,5
относятся к третьему классу, а изображение S  к четвертому.
Нетрудно убедиться, что последующие предъявления любых
изображений из входной последовательности не приводит к изменению
матрицы W 2 .
Таким образом, при данном способе обучения дискретной нейронной
сети классификация векторов выполнена за одну эпоху. При этом она не
противоречит здравому смыслу и не уступает классификациям векторов,
полученных в примерах 2 и 3.
11
46
Успешное функционирование алгоритмов обучения нейронной сети АРТ
последовательностями изображений, упорядоченных по убыванию или
возрастанию величины их нормы и без адаптации весов связей, указывает на
возможность и алгоритмов обучения сети АРТ последовательностями
изображений,
упорядоченных
учителем.
Причем
в
обучающей
последовательности могут использоваться подпоследовательности как с
возрастанием, так и с убыванием нормы входных изображений.
Работоспособность таких алгоритмов легко проверить на конкретных
примерах.
Таким образом, предложен новый метод обучения дискретных нейронных
сетей АРТ без адаптации весов связей сети в процессе обучения и на его
основе разработан ряд новых алгоритмов функционирования дискретных
нейронных сетей адаптивной резонансной теории в режиме обучения. Каждый
из предложенных алгоритмов имеет свои достоинства (но не лишен и
недостатков), поэтому целесообразно совместное использование новых
алгоритмов в одной сети АРТ. В связи с этим предлагается дискретная
нейронная сеть АРТ с базовой архитектурой сети АРТ-1, но с множеством
алгоритмов ее функционирования в режимах обучения:
1. Алгоритм функционирования сети АРТ-1.
2. Алгоритмы функционирования сети, в которых входные изображения
не могут адаптировать веса связей распределенных распознающих нейронов
после наступления резонанса.
2.1. Алгоритм обучения дискретной сети АРТ последовательностью
изображений, упорядоченных по возрастанию величины их нормы, причем,
первыми сети предъявляются изображения с минимальной нормой.
2.2. Алгоритм обучения дискретной сети АРТ последовательностью
изображений, упорядоченных по убыванию величины их нормы, причем,
первыми сети предъявляются изображения с максимальной нормой.
2.3. Алгоритм обучения дискретной сети АРТ последовательностями
изображений,
упорядоченных
учителем,
причем
в
обучающей
последовательности используются подпоследовательности как с возрастанием,
так и с убыванием нормы входных изображений.
2.4. Алгоритм обучения дискретной сети нейронной сети АРТ, в котором
начальные значения весов связей задаются учителем, использующим
комплексные входные изображения, которые получены из исходных с
помощью логических операций "И", "ИЛИ", "НЕ", других математических
операций, эвристик или комбинации указанных способов формирования
обучающих изображений.
3. Алгоритмы обучения, использующие совместное применение
алгоритма обучения сети АРТ-1 и алгоритмов обучения без адаптации весов
связей нейронной сети при наступлении резонанса.
47
Выводы. Проанализированы недостатки известных нейронных сетей
адаптивной резонансной теории, не позволяющие их эффективно использовать
в реальных системах управления и распознавания:
 сеть в весах связей распознающего нейрона запоминает пересечение
бинарных входных векторов, поэтому невозможно компактное хранение
больших массивов изображений, относящихся к одному классу;
 конечный результат обучения дискретной сети АРТ может зависеть от
последовательности предъявления изображений;
 адаптация весов связей распределенных распознающих Y-нейронов сети
в том виде, в котором она применяется в нейронной сети АРТ-1, часто не
позволяет решать даже тривиальные задачи классификации и обучения, то
есть может быть существенным недостатком сети;
 отсутствует режим обучения сетей с учителем, что сужает класс
решаемых с помощью сети задач классификации и распознавания.
Впервые разработан метод обучения дискретных нейронных сетей АРТ
без адаптации весов связей распределенных распознающих нейронов сети в
процессе обучения и на его основе предложен ряд новых алгоритмов
функционирования дискретных нейронных сетей адаптивной резонансной
теории в режиме обучения. Каждый из предложенных алгоритмов имеет свои
достоинства, поэтому целесообразно совместное использование новых
алгоритмов в одной сети АРТ. В связи с этим предлагается дискретная
нейронная сеть АРТ с базовой архитектурой сети АРТ-1, но с множеством
возможных алгоритмов ее функционирования в режиме обучения.
Список литературы: 1. Wang Bielei Zhao, Lin Tan Zhenfan. Neural network based online selflearning adaptive PID control // Proceedings of the 3rd World Congress on Intelligent Control and
Automation, Heffei, China, 28 June – 2 July 2000. – Vol. 2. – P. 908 – 910. 2. Комашинский В.И.,
Смирнов Д.А. Нейронные сети и их применение в системах управления и связи. – М.: Горячая
линия – Телеком, 2002. – 94 с. 3. Neural networks for control / Edited by W. Thomas Miller III, Richard
S. Sutton, and Paul J. Werbos,  Cambridge, Massachusetts, London: MIT Press, 1996.  524 P.
4. Барский А.Б. Нейронные сети: распознавание, управление, принятие решений. – М.: Финансы и
статистика, 2004. – 176 с. 5. Галушкин А.И. Нейрокомпьютеры и их применение на рубеже
тысячелетий в Китае. В 2-х томах. Том 2. – М.: Горячая линия – Телеком, 2004. – 464 с.
6. Grossberg S. Competitive learning: From interactive activation to adaptive resonance // Cognitive
Science. – 1987. – Vol. 11. – P. 23 – 63. 7. Carpenter G.A., Grossberg S. A massively parallel
architecture for selforganizing neural pattern recognition machine // Computing, Vision, Graphics and
Image Processing. – 1987. – Vol. 37. – P. 54 – 115. 8. Дмитриенко В.Д., Корсунов Н.И. Основы
теории нейронных сетей. – Белгород: БИИММАП, 2001. – 159 с. 9. Fausett L. Fundamentals of
Neural Networks. Architectures, Algorithms and Applications. – New Jersey: Prentice Hall International,
Inc., 1994. – 461 p. 10. Дмитриенко В.Д., Расрас Р.Д., Сырой А.М. Специализированное
вычислительное устройство для распознавания динамических режимов объектов управления
// Інформаційно-керуючі системи на залізничному транспорті.  2002.  № 1.  С. 15  22.
11. Моделирование и оптимизация систем управления и контроля локомотивов / Носков
В.И., Дмитриенко В.Д., Заполовский Н.И., Леонов С.Ю. – Х.: ХФИ Транспорт Украины,
2003. – 248 с.
Поступила в редакцию 20.03.2006
48
УДК 688.80
Д.И. ЕВСТРАТ, канд. техн. наук, ХИТВ НТУ "ХПИ" (г. Харьков),
Ю.И. КУШНЕРУК, канд. техн. наук, ВИ ВВ МВДУ (г. Харьков),
С.А. СТАРОДУБЦЕВ, канд. воен. наук, ВИ ВВ МВДУ (г. Харьков),
Н.Д. ТКАЧЕНКО, ХИТВ НТУ "ХПИ" (г. Харьков)
ОПТИМИЗАЦИЯ ПЛАНА МАРШРУТИЗАЦИИ
ГРУЗОПЕРЕВОЗОК И РАСПРЕДЕЛЕНИЯ ТРАНСПОРТНЫХ
СРЕДСТВ ПО МАРШРУТАМ ПЕРЕВОЗОК
Запропоновано математичні моделі оптимального плану маршрутизації вантажоперевезень та
розподілу транспортних засобів за маршрутами перевезень за критерієм мінімуму сумарних затрат
на перевезення з урахуванням техніко-експлуатаційних параметрів транспортних засобів та стану
доріг на транспортної мережі.
The authors propose mathematical optimal scheme models of the freight traffic routing and transport
facilities distribution according to minimum summarized cost criterion including technical and
operational characteristic of transport facilities and road status in transportation network.
Постановка проблемы. Управление перевозками грузов невозможно без
качественного планирования, которое должно быть направлено на
эффективное использование транспортных средств. Ключевыми задачами
управления перевозками являются маршрутизация грузоперевозок и
распределение транспортных средств по маршрутам при условии выполнения
плана перевозок в соответствии с выбранным критерием оптимизации. При
решении данных задач необходимо учитывать информацию о транспортной
сети, а также технико-эксплуатационные параметры транспортных средств,
такие как: грузоподъёмность, коэффициенты готовности и статического
использования транспортных средств, количество рейсов и себестоимость
одного рейса, выполняемого каждым транспортным средством, и др.
Основным критерием оптимизации в условиях рыночных отношений
становятся минимальные затраты на транспортировку грузов.
Многофакторность влияния на процесс грузоперевозок обуславливает
разнообразность подходов к решению данной задачи.
Анализ литературы показывает, что большинство подходов предлагают
математический аппарат, который позволяет рассчитать определенные
показатели в конкретных условиях перевозок без поиска оптимальных
решений. Так в [1] приводится общий алгоритм планирования грузовых
автомобильных перевозок. Методам решения транспортных задач с
использованием логистического подхода уделяется внимание в работах [2, 3].
Задача управления цепочками поставок в системе материального обеспечения
воинских подразделений решается в [4].
49
Цель статьи – решение задачи определения оптимального плана
маршрутизации грузоперевозок и распределения транспортных средств по
маршрутам перевозок по критерию минимума суммарных затрат на перевозку
с учетом технико-эксплуатационных параметров транспортных средств и
состояния дорог на транспортной сети.
Основной материал. Введем следующие обозначения:
D  d ij
p ,p
– матрица однозвенных расстояний между пунктами
транспортной сети;
p – количество пунктов транспортной сети;
m – количество складов для хранения однородного продукта;
n – количество пунктов назначения (потребителей);
ai (i  1, m) – запасы однородного продукта на i -м складе;
b j ( j  1, n) – заявка на однородный продукт j -го пункта назначения;
S – число типов транспортных средств;
L – количество маршрутов, соединяющих склады с потребителями;
Csl (s  1, S , l  1, L) – себестоимость одного рейса, выполняемого
транспортным средством s -го типа на l -м маршруте;
K s (s  1, l ) – коэффициент готовности транспортного средства;
 s (s  1, l ) – коэффициент статического использования транспортного
средства;
qs (s  1, l ) – грузоподъёмность транспортного средства s -го типа;
N s (s  1, S ) – количество транспортных средств s -го типа.
С учётом возможных вариантов схем движения, ограничений,
накладываемых грузоподъёмностью транспортных средств, их готовностью,
типом и количеством определение оптимального плана перевозок и загрузки
транспортных средств можно представить в виде алгоритма (рис.).
Формирование базы данных
Определение матрицы кратчайших
расстояний между пунктами сети
Закрепление складов за потребителями
Распределение транспортных средств по
маршрутам
Рис. Алгоритм планирования грузоперевозок
50
В первом блоке формируется база данных, включающая информацию о
расстояниях между пунктами транспортной сети, сведения о количестве
транспортных средств каждого типа, их грузоподъёмности и коэффициентах
готовности, количестве и месторасположении складов и потребителей;
себестоимости рейсов и др.
Во втором блоке находится матрица кратчайших расстояний D*  d ij*
между пунктами сети по алгоритму Беллмана-Шимбела [5]:
d ij2k  min (d ik  d kj ), k  1, 2, ... .
1 p
(1)
При изменении состояния дорог на транспортной сети оперативно
изменяется информация о матрице D .
В третьем блоке решается классическая транспортная задача [1]:
m
n
 d
*
ij xij
 min;
i 1 j 1
n
x
m
ij
 ai , i  1, m,
j 1
x
ij
 b j , j  1, n;
i 1
(2)
xij  [ xij ]  0, i  1, m, j  1, n;
m

i 1
Решением
X 
*
x*ij
этой
n
ai 
b .
j
j 1
задачи
является
матрица
транспортных
потоков
между складами и потребителями. Данная задача достаточно
m ,n
просто решается процедурой "Поиск решения" в MS Exсel [6].
На основании решения данной задачи формируется множество
кратчайших маршрутов, соединяющих склады с потребителями, которые
занумерованы от 1 до L* , где L* – количество соответствующих маршрутов.
В четвертом блоке решается задача распределения транспортных средств
имеющихся типов по маршрутам, найденным в третьем блоке:
S
L*

s 1 l 1
L*
y
sl
S
C sl y sl  min,
 q y
s s sl
 Ql , l  1, L* ;
s 1
(3)
 K s N s , s  1, S , y sl   y sl   0, s  1, S , l  1, L* ,
l 1
51
где Ql (l  1, L* ) – объём перевозок груза по l -му маршруту, определяемый в
результате решения задачи (2); ysl (s  1, S , l  1, L* ) – искомое количество
транспортных средств s -го типа, назначаемых на l -й маршрут. Задача
транспортного типа (3) также с успехом может быть решена средствами MS
Excel.
Выводы. Эффективное управление процессом грузоперевозок требует
поиска оптимальных решений на этапе планирования перевозок. В результате
решения задачи разработаны математические модели оптимального плана
маршрутизации грузоперевозок и распределения транспортных средств по
маршрутам перевозок по критерию минимума суммарных затрат на перевозку.
Особенностью моделей является то, что в них учтены техникоэксплуатационные параметры транспортных средств и состояние дорог на
транспортной сети, что позволяет адекватно отобразить реальный процесс
транспортировки грузов.
Дальнейшее развитие работы будет связано с решением следующих
задач:
1. Построение модели сравнения пунктов назначения с целью
m
определения коэффициентов их важности для случая когда

i 1
n
ai 
b
j
.
j 1
2. Реализация учета пополнения однородного продукта на складах за счет
поставок производителей.
3. Непорожный возврат транспортных средств.
Список литературы: 1. Лукинский В.С. Модели и методы теории логистики / Под ред.
В.С. Лукинского. – СПб.: Питер, 2003. – 176 с. 2. Миротин Л.Б., Некрасов А.Г. Логистика
интегрированных цепочек поставок. – М.: Экзамен, 2003. – 256 с. 3. Кристофер М. Логистика и
управление цепочками поставок. – СПб.: Питер, 2004. – 316 с. 4. Евстрат Д.И., Биткова Т.В.,
Горюнов В.И. Управление цепочками поставок в системе материального обеспечения воинских
подразделений. Збірник доповідей та повідомлень науково-практичної конференції. – Харків:
ХІТВ НТУ "ХПІ", 2005 – С. 20 – 26. 5. Филлипс Д., Гарена-Диас А. Методы анализа сетей. – М.:
Мир, 1984. – 496 с. 6. Гельман В.Я. Решение математических задач средствами MS Excel:
Практикум. – СПб.: Питер, 2003. – 240 с.
Поступила в редакцию 21.04.2006
52
УДК 681.513:620.1
Н.И. ЗАПОЛОВСКИЙ, канд. техн. наук, НТУ "ХПИ",
В.И. НОСКОВ, канд. техн. наук, ГП "Электротяжмаш",
Н.В. МЕЗЕНЦЕВ, НТУ "ХПИ",
Н.В. ГОРБАЧ, НТУ "ХПИ"
РАЗРАБОТКА И ИССЛЕДОВАНИЕ СИСТЕМЫ УПРАВЛЕНИЯ
ЭЛЕКТРОПРИВОДОМ ПЕРЕМЕННОГО ТОКА С
ИСПОЛЬЗОВАНИЕМ МЕТОДОВ НЕЧЕТКОЙ ЛОГИКИ
Розглянуто побудову системи керування електроприводом змінного струму з використанням
методів нечіткої логіки. Показано, що використання регулятора, побудованого на основі методів
нечіткої логіки, дозволяє зменшити величину перерегулювання, поліпшити динамічні
характеристики системи керування. Наведено результати моделювання досліджуваної системи в
середовищі MATLAB.
The construction of the control of electric drive of alternating current system with the use of methods of
fuzzy logic is considered. It is shown that the use of regulator, built on the basis of methods of fuzzy logic,
allows to decrease the size of overcorrection, improve dynamic descriptions of the control system. The
results of the design of the explored system in the environment of MATLAB are resulted.
Постановка проблемы. Современный тяговый электропривод
представляет собой конструктивное единство электромеханического
преобразователя энергии (двигателя), преобразователя частоты и устройства
управления. Рост степени интеграции в микропроцессорной технике и переход
от микропроцессоров к микроконтроллерам со встроенным набором
специализированных периферийных устройств привел к замене аналоговых
систем управления приводами на системы непосредственного цифрового
управления. Переход к широкодиапазонным быстродействующим приводам
транспортных средств требует применения более сложных систем векторного
управления, которое является наиболее точным в динамике и статике, а также
более экономичным.
Как при частотном, так и при векторном способе управления, необходимо
осуществлять управление процессом разгона локомотива с учетом протекания
электромагнитных процессов и оптимизации энергетических затрат, что
требует, в свою очередь, создания эффективных систем управления. Одним из
критериев качества протекания электромагнитных процессов является
величина перерегулирования, которая не должна превышать некоторого
максимального значения в переходных режимах. В последние годы решение
этих задач предлагается выполнять с использованием современных
технологий, в основе которых лежат методы анализа и синтеза сложных
технических систем, в частности, систем векторного управления и систем
нечеткого управления, используя при этом прямое цифровое управление
моментом. Отличительной особенностью этих решений является предельно
53
высокое быстродействие систем управления, реализованных, как правило, на
базе цифровых регуляторов или регуляторов, работающих на принципах
нечеткой логики.
Анализ литературы. В работах [1 – 4] рассмотрены методы синтеза
систем управления на основе нечеткой логики и нейронечетких сетей, которые
интенсивно развиваются в последнее десятилетие. Здесь, с одной стороны,
нечеткие системы управления используются для объектов управления, модель
которых неизвестна, а с другой – как альтернатива классическим системам
управления. Показано, что важным достоинством нечетких систем управления
является возможность их обучения на примерах. Здесь же приведен ряд
возможных архитектур для построения нечетких систем управления.
Построение
систем
векторного
управления
асинхронными
электроприводами рассмотрено в ряде публикаций [5 – 7]. В [5, 6]
анализируются общие принципы векторного управления электроприводами, в
частности, построение систем векторного управления с использованием
стандартных П-, ПИ-, ПИД-регуляторов. Наиболее полно способы применения
современных средств искусственного интеллекта (нечеткой логики,
нейронных сетей) в управлении электроприводами описаны в работах [7, 8].
Однако здесь недостаточно внимания уделено вопросам построения систем
управления с использованием методов нечеткой логики для конкретных типов
электроприводов и нет сравнительного анализа систем управления на основе
нечеткой логики с известными системами, содержащими классические
регуляторы.
Целью статьи является разработка системы управления с
использованием методов нечеткой логики для электропривода дизель-поезда с
тяговыми асинхронными двигателями и проведение сравнительного анализа с
помощью
моделирования
динамических
характеристик
систем
с
разработанным и стандартным ПИ-регулятором.
Реализация решения задачи синтеза. На рис. 1 приведена структура
системы векторного управления тяговым двигателем электропривода дизельпоезда с использованием нечеткого контроллера по угловой скорости
двигателя. Здесь: ω зp – сигнал задания скорости вращения ротора тягового
асинхронного двигателя; БВОП – блок вычисления ошибки и ее производной;
БИ – блок интегрирования; GE-1, GC-1, GU – блоки умножения (деления) на
масштабные коэффициенты; НК – нечеткий контроллер; ПНЗ – блок перехода к
нечетким значениям; БП – база правил для нечеткого контроллера; БПП – блок
применения правил; БД – база данных; ПЧЗ – блок перехода к четким
значениям; БВУ – блок векторного управления; АД – асинхронный двигатель.
Сигналы ошибки и производной ошибки преобразуются блоками GE-1 и GC-1 в
соответствующие сигналы в относительных единицах e и ce путем деления на
масштабные коэффициенты. Аналогично, выходной управляющий сигнал u
54
зд
(для системы с векторным управлением соответствует току задания i qs
)
вычисляется путем умножения выходного сигнала в относительных единицах
du на масштабный коэффициент GU, с последующим его интегрированием
блоком БИ для получения u.
e
НК
БП
du
GE-1
ω зp
-
БВОП
GC-1
ce
ПНЗ
БПП
ПЧЗ
GU
u
БИ
ωp
БВУ
АД
БД
Рис. 1. Структура нечеткого контроллера в системе управления с обратной связью
На вход нечеткого контроллера поступают два сигнала: е и се. Нечеткий
контроллер, на основании значения сигнала ошибки е по угловой скорости и
сигнала ошибки по производной угловой скорости се, изменяет выходной
сигнал du так, что бы текущая скорость ω p соответствовала задаваемой
скорости ω зд
p .
Выходной сигнал du нечеткого контроллера в системе векторного
управления асинхронным двигателем электропривода соответствует величине
зд
тока задания iqs
[6]. После его интегрирования блоком БИ получаем среднее
зд
значение сигнала u, пропорционального току задания i qs
.
Для описания нечеткого контроллера используем понятия лингвистической
и нечеткой переменной [1].
Определение 1. Лингвистической переменной называется пятерка <, T, X,
G, M>, где  – наименование лингвистической переменной; T – терм-множество
или множество словесных значений, представляющих наименование нечетких
переменных, областью определения которых является базовое множество Х; G –
синтаксическая процедура, позволяющая оперировать с элементами множества
Т, например, порождать новые термы; М – семантическая процедура,
позволяющая превращать каждый новый терм (значение) лингвистической
переменной, полученный с помощью синтаксической процедуры G, в нечеткую
переменную.
Вербальные (или словесные) значения лингвистической переменной
описываются нечеткими переменными.
55
~
Определение 2. Нечеткой переменной называется тройка <, X, A >, где
 – название нечеткой переменной; Х – базовое множество (область определения
~
); A  μ 2 ( x ) | x  X
– нечеткое множество на Х (АХ), задающее


ограничения на значение нечеткой переменной .
Введем следующие лингвистические пременные:
Е – сигнал ошибки по угловой скорости; Е = <сигнал ошибки по угловой
скорости, ТЕ = {Z1 – нулевой сигнал ошибки; NS1 – небольшой отрицательный;
NM1 – средний отрицательный; NB1 – большой отрицательный; PS1 –
небольшой положительный; РM1 – средний положительный; РB1 – большой
положительный}, Х = [–1, 1], G, M>;
СЕ – сигнал ошибки по производной угловой скорости; СЕ = <сигнал
ошибки по производной угловой скорости, ТCE = {Z2 – нулевой сигнал по
производной ошибки; NS2 – небольшой отрицательный; NM2 – средний
отрицательный; NB2 – большой отрицательный; PS2 – небольшой
положительный; РM2 – средний положительный; РB2 – большой
положительный}, Х = [–1, 1], G, M>;
DU – сигнал нечеткого управления, DU = < сигнал нечеткого управления,
ТU = {Z3 – нулевой сигнал управления; NVS3 – очень малый отрицательный; NS3
– небольшой отрицательный; NM3 – средний отрицательный; NB3 – большой
отрицательный; PVS3 – очень малый положительный; РS3 – небольшой
положительный; РM3 – средний положительный; РB3 – большой
положительный}, Х = [–1, 1], G, M>.
На рис. 2 приведены функции принадлежности нечетких лингвистических
переменных Е, СЕ, DU. Областью определения всех нечетких переменных
является интервал [–1, 1] относительных значений соответственно сигналов
ошибки по угловой скорости и по производной угловой скорости и по сигналу
управления.
Формирование выходного сигнала нечетким контроллером осуществляется
на основе нечетких правил, представленных в табл.
Таблица
E
CE
NB2
NM2
NS2
Z2
PS2
PM2
PB2
NB1
NM1
NS1
Z1
PS1
PM1
PB1
NB3
NB3
NB3
NM3
NS3
NVS3
Z3
NB3
NB3
NM3
NS3
NVS3
Z3
PVS3
NB3
NM3
NS3
NVS3
Z3
PVS3
PS3
NM3
NS3
NVS3
Z3
PVS3
PS3
PM3
NS3
NVS3
Z3
PVS3
PS3
PM3
PB3
NVS3
Z3
PVS3
PS3
PM3
PB3
PB3
Z3
PVS3
PS3
PM3
PB3
PB3
PB3
56
μ NB1
μ NM1
-1
-0,8 -0,6 -0,4 -0,2
μ NB2
μ NM 2
-1
μ(e)
μ Z1 μ PS1
μ NS1
0
(а)
e0 0,2 0,4
μ(ce)
μ Z 2 μ PS 2
μ NS 2
-0,8 -0,6 -0,4 ce0-0,2 0
μ PM1
0,2
0,6
μ PB1
0,8
μ PM 2
0,4
0,6
1
e
μ PB2
0,8
1
ce
(б)
μ NB3
-1
μ NM 3
μ(du )
μ NS 3 μ NVS3 μ Z 3 μ PVS3 μ PS3 μ PM 3
-0,8 -0,6 -0,4 -0,2
0
0,2
0,4
0,6
μ PB3
0,8
1
du
Рис. 2. Множество функций принадлежности нечетких переменных: сигнала
ошибки по угловой скорости (а), сигнала ошибки по производной угловой
скорости (б), сигнала нечеткого управления (в)
На рис. 3 приведена иллюстрация принципа формирования сигнала
управления DU на основе двух правил с использованием метода Мамдани [7].
Нечеткий контроллер работает следующим образом. По известным в
относительных единицах четким значениям сигнала ошибки по угловой
скорости (е = е0) и сигнала ошибки по производной угловой скорости
(се = се0), и по функциям принадлежности нечетких переменных Е и СЕ
определяются одно или два значения этих переменных. В рассматриваемом
примере при е0 = 0,13 и се0 = –0,2 определяются два значения лингвистической
переменной Е (Z1 и PS1) и одно значение лингвистической переменной СЕ
(NS2) (см. рис. 2). Число значений лингвистических переменных Е и СЕ
57
определяет число правил управления. Если имеется по одному значению
переменных Е и СЕ, то нечеткое правило управления одно, если имеется два
значения у одной переменной и одно у другой, то правил два, если по каждой
переменной – два значения, то правил – четыре. Правила определяются по
значениям лингвистических переменных с помощью вышеприведенной
таблицы. В рассматриваемом примере с помощью нечетких переменных
Z1 = { μ Z1 (e)|e}, PS1 = { μ PS1 (e)|e }, NS2 = { μ NS 2 (ce)|ce } определяются
следующие два нечетких правила:
Правило 1: Если E = Z1 и CE = NS2, то DU = NVS3.
μ Z1
μ NS 2
1.0
Правило 1
μ Z1
0
0
e
μ NS 2
e
e0
0
ce
ce0
0
ce0
du
DU1
μ Z3
μ NS 2
1.0 μ 
NS 2
Правило 2 μ PS
1
0
1.0
μ Z1
e0
μ PS1
1.0
μ NVS3
1.0
μ NS 2
1.0
0
DU2
ce

du
1.0

μ NS 2
μ Z1
0
Центр тяжести
du
Выход НК
Рис. 3. Принцип работы нечеткого контроллера на основе двух правил
Правило 2: Если E = PS1 и CE = NS2, то DU = Z3.
Затем находится степень истинности предпосылок для этих правил:
μ Z1 = μ Z1 (e0), μ PS1 = μ PS1 (e0), μ NS 2 = μ NS 2 (ce0) (см. рис. 2 и 3). На следующем
этапе происходит "отсечение" функций принадлежности
заключений рассматриваемых правил на уровнях
μ

NVS3
μ NVS3 и μ Z3


= min( μ Z1 , μ NS 2 ),
μ Z3 = min( μ PS1 , μ NS 2 ) (рис. 3). Усеченные функции принадлежности
58
заключений разных правил объединяются с помощью операции max, в
результате
чего
получается
функция
принадлежности
μ  (du),
соответствующая нечеткому выводу для выходной лингвистической
переменной DU. На заключительном этапе с помощью метода Мамдани
определяется четкое значение сигнала управления.
Поскольку нечеткий контроллер выполняет функцию статического
нелинейного преобразования, то можно записать действия контроллера в форме:
(1)
K1e  K 2 ce  du ,
где K 1 и K 2 – нелинейные коэффициенты.
С учетом процесса интегрирования получаем среднее значение сигнала u,
зд
пропорциональное току задания i qs
в соответствии с выражением:

u  K1 edt  K 2e ,
(2)
что является формой записи нечеткого ПИ-контроллера с нелинейными
коэффициентами. Подобным образом можно записать алгоритм нечеткого
контроллера для П- и ПИД-котроллеров.
Нелинейные
адаптирующиеся
в
процессе
функционирования
коэффициенты в нечетком контроллере позволяют устойчиво формировать
сигналы управления при изменении параметров системы в процессе
функционирования.
Результаты моделирования системы управления электроприводом с
использованием стандартного ПИ-регулятора и построенного с использованием
нечеткой логики в среде MATLAB соответственно показаны на рис. 4 и рис. 5.
Верхний график – зависимость электромагнитного момента от времени M(t),
нижний – скорости вращения ротора двигателя от времени ω p (t).
4 10 4
M(t ), Нм
2  10 4
0
150
ω p ,1 / c
t, c
100
50
0
3
6
9
12
15
18
21
24
27
Рис. 4. Зависимости M(t), ω p (t) (стандартный ПИ-регулятор)
59
30
M(t ), Нм
4  10 4
2  10 4
0
150
ω p ,1 / c
t, c
100
50
0
3
6
9
12
15
18
21
24
27
30
Рис. 5. Зависимости M(t), ω p (t) (ПИ-регулятор с использованием нечеткой логики).
Выводы. Проведенные исследования синтезированной системы
векторного управления тяговым электроприводом подтвердили эффективность
применения методов нечеткой логики при проектировании регуляторов.
Перерегулирование в случае использования стандартного ПИ-контроллера,
которое наблюдается на рис. 4, составляет 14%, при использовании нечеткого
контроллера перерегулирование практически отсутствует. К тому же, в первом
случае в переходном режиме двигатель электропривода может перейти в
генераторный режим, что не допустимо в процессе функционирования
системы. В дальнейшем разработанные модели предлагается использовать для
разработки систем управления тяговым электроприводом и их исследования в
замкнутой системе регулирования с учетом различных масс состава.
Список литературы: 1. Ярушкина Н.Г. Основы теории нечетких и гибридных систем: Учебное
пособие. – М.: Финансы и статистика, 2004. – 320 с. 2. Васильев В.И., Ильясов Б.Г.
Интеллектуальные системы управления с использованием нечеткой логики: Учебное пособие. –
Уфа: УГАТУ, 1997. – 220 с. 3. Verbruggen H.B., Babushka R. Constracting fuzzy models by product
space cluctering // Fuzzy model identification. – Berlin: Springer, 1998. – P. 53 – 90. 4. Галушкин А.И.
Нейрокомпьютеры и их применение на рубеже тысячелетий в Китае. В 2-х томах. Том 2. – М.:
Горячая линия – Телеком, 2004. – 464 с. 5. Усольцев А.А. Векторное управление асинхронными
двигателями. Учебное пособие по дисциплинам электромеханического цикла. C-Пб. 2002. – 39 с.
6. Рудаков В.В., Столяров И.М., Дартау В.А Асинхронные электроприводы с векторным
управлением. – Л.: Энергоатомиздат, 1987. – 136 с. 7. Bimal K. Bose Modern Power Electronics and
AC Drives. – Prentice-Hall PTR 2002. – 738 c. 8. Носков В.И., Дмитриенко В.Д., Заполовский Н.И.,
Леонов С.Ю. Моделирование и оптимизация систем управления и контроля локомотивов. –
Харьков: ХФИ "Транспорт Украины", 2003. – 248 с.
Поступила в редакцию 14.04.2006
60
УДК 681.513:620.1
Н.И. ЗАПОЛОВСКИЙ, канд. техн. наук, НТУ "ХПИ",
С.И. ЧЕРВОННЫЙ, канд. техн. наук, НТУ "ХПИ",
Р.М. ГРЫБ, НТУ "ХПИ"
МОДЕЛИРОВАНИЕ ТЯГОВОГО ЭЛЕКТРОПРИВОДА ДИЗЕЛЬПОЕЗДА С УЧЕТОМ СЦЕПЛЕНИЯ КОЛЕСНЫХ ПАР С
РЕЛЬСАМИ
Розглянуто питання, які пов’язані із створенням математичної моделі електромеханічної системи
дизель-поїзда зі тяговим асинхронним електроприводом із врахуванням пружних зв’язків у його
елементах та взаємодії колісних пар із рельсами. Запропоновано математичну модель реалізації
сили щеплення колісних пар при втраті та відновленні щеплення.
The article considers the creation the electromechanical system mathematic model diesel engine within
asynchronous drive motor with taking into account elastic connections and interaction between both
wheel pairs and metal. Authors propose realization of wheel pairs cohesion mathematic model when
wheels loss and restore cohesion.
Постановка проблемы. Согласно исследованиям, проведенным в
области разработки современных видов железнодорожного транспорта как в
нашей стране, так и за рубежом, одной из актуальных задач является задача
построения эффективных систем управления, обеспечивающих уменьшение
расходов топлива и электроэнергии и ограничение воздействия локомотива на
железнодорожный путь, связанных с процессами буксования [1, 2]. Особо это
относится к локомотивам с электроприводом переменного тока, в качестве
тяговых электродвигателей в которых используются трехфазные асинхронные
электродвигатели [1, 3]. В Украине процесс создания такого типа локомотивов
находится на уровне разработки экспериментального образца дизель-поезда.
Одной из проблем при создании локомотивов с электроприводом переменного
тока, в частности их систем управления, обеспечивающих получение
возможно малого динамического воздействия тяговых единиц на
железнодорожный путь, является проблема использования сцепного веса.
Ввиду конструктивных особенностей локомотивов с электродвигателями
переменного тока, где в электромеханической системе используется резинокордовая муфта, требуется детальное исследование динамики локомотива с
целью разработки эффективных систем управления, обеспечивающих
предотвращение буксования или сведения к минимуму энергетических затрат,
вызванных процессом буксования колесных пар локомотива. Для проведения
комплексных исследований процессов буксования с целью разработки
эффективных систем управления, наиболее подходящим инструментом
являются математические модели как самого объекта в целом, так и его
отдельных энергетических компонент, блоков и узлов [4].
61
Анализ литературы. Проблеме разработки и исследования моделей
электромеханической системы электропривода переменного тока с учетом
упругих связей и условий сцепления колесных пар с рельсами посвящено ряд
работ [4 – 7]. При исследовании электромеханической системы дизель-поезда
с тяговым асинхронным электроприводом практический интерес представляет
математическая модель, учитывающая реализацию момента вращения
тягового асинхронного двигателя (ТАД) при взаимодействии колесных пар с
рельсами, в частности, математическая модель реализации силы сцепления
колесных пар дизель-поезда при потере и восстановлении сцепления.
Хотя проблемам создания математических моделей локомотивов, в
особенности с тяговым электроприводом переменного тока с учетом
сцепления колесных пар с рельсами посвящено большое число публикаций,
видимо только авторами научной работы [8] впервые рассматриваются
вопросы моделирования взаимодействия колесных пар с рельсами с учетом
упругих связей, возникающих в элементах электромеханической системы
асинхронного электропривода дизель-поезда. Однако модель не отражает
процессы, связанные с изменением приведенного момента инерции
составляющих масс поезда при нарушении условий сцепления колесных пар с
рельсами.
Целью
статьи
является
создание
математической
модели
электромеханической системы дизель-поезда с тяговым асинхронным
электроприводом с учетом упругих связей в его элементах и взаимодействия
колесных пар с рельсами, позволяющей проводить исследования на стадии
проектирования и осуществлять синтез системы регулирования тяговым
электроприводом с учетом возможных колебаний колесной пары в процессе
буксования.
Описание объекта исследования. В данной работе объектом
исследования является дизель-поезд, где в качестве тяговых двигателей
используются трехфазные асинхронные электродвигатели. Структурная схема
электромеханической системы дизель-поезда приведена на рис. 1.
Рис. 1. Структурная схема электромеханической системы ТАД – колесная пара
62
Здесь приняты следующие обозначения: Р1 – ротор ТАД; Р2 – редуктор;
ПВ – полный вал; К1, К2 – колеса оси дизель-поезда. Связь ТАД с колесной
парой дизель-поезда, в общем случае оказывается упругой за счет скручивания
валов редуктора и колесной пары, упругой деформации колесной пары, а
также соединительных муфт. На систему действуют внешние моменты:
вращающий момент ТАД Мэл, приложенный к ротору и действующий на
колесную пару через редуктор и соединительную муфту, и момент сцепления
колесной пары с рельсом Мсц. На работу данной системы оказывают влияние
диссипативные силы трения в подшипниках, силы трения в зубчатых
сцеплениях. С учетом допущений отдельные звенья могут быть представлены
в виде сосредоточенных материальных точек, обладающих моментами
инерции (J1, J2, …, J5), а идеализированные связи между ними
характеризуются упругостью (С1, С2, …, С4) и диссипативными свойствами
(b1, b2, …, b4).
Реализация разработки моделей. Для исследования процессов
буксования предположим, что моделируемая система состоит из модели
эквивалентного электропривода с небуксующими колесными парами и
электропривода, колесные пары которого могут быть в состоянии буксования.
При этом скорость движения определяется совокупным развиваемым усилием
(тяговым моментом) от всех двигателей, участвующих в образовании тягового
момента дизель-поезда. Укрупненная структурная схема модели приведена на
рис. 2.
Мэл1
ω1
U1
U2
ω2
Мэл2
Рис 2. Структурная схема модели
Здесь: БФУВ – блок формирования управляющих воздействий U1, U2
(напряжения питания ТАД); ТАД1 – тяговый асинхронный двигатель
(буксующий); ТАД2 – эквивалентный тяговый асинхронный двигатель (не
буксующий); Мэл1, Мэл2 – электромагнитный момент соответствующего ТАД;
БМУСу – блок формирования момента сцепления колесных пар с учетом
упругих связей; БФС – блок формирования скорости дизель-поезда; ω1, ω2 –
круговая скорость вращения соответствущей колесной пары.
63
В зависимости от целей исследования модели ТАД1 и ТАД2 могут быть
представлены как с учетом только средних значений фазовых переменных, так
и мгновенных. Их математические модели и модели формирования
управляющих воздействий (блок БФУВ) подробно описаны в [4]. На выходах
ТАД1 и ТАД2 формируется электромагнитный момент (соответственно М эл1 и
Мэл2). Практический интерес представляет модель блока БМУСу. На основе
проведенных исследований систему, приведенную на рис. 1, можно
представить в виде двухмассовой, в которой определяющую роль играют
параметры соединенной муфты (величина жесткости – С, коэффициент
вязкого трения – b). В этом случае, структурная схема двухмассовой системы,
представленная двумя сосредоточенными массами редуктора, между
которыми имеется упругий элемент (соединительная муфта), приведена на
рис. 3. Здесь вал ТАД с моментом инерции Јд связан с колесной парой с
моментом инерции Јм упругой связью с коэффициентом жесткости С и
коэффициентом вязкости трения b. При этом скорость вращения ротора ТАД
ωд(t) не равна скорости вращения колесной пары ωм(t).
b
ТАД
Мэл
Мд
I
Jд
C
Jм
ωм
ωд
Мсц
Рис. 3. Структурная схема двухмассовой системы
Полученные уравнения двухмассовой системы с учетом условий
сцепления колесных пар с рельсами имеют вид:
dд
1
(1)

М д  М уэ ;
dt
Jд


М уэ  М у  Вд  м ;
dM у
dt
dM у
dt

(2)
 C д  м  ;
(3)

(4)

1
М уэ  М сц , если М сц  M уе ;
JМ
м  , если Мсц  М уэ ,
где Муэ – суммарный момент, передаваемый упругой связью, которая равна
сумме упругого момента Му и момента вязкого трения; Jд, Jм – соответственно
момент инерции двигателя и механизма, приведенные к валу двигателя; М д –
тяговый момент ТАД с учетом редуктора; ωд, ωм – соответственно скорости
64
вращения ротора ТАД и колесной пары; ω – угловая скорость небуксующей
колесной пары; Мсц – момент сцепления колесной пары с рельсами.
Согласно [8] Мсц может быть определен соотношениями:
M сц  kΨ 0 П k Rk ;
α
, если  < 0,0014;
0,0028
350α  0,155
, если 0,0014    0,025;
k
336α  0,196
1
, если   0,025;
k
1  f AU б
k
α
Uб
;
Vt
Ψ 0  0,25 
8
,
100  20Vt
(5)
(6)
(7)
(8)
(9)
(10)
где 0 – потенциальное значение коэффициента сцепления колесной пары с
рельсом; Пk – текущее значение сцепного веса колесной пары; fА – жесткость
характеристики сцепления в точке А; Uб – скорость буксования; Vt – скорость
локомотива; Rk – радиус колеса. Текущее значение нагрузки Пk, входящее в
уравнение (5) k-й колесной пары, на рельс без учета текущего значения
переменной составляющей нагрузки, зависящей от скорости движения и
длины рельсового пути между стыками, в процессе движения определяется
выражением:
(11)
П k  П 0 1   k 0   П kF ,
где П0 – средняя статистическая нагрузка колесной пары на рельс; Δηk0 –
относительное отклонение статистической нагрузки колесной пары от
среднеарифметического значения; ΔПkF – величина перераспределения
нагрузок по осям. Скорость Vt, используемая в уравнениях (9) и (10),
определяется по угловой скорости ω небуксующего ТАД:
dVt Rk
М Л  М С  ,

(12)
dt
Je
где Je – момент инерции массы дизель-поезда, приведенный к колесной паре;
МЛ – тяговый момент дизель-поезда (равен сумме тяговых моментов ТАД);
МС – момент сопротивления движению.
Момент сопротивления движению определяется как:
(13)
MC  0  1Vt   2Vt2 ,
где α0, α1, α2, – постоянные коэффициенты.
Как правило, в известных моделях, момент инерции JM буксующей
колесной пары, определяется в виде некоторой константы и принимается
65
равным моменту инерции колесной пары. Однако, это верно только при
полной потере сцепления колесной пары с рельсом. Если ψ 0 ≠ 0, то в
образовании момента инерции JM, используемого в уравнении (4), должна
учитываться составляющая, зависящая от массы состава, как и для случая при
отсутствии буксования. В процессе проведения исследований установлено, что
для буксующей колесной пары момент инерции JM:
(14)
J M  J e  J КП e  ВUб  J КП ,
где B – постоянный коэффициент, Uб – скорость буксования; JКП – момент
инерции колесной пары.
Выводы. Разработанные модели электромеханической системы дизельпоезда с учетом условий сцепления колесных пар с рельсами и учетом
диссипативных сил могут быть использованы для исследования системы
автоматического управления электропередачи и уточнения ее параметров.
На основании проведенных исследований и сравнения результатов
(полученных на модели и на экспериментальном образце дизель-поезда), как в
статических, так и в динамических режимах, в различных точках тяговой
характеристики и при различных условиях разгона дизель-поезда,
установлено, что разработанная модель с учетом предложенного способа
моделирования момента инерции Jм адекватно отражает процессы,
происходящие в электромеханической системе дизель-поезда и может быть
использована для разработки систем управления, обеспечивающих
оптимальный режим ведения поезда с учетом условий сцепления колесных пар
с рельсами. Планируется использовать предложенную модель для разработки
систем противобуксовочной защиты локомотивов с электроприводом
переменного тока.
Список литературы: 1. Walrave M., Ellwanger G. Hochgeschwindigkeitsverkehn in Europa // ETR –
Eisenbahntechnische Rundschau. – 1995. – № 10. – С. 123–129. 2. Носков В.И., Шпика Н.И.,
Яровой Г.И. О создании тяговых асинхронных электроприводов в НПО "Электротяжмаш"
// Новини энергетики. – 2001. – № 9. – С. 86–88. 3. Перспективы и проблемы внедрения
асинхронного электропривода на тепловозах / В.И. Носков, В.С. Марченко, Г.А. Михневич и др. Сб.
науч. трудов НИИ завода "Электротяжмаш" и МЭТП. Вып. 1. – 1989. – С. 40–44.
4. Даниленко А.Ф., Дмитриенко В.Д., Заполовский Н.И. Математические модели оптимальных
систем управления тяговым асинхронным приводом тепловозов // Электронное моделирование. –
1991. – Т. 13. – № 2. – С. 40–44. 5. Камаев А.А., Цыкин П.К. Математическое моделирование
качения колес в групповом приводе локомотива. – Сб. Тр. Брянского ин-та трансп.
машиностроения. – 1974. – Вып. 26. – С. 103–106. 6. Павленко А.П., Кугенлевич В.В. Динамические
процессы в тяговом приводе тепловоза с асинхронными электродвигателями при буксовании
колесных пар / Взаимодействие подвижного состава и пути, динамика локомотивов и вагонов. –
1979. – С. 62–68. 7. Коняев А.Н., Голубченко А.Н., Ткаченко В.П. Исследование процесса
реализации силы тяги локомотива с подрезинеными колесными парами // Конструирование и
производство транспортных машин. – 1981. – № 13. – С. 3–9. 8. Носков В.И., Дмитриенко В.Д.,
Заполовский Н.И., Леонов С.Ю. Моделирование и оптимизация систем управления и контроля
локомотивов. – Харьков: ХФИ "Транспорт Украины", 2003. – 248 с.
Поступила в редакцию 23.03.2006
66
УДК 007.681.518.2
А.С. ЗАМКОВОЙ, канд. техн. наук, ХНУРЭ (г. Харьков),
Т.Н. МУСТЕЦОВ, ХНУРЭ (г. Харьков)
УЧЕТ ЛИНГВИСТИЧЕСКИХ ПЕРЕМЕННЫХ ПРИ СОЗДАНИИ
СИСТЕМ ОБЪЕКТИВНОЙ МЕДИЦИНСКОЙ ДИАГНОСТИКИ
Розглянуто питання оптимізації кількості і розподілу по числовій шкалі значень лінгвістичних
змінних при створенні систем медичної діагностики. Запропоновано вираження для обчислення
імовірності діагнозу з урахуванням кореляції між показниками.
Questions of optimization of quantity and distribution on a numerical scale of linguistic variables are
considered at creation of systems of medical diagnostics. Expression for calculation of probability of the
diagnosis in view of correlation between parameters is offered.
Постановка проблемы. Медицинская диагностика – распознавание
заболеваний представляет собой процесс познания двух видов. Во-первых,
врач старается узнать (вспомнить) то, что он когда-то видел. В этом случае
совершается процесс простого узнавания, чем познание в полном смысле
слова. Второй вид процесса диагностики заключается в познания врачом
нового, ещё не известного, т. е. вскрытие новых связей, причинных отношений
между симптомами и установление в конкретном случае условий
происхождения заболевания. При этом врач генерирует новую информацию.
Новая информация – производная продуктивного мышления. Продуктивное
мышление есть творчество. И.А. Кассирский [1], выражая свои сомнения в
возможностях компьютерной диагностики, писал: "как запрограммировать
машине умение дать диагностическую оценку выражения лица, глаз больного,
его походке, манере вести себя и разговаривать, его скрытым переживаниям,
смутно ощущаемым врачом". Чем менее уместны алгоритмы (репродуктивное
мышление), тем более уместно творчество (продуктивное мышление).
Средствами искусственного интеллекта обеспечиваются функции доступного
формализации репродуктивного мышления, но не обеспечиваются функции
продуктивного, творческого, "которые не могут быть формализованы".
В настоящее время многие функции человека переданы технике, и
человек используется для большей её отдачи. Что же касается
интеллектуальной функции генерирования новой информации, творчества, то
самым совершенным средством её осуществления является мозг человека, и
здесь главной задачей проектирования человеко-машинных комплексов,
направленных на осуществление этих функций, является создание техники для
большей отдачи от мышления человека.
В частности, в отношении медицинской диагностики, важно отметить, что
классификация болезней, описания симптомов, синдромов, нозологических
единиц проведены человеком, следовательно, человеком постижимы и,
следовательно, проблема диагностики есть проблема понимания между
67
людьми, между авторами классификаций и врачами с их индивидуальным
опытом. Здесь проявляется роль личности, индивидуальности в медицине –
классификация может быть разработана самим практикующим врачом, в
большей или меньшей мере расходящаяся с существующей, формируя основы
новой клинической школы. Одним из путей выхода из ситуации, является
создание средств, способствующих появлению, поддерживанию и
стимулированию продуктивного мышления врача.
Анализ литературы. На практике для решения медицинских задач
применяют, в основном, два типа интеллектуальных систем: информационнопоисковые и экспертные. Причем некоторые из них достаточно эффективны.
Например, в системе «Компас» используется метод морфологического анализа
и производится компьютерное моделирование творческих процедур. Авторы
[2] утверждают, что с помощью этой системы было получено более 60
патентов на новые механизмы принятия решения.
Система Sounding Board – часть образовательного программного
комплекса, пытающегося обучить пользователя выработке творческих
решений задач через обучение его задавать себе наводящие вопросы. Система
Sounding Board не является генератором новых решений, но объединение
Sounding Board и пользователя может быть более творческим, чем
пользователь сам по себе. Sounding Board может помочь пользователю
объединить факты и правила для творческого использования при диагностике
[3]. Система Sounding Board основана на концепции тренера, использует метод
контрольных вопросов. Система Sounding Board воплощает теорию
повышения творческой активности, изложенную в книге "The Creative
Attitude" ("Творческие способности"). Основное утверждение, стоящее за
теорией, равно как и за программой, основано на том, что решение творческих
задач зависит от способности иметь мышление, "систематически
блуждающее" в разных направлениях (аспектах) задачи, и что задавание себе
стандартного набора вопросов может улучшить способность делать это.
Система Case-Adaptation Coach объединяет идеи системы ABE [3] в плане
использования базы знаний конкретных ситуаций и механизмов их адаптации
к конкретному примеру, и системы Sounding Board в плане использования
концепции тренера и метода вопросов. На практике в большинстве
существующих медицинских интеллектуальных системах используются
только формализованные данные [4]. Результат работы таких систем служит
только для получения вспомогательной "осведомительной" информации.
Повышение эффективности медицинских систем принятия решений
происходит за счет формализации и учета качественных знаний.
Цель статьи. Формализация качественных знаний (данных) на основе
теории информации и определение метода их учета при создании медицинских
систем принятия решения.
68
Формализация
качественных
знаний.
Распределение
лингвистических переменных по цифровой шкале. Особенностью
лингвистических переменных используемых в медицине является полное
отсутствие их числового значения. Кроме того, набор значений переменой
часто зависит от субъективного восприятия врача. Использование теории
нечетких множеств Л. Заде для решения задач медицинской диагностики
возможно в случае четкого определения числовых соответствий таким
понятиям естественного языка как "всегда – часто – иногда – редко – никогда".
Однако наличие психологического и лингвистического аспектов при
формировании симптомокомплекса оставляет слабо разработанными
следующие вопросы:
– необходимое и достаточное количество значений лингвистических
переменных для описания непрерывных свойств объекта от полного
отсутствия свойства до максимального присутствия;
– распределение значений лингвистических переменных по цифровой
шкале, измеряющей данное свойство.
Рассмотрим принципы учета значений лингвистических переменных по
шкале вероятностей в системах медицинской диагностики. Области, в которых
человек производит, в основном несознательно, градацию (шкалирование)
разнообразны и трудно описываемы математически. Доказательство тому –
существование в психологии двух противоречащих друг другу законов:
Вебера-Фехнера и Стивенса (рис. 1).
1 – Зависимость Стивенса
2 – Зависимость Вебера-Фехнера
Рис. 1.
Первый утверждает, что зависимость силы ощущения Е от физической
интенсивности раздражителя Р – логарифмическая, т.е. отношение ΔЕ/ΔР с
ростом Р уменьшается. Второй говорит, что зависимость степенная, а значит
отношение ΔЕ/ΔР с ростом Р увеличивается. За силой ощущения стоит
лингвистическая переменная. Для шкал ощущений характерно наличие
верхнего и нижнего порогов ощущений. При этом они могут быть болевыми:
оба порога (температура); один порог (сила звука); ни одного, оба порога
связаны с прекращением ощущения. С приближением к порогам, в так
69
называемой "пороговой зоне", отношение ΔЕ/ΔР увеличивается, в связи с чем
можно предположить, что закон Стивенса справедлив в пороговых зонах,
скорее даже в болевых пороговых зонах, в то время как эмпирические
исследования подтверждают зависимость Вебера-Фехнера лишь для среднего
участка диапазона воспринимаемых значений раздражителя [5]. Например,
при лингвистических значениях L1 = боль обморожения, L2 = очень холодно,
L3 = холодно, L4 = нормально, L5 = тепло, L6 = жарко, L7 = боль ожога,
предполагаемая зависимость может быть представлена в соответствии с рис. 2.
Сложность описания этой области связана также с действием механизмов
адаптации, которые являются отражением индивидуальных врождённых
качеств и профессиональной деятельности. Исследователи в области
искусственного интеллекта, использующие в основном равномерное
распределение, также отмечают, что "люди часто искажают оценки, например,
сдвигают их в направлении концов оценочной шкалы" [6].
Рис. 2.
Объяснение этого явления возможно на основе вышеизложенных
зависимостей. Несмотря на неравномерное распределение значений
лингвистических переменных по количественной шкале, они равномерно
распределены по шкале информативности: с увеличением информативности
ощущений в пороговых зонах возрастает количество описывающих их
значений лингвистических переменных. Если описываемое свойство
вероятность Р, то может быть прямо применён закон К. Шеннона [7]:
I  P log 2
1
1
 (1  P) log 2
,
P
1 P
где I – информативность, прямо связанная с лингвистической переменной. По
графику формулы (рис. 3) можно определять численные значения переменных,
в данном случае вероятности.
Для сравнения, в шкале Харрингтона [8], одной из распространённых
70
методик оцифровки качественной информации, используется следующая
градация 0 – 0.2 – 0.37 – 0.64 – 0.8 – 1. Информационно значимые пороги
могут располагаться как на краях шкалы, так и в её середине и шкала
Харрингтона может рассматриваться как обобщённый вариант, хотя,
несомненно, более точным решением будет использование в каждом из двух
случаев своей шкалы, одна из которых предлагается.
Рис. 3.
Объединение мнений, выраженных в вероятностях Р, должно проводиться
с учетом неравномерного распределения значений лингвистических
переменных L(Р):
 I ( P )w
L( P , P ,..., P ,...)  L( P(
)),
w
i
i
i
1
2
i
i
i
где wi – вес мнения i-го эксперта.
Количество значений лингвистических переменных. Как было указано
выше, верхний предел количества составляет 11 – 13. С другой стороны "при
определении степени принадлежности множество исследуемых объектов
должно содержать, по крайней мере, два объекта, численные представления
которых на интервале [0; 1] – 0 и 1 соответственно".
Третья обязательная точка шкалы, обладающая значительно большим
разбросом, чем две предыдущие – 0.5. Количество точек между 0 и 0.5 (и
симметричном интервале 0.5 ... 1) может варьироваться от 0 до 4 (при 11
71
делениях). На практике приходится сталкиваться с четвёртой обязательной
точкой, лежащей вне шкалы, а точнее, охватывающей всю шкалу – это
значение лингвистической переменной "неизвестно", "нет информации". Её
легко спутать с переменной "средне" (3-я точка), но у последней область
значительно уже.
В приводимых в литературе примерах количество значений
лингвистических переменных варьируется в пределах от 3 до 11 [9] с
преобладанием в промежуточных значениях 5–7–9. Наиболее часто
встречается 7-интервальная шкала. Для большинства случаев в решении
проблемы количества приемлемы выводы психолингвиста Джорджа Миллера,
данные в книге "Магическое число семь, плюс или минус два: некоторые
ограничения на наши возможности обработки информации". Предлагаем
количество значений лингвистических переменных ограничить числом семь.
Использование лингвистических переменных при создании медицинских
систем. При постановке диагноза врач редко бывает в нём полностью уверен.
В связи с этим более целесообразно говорить о диагнозе с точки зрения его
вероятности. Всё ещё очень часто эта вероятность выражается не в форме
процентов, а с помощью таких выражений, как "почти всегда", "обычно",
"иногда", "редко". Поскольку разные люди вкладывают различную степень
вероятности в одни и те же термины, это ведёт к возникновению
недопонимания между врачами или врачом и пациентом. Врачам следует как
можно более точно и, по возможности, используя цифры, давать свои
заключения и, если это осуществимо, использовать для выражения
вероятности количественные методы. Например, вместо того чтобы говорить,
что
вероятность
обнаружения
карциномы
толстой
кишки
рентгенологическими методами мала, лучше, если это возможно, представить
точные данные о диагностике новообразования по данным рентгенографии.
Вероятность обнаружения карциномы в 10–15% случаев может быть
интерпретирована как "небольшая", однако с клинических позиций в этом
случае требуется дальнейшее уточнение диагноза, поскольку последствия
гиподиагностики потенциально операбельной опухоли могут быть самыми
серьёзными. Хотя наличие таких количественных показателей было бы очень
желательно, они обычно отсутствуют в клинической практике. Имеется
тенденция к гипердиагностике относительно редких заболеваний.
Выражение "особенно трудно бывает количественно оценить
вероятность, которая может быть очень высокой или очень низкой" следует
интерпретировать как "особенно трудно разбить значения лингвистических
переменных на краях шкалы на ещё более мелкие (это трудно сделать не
только на краях шкалы), но особенно важно, поскольку именно на краях
шкалы происходит скачок от неопределённости к определённости, т.е. к "0"
(нет) или "1" (да), и незначительное изменение вероятности вблизи этих точек
приводит к значительному изменению информации". Что касается связи
вероятности и информации в середине шкалы, то "например, уменьшение
72
вероятности диагноза коронарной болезни с 75 до 50% может иметь значение
для статистика, но для врача это не будет поводом для изменения
терапевтической тактики".
Предлагаем использовать вычислительный метод обработки корреляции
между показателями. База знаний экспертной системы с вероятностной
логикой содержит условные вероятности определенного симптома при
определенной болезни. Симптомы считаются независимыми друг от друга там,
где зависимость не указана явно. Перед проведением корреляционного анализа
"на основании эмпирических соображений (врачебного опыта) составляется
сознательно завышенный перечень признаков" [4]. Необходимо отметить, что
"завышенный перечень признаков" часто составляется несознательно и
поэтому всегда есть потребность в анализе корреляции.
Предлагаемый паллиативный метод позволяет проводить такую
обработку автоматически. Теоретической основой метода являются
статистические методы обработки распределений, теория вероятностей.
Коэффициент корреляции между симптомами Sk, Sl, вычисляется по формуле:
n
rk ,l 

cov(xk , xl )
, cov(xk , xl )  (1 / n) ( xik  xk )( xil  xl ) ;
 k l
i 1
n


 k   1 / n  x ik  x k 2 


i 1



1/ 2
,
где xik = P(Sk|Di) – условная вероятность k-гo симптома при i-й болезни;
xk  P ( S k | D) – условная средняя вероятность k-гo симптома при
обрабатываемом множестве болезней; n – количество болезней в множестве;
 k – среднеквадратическое отклонение степени для вероятности k-гo
симптома; cov(xk, xl) – взаимная ковариация вероятностей симптомов; xk –
вариация k-го симптома.
Следующий шаг – введение коэффициента корреляции в формулу Байеса
[4] для коррекции вероятности заболевания – уменьшение изменения этой
вероятности в случае высокой корреляции (как положительной, так и
отрицательной). Предлагается следующее эмпирическое соотношение:
k
 P( S
P( D)
P( D | S1 , ..., S k ) 
i 1
k
 ( P( S
i 1
i

| D)  (
i
| D)
i 1
(1  r ji2 )) P( D
| S1 , ..., S k 1 )( P( S i | D )  P( S i | D)))
j 1
где P(D|S1, , Sk) – условная вероятность диагноза D при условии выбора
симптомов S1, ,. Sk; P(D) – априорная вероятность диагноза D; P( D \S1, ,
Sk) – условная вероятность отсутствия диагноза D при условии выбора
73
,
симптомов S1, , Sk; P(Si| D ) – условная вероятность i-го симптома S при
отсутствии диагноза D.
Предлагаемая формула отличается от формулы Байеса наличием
i 1
множителя
 (1  rij2 )
во 2-м слагаемом знаменателя. Этот множитель
j 1
позволяет учесть корреляцию между симптомами. Если коэффициент
корреляции будет равен нулю, то формула превращается в формулу Байеса,
где события Si считаются независимыми. Если корреляция между симптомами
r = 1 хотя бы с одним из предыдущих симптомов, множитель превращается в 0
и значение P(D|S1, ..., Sk) не изменяется по отношению к предыдущему своему
значению P(D|S1, ..., Sk-1).
В случае, когда r < 0, действие формулы аналогично вышеизложенному,
т.е. осуществляется уменьшение изменения вероятности заболевания, но
отрицательный коэффициент корреляции говорит о противоречии в базе
знаний, о чем в некоторых случаях целесообразно извещать пользователя.
Выводы. В работе рассмотрены вопросы учета значений лингвистических
переменных при создании медицинских интеллектуальных систем принятия
решения. Рассмотрены проблемы учета значений лингвистических
переменных при формировании, как входных данных так и при принятии
решений. Предлагается использовать неравномерное распределение значений
лингвистических переменных по числовой шкале, с учетом их
информативности.
Необходимое и достаточное число значений лингвистических
переменных равно семи. Предлагается соотношения для вычисления
вероятности диагноза, в котором учитывается корреляция между симптомами,
что позволит учитывать лингвистические переменные.
Список литературы: 1. Тарасов К.Е., Великов В.К., Фролова А.И. Логика и семиотика диагноза
(методологические проблемы). – М.: Медицина, 1989. – 272. 2. Андрейчиков А.Н.,
Андрейчикова О.Н. Компьютерное моделирование творческих процедур синтеза принципиально
новых механизмов (система "Компас") // Программные продукты и системы. – 1995. – № 2. – С. 35
– 37. 3. Kaas Alex. Question asking, artificial intelligence, and human creativity // In: Question and
information systems. Edited by Th. W. Lauer. Hillsdale, New Jersey. – 1992. – P. 374. 4. Минцвр О.П.,
Кнышов Г.В., Цыганий А.А. Кибернетика в сердечной хирургии. – К.: Вища школа. – 1984. – 140 с.
5. Психология. Словарь / Под ред А.В. Петровского, М.Г. Ярошевского. – М.: Политиздат, 1990. –
494 с. 6. Искусственный интеллект. – В 3-х кн. Кн. 2. Модели и методы: Справочник / Под ред.
Д.А. Поспелова. – М.: Радио и связь, 1990. – 304 с. 7. Кузьмин И.В., Кедрус В.А. Основы теории
информации и кодирования. – К.: Вища школа, 1986. – 234 с. 8. Литвак Б.Г. Экспертные оценки и
принятие решений. – М.: Патент, 1996. – 271 с. 9. Алиев Р.А. Интеллектуальные работы с
нечеткими базами знаний. – М.: Радио и связь, 1994. – 176 с.
Поступила в редакцию 31.03. 2006
74
УДК 621.391
В.Г. ИВАНОВ, канд. техн. наук,
Ю.В. ЛОМОНОСОВ, канд. техн. наук (г. Харьков)
ОБОБЩЕНИЕ JPEG-ФОРМАТА ДЛЯ КОДИРОВАНИЯ
МУЛЬТИМЕДИЙНЫХ ДАННЫХ
Запропоновано та досліджено методику узагальнення JPEG-формату для кодування
мультимедійних даних на основі розширеного сімейства ортогональних перетворень, що дозволяє
домогтися універсальності і зберегти прийнятну якість стиску. Приводяться порівняльні
результати комп'ютерного моделювання мовних і звукових сигналів з використанням JPEGформату і МР3.
The technique of generalization of a JPEG-format for coding the multimedia data is offered and
investigated on the basis of the expanded family of the orthogonal transformations, allowing to achieve
universality and to keep acceptable quality of compression. Comparative results of computer modelling of
speech and sound signals with use of a JPEG-format and МР3 are resulted.
Постановка проблемы. Профессиональная и социально-культурная
среда современного человека становится электронной, а парадигмой этого
процесса является огромный объем цифровых данных различной физической
природы, который создается, хранится и циркулирует в этой среде. Сегодня в
мире происходит формирование новой отрасли, называемой пакетной
телефонией, которая основана на передаче голоса, данных и видео в сетях с
пакетной коммутацией [1 – 3]. Так одна минута цифровой аудиозаписи с
качеством звучания лазерного диска занимает порядка 10,8 Мб информации и
для прослушивания в реальном времени такого файла нужно иметь скорость
передачи до 1,5 Мбит/сек. Трудно надеяться, что отечественные телефонные
каналы обеспечат трафик более чем 16 – 32 Кбит/сек без применения
специальных средств сжатия данных.
Анализ исследований по этой проблеме показывает, что самым
популярным на сегодняшний день аудиоформатом является MPEG-1, который
использует три метода сжатия, называемые слоями (layer), а наиболее
эффективным является его третий слой, который широко известен по
абревиатуре MP3 [4, 5].
Высокая степень компактности MP3 достигается с помощью
дополнительного квантования по установленной схеме, позволяющей
минимизировать потери качества на основе учета особенностей человеческого
слуха, в том числе эффекта маскирования слабого сигнала одного диапазона
частот более мощным сигналом соседнего диапазона, или мощным сигналом
предыдущего фрейма, вызывающего временное понижение чувствительности
уха к сигналу текущего фрейма.
Подобная техника называется адаптивным кодированием и позволяет
экономить на наименее значимых с точки зрения восприятия человеком
75
деталях звучания. Структурная схема, реализующая данный формат,
представлена на рис. 1. Однако этот формат не предназначен для работы с
изображениями, что снижает его функциональные возможности и
универсальность.
Деление на
фреймы 16,
32, 64, 128
(блок 1)
Преобразование
Фурье в каждом
фрейме
(блок 2)
Психоакустический блок
анализа
(блок 3)
Энтропийные
методы
кодирования
(блок 4)
Рис.1. Схема формирования формата МР3
Целью работы является проведение исследований, направленных на
обобщение и расширение возможностей известного JPEG-формата компрессии
изображений для обработки аудиоданных, что позволит наметить пути
создания универсальных форматов данных различной физической природы.
Исследовать влияние основных ортогональных преобразований: Фурье,
дискретного косинусного преобразования и преобразования Хаара, на
качество и степень сжатия аудиосигналов различной структуры и
интенсивности.
Компьютерное моделирование JPEG-формата на аудиоданных. В
работах [6, 7] авторы предложили и исследовали оригинальную методику
сжатия звуковых данных, но она совершенно отлична от JPEG-технологий и
потому не является универсальной. Известно также, что МР3 является
потоковым форматом [4, 5]. Это означает, что передача данных происходит
потоком независимых отдельных блоков данных – фреймов. Для этого
исходный сигнал при кодировании разбивается на равные по
продолжительности участки, именуемые фреймами и кодируемые отдельно.
При
декодировании
сигнал
формируется
из
последовательности
декодированных фреймов.
Предлагаемый алгоритм формирования аудиосигнала в сжатом виде
аналогичен тем преобразованиям, которые используются в формате МР3 за
исключением основного блока – блока психоакустической обработки (блок 3,
рис. 1). Психоакустическая обработка в формате МР3 осуществляется после
того, как исходный сигнал поделен на фреймы. В МР3 каждый фрейм имеет
даже собственный заголовок, но в нашем случае это не обязательно, так как
длины их одинаковы. После разделения сигнала на фреймы каждый фрейм
подвергается
выбранному
преобразованию
(преобразование
Фурье,
дискретное косинусное преобразование – DCT, преобразование Хаара).
Конечным этапом обработки является преобразование аудиоданных без
потерь. В качестве энтропийных методов кодирования использовались
известные алгоритмы группового кодирования (RLE) и алгоритм Хаффмена.
76
Блок 3, реализующий психоакустическую обработку, в данном случае
отсутствует.
Параметры аудиосигналов:
– частота дискретизации – 8, 11, 22, 44 КГц;
– динамический диапазон – 8 бит (0–255);
– количество каналов – моно.
Длина фреймов вибиралась равной 16, 32, 64, 128 отстчетов исходного
звукового сигнала. Далее каждый фрейм отдельно подвергался
соответствующему
преобразованию.
После
чего
производилось
перераспределение полученных коэффициентов со всех участков обработки.
Отдельно группировались все первые коэффициенты из всех фреймов, за ними
следовали в заданной последовательности все вторые и т.д. Такое
структурирование коэффициентов позволяет получить наиболее равномерное
распределение амплитуд всей совокупности обрабатываемых коэффициентов.
Таким образом формируется последовательность значений перед
энтропийным кодированием.
Необходимо отметить, что подобная схема обработки используется и в
алгоритме JPEG при обработке изображений (рис. 2) [8]. Единственным
отличием является то, что изображение разбивается на сегменты (8×8) и в
каждом
сегменте
отдельно
производится
дискретное
косинусное
преобразование на плоскости. Однако после этого происходит считывание
полученных коэффициентов по методу Z-сканирования, и каждый сегмент так
же представлен вектором полученных коэффициентов. Дальнейшее
пребразование происходит по одинаковой схеме – сортировка коэффициентов
и энтропийное кодирование.
Таким образом, можно говорить об универсализации методов обработки
мультимедийных данных различной физической природы (аудиоданные и
изображения).
Формирование
рабочих
матриц
изображений
(8×8)
Двумерное DCT
преобразование
сегментов
изображений
(блок 3)
Квантователь
Формирование
вектора
коэффициентов
(зигзагсканирование)
Энтропийное
кодирование
(RLE
+Хаффман)
Рис. 2. Схема кодирования изображений в терминах JPEG-технологий
На рис. 3, 4 представлены графики зависимости коэффициента сжатия
Kсж) от частоты дискретизации звукового сигнала, длины фреймов и типа
преобразования. На рис. 3 представлена обработка слов “пять, четыре, три,
два, один”, на рис. 4 – музыкальная композиция “Мажор”.
Для каждой частоты дискретизации отдельно указаны значения для
алгоритма МР3, в правой части каждого графика на рис. 3, 4.
77
"54321"
K
Ксжсж
54321 8 К
54321 11 К
54321 22 К
54321 44 К
16
32
64
mp3
Хаар
Cos
Фур
Хаар
Cos
Фур
Хаар
Cos
Фур
Хаар
Cos
Фур
12
10
8
6
4
2
0
128
F дискр
Рис. 3. Зависимость Kсж от частоты дискретизации, длины фрейма и анализируемого
преобразования последовательности слов "пять, четыре, три, два, один"
"Мажор"
Kсж
К
сж
8К
11 К
22 К
44 К
16
32
64
mp3
Хаар
Cos
Фур
Хаар
Cos
Фур
Хаар
Cos
Фур
Хаар
Cos
Фур
10
8
6
4
2
0
128
F дискр
Рис. 4. Зависимость Kсж от частоты дискретизации, длины фрейма и анализируемого
преобразования музыкальной композиции "Мажор"
78
Выводы. Из анализа приведенных графиков можно сказать следующее:
– на речевых сообщениях, произносимых одним диктором при высоких
частотах
первичной
дискретизации,
наблюдаются
преимущества
ортогонального базиса Хаара по сравнению с другими базисами при любой
длине фрейма обрабатываемого сигнала;
– для речевого сообщения (рис. 3), на низкой частоте дискретизации в
8 КГц все линейные преобразования не уступают по эффективности сжатия
формату МР3 при любой длинне фрейма;
– для звукового сигнала это свойство утрачивается и лидером становится
дискретное косинусное преобразование при любых исходных параметрах
эксперимента;
– при высоких частотах первичной дискретизации формат МР3 имеет
явные преимущества, как на речи, так и на звуке;
– при изменении длины фрейма речевого сигнала в сторону увеличения,
эффективность сжатия в базисе Фурье падает, что можно объяснить большим
проявлением свойств нестационарности речевых данных.
Список литературы: 1. Головных А. Цифровая среда обитания // CHIP. Компьютеры и
коммуникации. – К.: Издат. дом "Софт Пресс". – 2003. – № 1. – С. 68 – 70. 2. Букашкин С.А.,
Лисицын Г.Ф., Миронов В.Г. Применение цифровых процессоров обработки сигналов –
магистральный путь развития современных средств телекоммуникаций / Тр. 3-й Международной
конференции "Цифровая обработка сигналов и ее применение". – Часть 3. – М.: Институт проблем
управления Росийской академии наук. – 2000. – С. 3 – 4. 3. Вінцюк Т. Мовленневі інформаційні
технології в Україні – на шляху до європейського співробітництва Схід-Захід / Праці Сьомої
Всеукраїнської міжнародної конференції "Оброблення сигналів і зображень та розпізнавання
образів" (УкрОБРАЗ‘ 2004). – К.: Кібернетичний центр Національної академії наук України, 2004.
– С. 9 – 17. 4. Кинтцель Тим. Руководство программиста по работе со звуком. – М.: ДМК Пресс,
2000. – 432 с. 5. Сэломон Д. Сжатие данных, изображений и звука. – М.: Техносфера, 2004. –
368 с. 6. Иванов В.Г., Ломоносов Ю.В. Многоэтапный алгоритм сжатия мультимедийных данных
// Научно-технический журнал ХГТУРЭ "Радиоэлектроника и информатика". – 2000. – № 4 (13). –
С. 87 – 89. 7. Иванов В.Г., Ломоносов Ю.В. Алгоритм сжатия данных на основе вычислений точек
перегиба в структуре сигнала // Вестник ХГПУ. Тематический выпуск "Системный анализ,
управление и информационные технологии". – 2000. – № 94. – С. 25 – 29. 8. Иванов В.Г.,
Ломоносов Ю.В., Любарский М.Г. Фурье и вейвлет анализ изображений в плоскости JPEGтехнологий // Проблемы управления и информатики. – 2004. – № 5. – С. 111 – 124.
Поступила в редакцию 07.04.2006
79
УДК 681. 3:681. 5
В.В. КАЛАЧОВА, канд. техн. наук, ХУВС (м. Харків),
В.А. ПУДОВ, ХУВС (м. Харків)
АНАЛІЗ МЕТОДИК ОЦІНКИ ЧАСУ РОЗРОБКИ СКЛАДОВИХ
ДИСТАНЦІЙНОГО НАВЧАННЯ
З метою підвищення навчального процесу, адекватності і точності оцінки трудомісткості процесу
створення дистанційних курсів та їх компонентів в роботі запропоновано підхід, який засновано
на існуючих методиках оцінки часу розробки курсів дистанційного навчання з використанням
спеціального виду виразів, що застосовують комплексні показники витрат часу на переробку
матеріалу у дистанційний вигляд.
With the purpose of increase of educational process adequacy and exactness of labor intensiveness
estimation of distance courses and their components creation process the approach, which is based on the
existent methods of time estimation of distance courses development with the use of the special type of
expressions which apply the complex indexes of time charges on processing of material in the distance
kind, is offered in work.
Постановка проблеми. У зв’язку з швидким зростанням можливостей
сучасних технічних засобів, телекомунікаційних та інформаційних технологій
відбуваються суттєві зміни форм та сенсу освіти в Україні і в усьому світі.
Тенденції зростання ролі професійної та безперервної освіти, зростання долі
навчання без відриву від професійної діяльності обумовлює попит на
дистанційні освітні послуги, а дистанційне навчання стає інтегральною
формою її отримання. Враховуючи, що дистанційна форма навчання базується
на використанні та взаємодії трьох основних складових: програмно-технічних
засобів, транспортного середовища (Інтернет) і методичного забезпечення
процесу навчання, проблема методичного забезпечення стає ключовою.
Створення електронної учбової літератури для дистанційного навчання, в
свою чергу, є достатньо трудомістким і тривалим процесом. Проблема
підвищення продуктивності цього процесу є актуальною та цілком залежить
від методів, що застосовуються та категорій виконавців процесу перетворення
матеріалу і вимагає проведення відповідних досліджень [1].
Для рішення поставленої проблеми в межах цієї роботи проаналізовано
існуючі методи оцінки часу розробки курсів дистанційного навчання та
запропоновано шляхи розрахунку трудомісткості переробки друкованого
матеріалу курсів дисциплін в їх дистанційну форму.
Аналіз літератури. Питання застосування різних методів оцінки
трудомісткості
процесу
створення
дистанційних
курсів
дотепно
проаналізовано Karl M. Kapp [1]. Сучасна технологія дистанційного навчання,
в свою чергу, згідно з поглядом Андрєєва А.А. [2], розглядається як цілісна
система компонентів, що включає в себе мету, зміст, процес навчання.
Карпенко М.П., Помогайбин В.Н. у [3] ретельно вивчають питання
становлення нової парадигми та її технічного забезпечення. У роботах
80
Солдаткіна В.І., Андрєєва А.А., Лупанова К.Ю. [4, 5] розглядаються питання
розробки учбово-методичної літератури системи дистанційного навчання та
проблеми системної організації дистанційного навчання в цілому. В роботах [6
– 8] розгорнуто представлено методичні та технічні аспекти організації ДН.
Метою цієї роботи є розроботка підхода до підвищення продуктивності
процесу перетворення друкованого матеріалу курсів дисциплін у їх
дистанційну форму при створенні методичного забезпечення для дистанційної
форми навчання, базуючись на існуючих методиках оцінки часу розробки
курсів дистанційного навчання.
1. Методи оцінки часу розробки курсу дистанційного навчання.
Оцінка часу на розробку курсу дистанційного навчання залежить від
складності теми, типу використовуваних матеріалів (відео, аудіо, фото,
креслення), досвіду замовника у сфері дистанційного навчання, стратегії
навчання і безлічі інших чинників. Розглянемо чотири основні методи оцінки.
Можна оцінювати по методу аналогії. Якщо проект А мав 10 цілей, а
його розробка зайняла 200 годин, то проект Б, що має п'ять цілей потребує на
свою розробку 100 годин. Такий метод використовується, коли про поточний
проект дистанційного навчання (ДН) мало що відоме або коли два проекти
виглядають схожими. Проте схожі проекти рідко бувають однаковими. Часто
дуже багато часу витрачається на роботу з замовником, на те, щоб зрозуміти
зміст і особливості курсу. Тому метод аналогії страждає певною неточністю.
Точніші результати дає параметричне моделювання [1]. Цей метод
полягає у виділенні певних параметрів проекту, які можна виразити чисельно.
Один з варіантів параметричного моделювання виділяє три види чинників, що
впливають на виконання проекту, а потім вводять вагові коефіцієнти для
кожного з них. До цих чинників належать: досвідченість виконавців,
складність і кількість учасників проекту, зовнішні чинники. Якщо у виконанні
проекту беруть участь дві люди: один проектує учбовий процес, другий –
створює контент курсу, то для урахування досвідченості виконавців
використовуються два множники: коефіцієнт, що враховує досвід
проектування учбового процесу (instructional design expertise factor), і
коефіцієнт, що враховує знання виконавцями контента курсу (content
knowledge expertise factor). Перший із цих коефіцієнтів може мати значення від
0,5 до 1,5. Якщо роботу виконує досвідчений фахівець, множник рівний 0,5,
якщо подібного досвіду немає – множник ближче до 1,5. Другий множник
може змінюватися від 0,75 до 4. Чим менше знань мають виконавці, тим вище
цей коефіцієнт. «Самий досвідчений» має коефіцієнт 0,75. Другий чинник
характеризує організаційну складність проекту. Він враховує додаткові втрати
часу, пов'язані з організаційними питаннями і спілкуванням учасників між
собою. Чим більше людей працює над проектом, тим вище рівень складності.
Якщо в проекті беруть участь декілька чоловік, коефіцієнт рівний 0,1, при
великій кількості учасників – 0,2.
81
Зовнішні чинники не пов'язані з роботою за проектом. Відповідний
коефіцієнт враховує додаткові витрати часу учасників проекту, наприклад, на
перевірку електронної пошти, ведення листування, відповіді на телефонні
дзвінки, зустрічі, відсутність по хворобі і т.п. Залежно від характеру роботи
цей коефіцієнт складає від 0,25 до 0,35. Якщо члени групи беруть участь у
виконанні декількох завдань, цей коефіцієнт може бути ще вище.
У найпростіших курсах ДН інтерактивність не використовується – той,
хто навчається просто прочитує інформацію з екрану. Але чим більше
інтерактивних слайдів, тим більше часу потрібно на створення курсу.
Коефіцієнт, що враховує інтерактивність, може змінюватися від 1 (немає
інтерактивних слайдів) до 4 (курс з високим ступенем інтерактивності).
Параметричне моделювання дозволяє ефективно визначити час,
необхідний для виконання проекту. Однак всі використовувані коефіцієнти
насправді є припущеннями. Важко насправді достатньо точно визначити
рівень інтерактивності, рівень досвідченості виконавця або об'єм зусиль, які
буде потрібно для отримання від експертів по даній темі необхідних знань. До
того ж є небезпека захопитися виділенням різних чинників, що впливають на
виконання проекту. Наприклад, як чинник можна використовувати наявність у
замовника досвіду використання ДН, кількість анімацій в курсі, число
учасників проекту і ін.
Великий інтерес представляє метод декомпозиції [2]. Декомпозиція
проекту – це розбиття основних цілей проекту на дрібніші завдання до такого
рівня, щоб виконання кожного елементарного завдання можна було оцінити за
часом. Цей метод широко використовується в управлінні проектами.
Декомпозиція є найбільш точним методом оцінки часу на виконання проекту,
але його використання саме по собі вимагає витрат часу. Зате, визначивши у
такий спосіб час на створення одного учбового фрагмента, можна оцінити
загальні витрати часу на учбовий курс, помноживши цей час на загальну
кількість фрагментів. До недоліків такого методу можна віднести той факт, що
забувши одне із завдань або неправильно оцінивши його, як наслідок маємо
неточність в загальній оцінці часу виконання всього проекту. Крім того, при
складанні розкладу проекту необхідно враховувати, що деякі завдання можуть
виконуватися паралельно [3].
Ще один метод – орієнтація на витрати часу для створення учбових
курсів в інших компаніях. Якщо в більшості організацій на створення курсу
тривалістю 1 годину потрібний 100 годин, можна використовувати цю оцінку.
2. Розрахунок часу створення дистанційних курсів. Витрати на
переробку матеріалу курсу в цілому складаються з витрат на переробку
кожного з занять дисципліни [4, 5]. В свою чергу з витрат часу на
виготовлення кожного з курсів складаються витрати на весь блок дисциплін за
окремим напрямком підготовки вищого навчального закладу (ВНЗ), а вже з
цих витрат людино-годин складаються витрати на переробку друкованих
матеріалів за всіма напрямками підготовки.
82
Ця залежність може бути описана наступним чином:
T ПМВНЗ  Т ПМНП  n ,
(1)
де T ПМ ВНЗ – середнє значення часу підготовки гипермедійної форми
матеріалу за всіма напрямками підготовки ВНЗ; Т ПМ НП – середнє значення
часу підготовки матеріалу за всіма дисциплінами окремого напряму
підготовки ВНЗ; n – кількість напрямів підготовки у ВНЗ.
В свою чергу для середнього часу підготовки матеріалу за всіма
дисциплінами окремого напряму підготовки може бути запропоновано
наступний математичний вираз:
(2)
T ПМНП  Т ПМДК  m ,
де Т ПМ ДК – середній час підготовки матеріалу одного з дистанційних курсів
за окремим напрямом підготовки; m – кількість дисциплін за окремим
напрямом підготовки.
Кожен з дистанційних курсів є сукупністю гипермедійних матеріалів:
лекційних, практичних, лабораторних занять, занять з курсового проектування
та по виконанню розрахунково-графічних робіт. За кожною темою курсу
розробляється тест. Також має місце підсумкове тестування [6 – 8]. Розробка
всіх цих елементів потребує витрат часу. В залежності від того, хто веде
переробку матеріалів (викладач курсу, співробітник науково-дослідної
лабораторії, студент) час, витрачений на цю роботу може різниться. Таким
чином, середній час підготовки матеріалу одного з дистанційних курсів за
окремим напрямком підготовки може бути представлено наступним чином:
Т ПМ ДК  (Т ПМ Л  k )  (Т ПМ ЛБ  l )  (Т ПМ ПЗ  p) 
 (Т ПМ Т  s)  (Т ПМ КР  g ),
(3)
де Т ПМ Л – середнє значення часу на перетворення матеріалу одного
лекційного заняття в гипермедіа вигляд; k – кількість лекційних занять з
дисципліни; Т ПМ ЛБ – середнє значення часу на перетворення матеріалу
одного лабораторного заняття в гипермедіа вигляд; l – кількість лабораторних
занять з дисципліни; Т ПМ ПЗ – середнє значення часу на перетворення
матеріалу одного практичного заняття в гипермедіа вигляд; p – кількість
практичних занять з дисципліни; Т ПМ Т – середнє значення часу на
перетворення матеріалу одного тесту в гипермедіа вигляд; s – кількість тестів з
дисципліни; Т ПМ КР – середнє значення часу на перетворення матеріалу
одного заняття з курсового проектування в гипермедіа вигляд; g – кількість
занять по курсовому проектуванню з дисципліни.
Кожне з наведених середніх значень часу на перетворення матеріалу
одного заняття є відношенням загального часу на перетворення усіх
83
навчальних занять цього виду до їх кількості
Т ПМ ПЗ  (TПМ ПЗ1  TПМ ПЗ2    TПМ ПЗn ) / p .
(4)
Рівень кваліфікації виконавця робіт щодо перетворення друкованого
матеріалу занять за дисципліною на їх дистанційний вигляд (гипермедійну
форму) значно впливає на витрачений на переробку матеріалу час як було
підкреслено раніше. Корегувальні коефіцієнти – q1, q2, ..., qn значно впливають
на значення загального часу, витраченого на переробку матеріалу
дистанційних курсів за всіма напрямками підготовки того чи іншого вищого
навчального закладу. Виходячи з цього, формула для підрахування середнього
значення часу підготовки гипермедійної форми матеріалу за всіма напрямками
підготовки ВНЗ прийме наступний вигляд:
T ПМ ВНЗ  (((Т ПМ Л  k )  (Т ПМ ЛБ  l )  (Т ПМ ПЗ  p) 
 (Т ПМ Т  s)  (Т ПМ КР  g )  m)  n)  q,
(5)
де q – середнє значення суми усіх коефіцієнтів
(6)
q  q1  q 2    q n .
Висновки. Таким чином, можно зробити висновок, що продуктивність
процесу перетворення друкованого матеріалу курсів дисциплін у дистанційну
форму є актуальної задачею на цей час та пропорційно залежить від
виконавців процесу перетворення і застосованих методів оцінки часу розробки
дистанційних курсів.
Список літератури: 1. Karl M. Kapp Как оценить время на разработку курса дистанционного
обучения? // http:// www.learningcircuits.orc. 2. Андреев А.А. Введение в дистанционное обучение.
Учебно-методическое пособие. – М.: ВУ, 1997. – 145 с. 3. Карпенко М.П., Помогайбин В.Н.
К вопросу о становлении новой педагогической парадигмы и ее технологическом обеспечении
// Мир психологии. – 1998. – №.4. – С. 34–37. 4. Солдаткин В.И., Андреев А.А. Некоторые
проблемы системной организации дистанционного обучения / Труды 4-й научно-методической
конференции "Заочное и дистанционное образование: реализация Государственных
образовательных стандартов". – М.: Московский государственный заочный институт пищевой
промышленности. – 1998. – 129 с. 5. Солдаткин В.И., Андреев А.А., Лупанов К.Ю. Проблемы
разработки учебно-методических пособий для системы дистанционного образования // Материалы
IХ международной конференции "Применение новых технологий в образовании". – Троицк:
"Байтик", 1998. – 252 с. 6. Review of Recearch and Development in Technologies for Education and
Training: European Commission, DGXIII Telecommunications, Information Market and Exploitation of
Research. Legal Notice., 1998. – 350 p. 7. Якусевич Ю.Г. Організація дистанційного навчання в
освітньому порталі // Збірник праць V Міжнародної науково-практичної конференції студентів,
аспірантів та молодих вчених "Системний аналіз та інформаційні технології". – Київ: КПІ, 2003. –
С. 222–224. 8. Гаевская Е.Г., Винницкая М.А. Методические аспекты организации ДО. – М.: ВУ,
1999. – 98 с.
Поступила в редакцію 14.04.2006
84
УДК 681.32
В.В. КАРАСЮК, канд. техн. наук, НЮАУ (г. Харьков)
ОПИСАНИЕ КОНЦЕПЦИЙ ПРЕДМЕТНОЙ ОБЛАСТИ НА БАЗЕ
ОНТОЛОГИЙ ДЛЯ СИСТЕМ ОБУЧЕНИЯ
У статті розглянута модель схеми знань для систем електронного навчання. Для опису
концептуальної моделі пропонується використати ациклічний орієнтований граф. Також
пропонується процедура автоматичного поповнення бази знань за рахунок вибору відповідної
інформації із Internet. Ця процедура включає апарат генотипів, що підвищує швидкість та зменшує
складність алгоритмів формування онтологій. Розглянуті зв’язки між концепціями у моделі
онтології проблемної області. Вказані обмеження, які поставлені у поточній реалізації даної
процедури та перспективні напрямки досліджень.
In article the model of organization of knowledge base for systems of electronic training is considered.
For the description of conceptual model it is offered to use acyclic oriented graph. Procedure of automatic
updating of the knowledge base also is offered at the expense of a choice of the appropriate information
from Internet. This procedure is described by means of genotypes, that raises speed and reduces
complexity of algorithms of formation ontologies. The communications between the concepts in model of
ontologies of a subject domain are considered. The restrictions are specified which are put in the current
realization of this procedure and the perspective directions of researches are specified.
Введение. Электронное обучение (ЭО) в настоящее время является
реальной альтернативой традиционному обучению. ЭО можно уверенно
рассматривать как удобный инструмент, который снижает затраты на
образование и повышает его оперативность. В рамках ЭО можно эффективно
организовать самостоятельную работу студентов по изучению учебных
материалов и контроль знаний. Однако построение систем ЭО наталкивается
на необходимость «ручной» подготовки электронных образовательных
материалов как обучающих, так и предназначенных для контроля. Если
решить, хотя бы частично, проблему автоматизации подготовки учебных
материалов для ЭО, то это позволило бы резко повысить эффективность и
массовость использования специализированных обучающих систем.
Анализ исследований по проблемам электронного образования и
подготовки обучающих материалов. Необходимость использования
понятийного тезауруса как средства интеллектуализации процессов обработки
информации была выявлена при разработке первых информационнопоисковых систем [1]. По данному научному направлению имеется большое
количество публикаций, что свидетельствует о становлении теоретических и
методологических основ данного направления и выработке единой
терминологии. Значительный вклад в это направление сделан учеными НТУ
«ХПИ», ХНУРЭ, Киевского НУ им. Т.Г. Шевченко, Московского
государственного университета экономики, статистики и информатики,
Современного гуманитарного университета, и другими. Однако заметно, что
85
отсутствует единый подход к построению и реализации систем ЭО. Для
логического анализа формальных понятий предметной области систем ЭО
применяются: аппарат соответствия Галуа, теория решеток, операции над
графами, генетические алгоритмы [2], нейронные сети, онтологии и другие
математические модели. В то же время, как отмечено в [3], построение
логически четкой иерархии научных терминов – практически невозможно.
Проблемы автоматизации подготовки учебного контента для ЭО
рассмотрена в работах Арзамасцева А.А. [4], Парфенова И.И. [5],
Шуневича Б.И. [6], Кухаренко В.Н. [7], Роберта И.В. [8], Каука В.И.,
Образцова П.И., Кривули Г.Ф., Преждо Л.Н., Якубайтиса Э.Я. и других.
Перспективными, с учетом возможностей автоматизации поддержки, являются
системы на основе семантических сетей. В то же время мало внимания
уделено в указанных работах проблеме содержания предметной базы знаний
таких систем в актуальном состоянии, особенно в предметных областях с
формализованным и динамически изменяющимся содержанием (например, в
области информатики). Актуальность данной проблематики настолько высока,
что в рамках консорциума W3C разработан язык OWL, который призван
упростить процесс поиска знаний в документах Интернета, возложив
необходимость знания предметной области и описание контекста поиска
полностью на авторов документа и систему поиска. С другой стороны,
содержательное наполнение учебных материалов для ЭО достаточно
формализовано, что снижает уровень требований к процедурам их обработки.
Цель
статьи.
Рассмотреть
принципы
построения
средств
автоматического отбора учебного материала по заданной тематике.
Предложить модель представления данных в базе знаний обучающей системы,
которая будет поддерживаться соответствующей технологией актуализации
данных в ней. Разработать на основе предложенной модели процедуру
автоматического пополнения базы знаний обучающей системы.
Модель представления схемы знаний для электронного обучения.
Современные модели представления и интеграции информационных ресурсов
активно развиваются и внедряются. Онтологии позволяют производить
автоматизированную обработку семантики информации, предоставленной в
Интернет, с целью её эффективного использования (представления,
преобразования, поиска). Соответствующий принцип обработки данных
базируется на представлении Интернета как глобальной базы знаний и
ориентирован не на осмысление информации, а на обеспечение семантической
интероперабельности информационных ресурсов, т.е. автоматизированную
интерпретацию и обработку информации. Поскольку онтология определяет
термины конкретной предметной области знаний, она должна описываться
формальным языком, основанным на принципах математической логики.
Онтология представляется в виде гетерархии (ослабленной или
запутанной иерархии), в которой вершины представляют концепции
86
предметной области. Свойства каждой концепции описываются с помощью
механизма «атрибут – значение». Формально такое описание представляется в
виде ациклического ориентированного графа. Связи между концепциями
описываются с помощью дополнительных логических утверждений. В общем
случае вершины могут иметь более одного предшественника.
Язык XML предназначен для разметки документов произвольной
структуры. Корректные XML документы содержат дерево вложенных
открывающих и закрывающих тегов, каждый из которых может содержать
несколько пар «атрибут – значение». Таким образом, если выполнить
предварительную разметку документа, то с помощью XML можно создать
онтологию отдельного документа и целой предметной области. Консорциум
W3C активно работает над внедрением XML в структуру SemanticWeb – Web
следующего поколения. Но документы в сети Интернет, как правило, в
настоящее время такой разметки не имеют. Поэтому использование XML для
этих целей отодвигается на дальнюю перспективу.
Можно сделать вывод, что схему знаний учебных материалов для
электронного обучения целесообразно представить как онтологию в виде
ациклического ориентированного графа.
Сущность процедуры автоматического формирования базы знаний.
Распространенные в Интернет мультиагентные механизмы поиска тем не
менее оставляют пользователям «словарную проблему» (vocabulary problem).
Она состоит в том, что, с одной стороны, слова многозначны, а с другой –
одни и те же концепции могут быть выражены по-разному. Очень трудно
построить онтологию, которая соответствовала бы тематическому
разнообразию информации в источниках базы знаний. Пример частного
решения этой проблемы – реализация в 90-х годах прошлого века в машине
поиска AltaVista сервиса AltaVista Refine, который позволял устранять
неоднозначность терминов запроса с помощью словаря совместной
встречаемости слов [9].
В онтологии используются ограниченные виды связей между
концепциями. Например, в [10] предлагается использовать 11 видов связей:
ввести, передать функции обладания (дать, взять, …), неявное действие,
передать информацию, изменить местоположение, создавать мысли, двигать,
прикладывать силу, вытащить наружу, физически захватить, произвести звук,
направить орган чувств к определенному стимулу. Для реальной предметной
области, с которой в настоящее время проводится моделирование, достаточно
использовать 7. «Концентраторами» сети онтологии на первом этапе являются
концепции система, файл, папка, ярлык, и другие базовые понятия.
Наполнение базы знаний системы ЭО начинается с терминов, которые
впоследствии могут стать «концентраторами». Далее она будет дополняться
смысловыми типами, по которым поисковые агенты в источниках знаний
будут собирать информацию. Далее включаются механизмы, характерные для
генетических алгоритмов. Работа генетического алгоритма начинается с
87
кодирования базы, то есть с формирования хромосом. Каждый ген в
хромосоме характеризуется своим значением (концепцией). Закодированная
хромосома является генотипом. Если рассмотренным образом представить
содержательную структуру собранного материала, то формальными методами
можно определить тождественность хромосом существующей базы знаний
обучающей системы и исследуемого источника. То есть возможно
идентифицировать структуру предложений потенциального учебного текста.
Далее необходимо определить его качество и включить его в виде новых
неколайдерных генов (концепций) в существующую структуру онтологии.
Таким образом идет расширение онтологии базы знаний в заданной
проблемной области.
В настоящее время программно реализуется вариант системы, в котором
моделируется онтология (база знаний), включающая понятия из проблемной
области курса информатики. В структуре базы знаний поддерживаются
отношения типа «IS-A» [11].
Выводы. В процедуру автоматического формирования онтологии
системы ЭО можно ввести аппарат генотипов, что повышает скорость работы
и сокращает сложность алгоритмов перебора. В дальнейшем планируется
изучить возможность повышения качества формирования онтологии
предлагаемого вида и разработать процедуру получения учебного текста из
имеющейся онтологии.
Список литературы: 1. Шемакин Ю.И. Тезаурус в автоматизированных системах управления и
обработки информации. – М.: Воениздат, 1974. – 192 с. 2. Карасюк В.В. Модель системы
управления знаниями в обучении // Вісник Національного технічного університету "Харківський
політехнічний інститут". Збірник наукових праць. Тематичний випуск: Системний аналіз,
управління та інформаційні технології. – Харків: НТУ "ХПІ". – 2005. – № 18. – С. 97 – 100.
3. Налимов В.В. Вероятностная модель языка. О соотношении естественных и искусственных
языков. – М.: Наука, 1979. – 304 с. 4. Китаевская Т.Ю., Арзамасцев А.А., Слетков Д.В.
Автоматизированная система проектирования содержания обучения информатики в вузе
// Информатика и образование. – 2004. – № 12. – С. 100 – 105. 5. Парфенова М.Я., Парфенов И.И.
Методологический базис интеллектуальности открытых информационных систем дистанционного
обучения // Открытое образование. – 2002. – № 6. – С. 32 – 42. 6. Шуневич Б.И. Дистанционное
обучение на Украине: учебные программы, курсы, программное обеспечение // Открытое
образование. – 2003. – № 2. – С. 41 – 48. 7. Виртуальная учебная среда "Web-класс ХПИ" / Под
ред. Кухаренко В.Н. – Харьков: НТУ "ХПИ", 2003. – 59 с. 8. Роберт И.В. О понятийном аппарате
информатизации образования // Информатика и образование. – 2002. – № 12. – С. 2–6; 2004. – № 5.
– С. 22 – 29; 2004. – № 6. – С. 63 – 70. 9. Альшанский Г.А., Браславский П.И., Титов П.В.
Формирование информационных запросов к машинам поиска интернета на основе тезауруса:
семантико-ориентированный подход // Труды VIII Международной конференции по электронным
публикациям "EL-Pub2003". 8 – 10 октября 2003 года, Новосибирск, Академгородок,
http://www.ict.nsc.ru/ws/elpub2003/5964/. 10. Шенк Р. Обработка концептуальной информации. –
М.: Энергия, 1980. – 360 с. 11. Цаленко М.Ш. Моделирование семантики в базах данных. – М.: Гл.
ред. физ-мат. лит., 1989. – 288 с.
Поступила в редакцию 07.04.2006
88
УДК 621.38
О.А. КОЗИНА, канд. техн. наук, Д.Н. КОЗИН,
В.Д. РЫЖИКОВ, д-р физ.-мат. наук
ВОЗМОЖНОСТЬ ПРИМЕНЕНИЯ ДВУХЭНЕРГЕТИЧЕСКИХ
ДЕТЕКТОРОВ ДЛЯ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
ВРЕМЕНЕМ ЭКСПОЗИЦИИ В МЕДИЦИНСКИХ
РЕНТГЕНОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ
У статті показана можливість використання двохенергетичного детектування під час визначення
тривалості експозиції у рентгенографії. Розроблена структура блоків детектування типу
сцинтилятор-фотодіод на базі критерієв вибору оптимального класу сцинтилятору. Розроблена
блок-схема автоматичного експонометру.
Possibility of multi-energy detection using for expose time determination in X-ray diagnostics are
demonstrated. Structure of detection block with scintillator-photodiod type is developed based on choice
criterion of optimal class of scintillator. Block-scheme of automatic expose rate measurer is developed.
Постановка проблемы. Вклад медицинского облучения в коллективную
дозу облучения населения достигает 30% и формируется за счет
диагностических и профилактических рентгенологических медицинских
исследований, охватывающих все возрастные группы населения. Одной из
важнейших предпосылок уменьшения лучевых нагрузок на пациентов
является организация системы контроля и учета доз медицинского облучения.
Такая система должна уравновешивать уровни эффективной дозы
рентгеновского облучения с возможным уровнем облучения, необходимым
для получения максимума полезной диагностической информации [1].
Эффективная доза – величина, используемая как мера риска
возникновения отдельных последствий облучения во всем теле человека и в
отдельных его органах и тканях с учетом их радиочувствительности. Значения
эффективной дозы на практике не могут быть непосредственно измерены. Для
их определения проводятся сложные расчеты технических характеристик
рентгеновской аппаратуры, например, напряжения на аноде рентгеновской
трубки, толщины фильтра выбранного материала или спектр рентгеновского
излучения, геометрических характеристик области исследования и
дозиметрических
характеристик,
например,
радиационного
выхода
рентгеновского излучателя и экспозиции. Область диагностических
рентгенологических исследований, возраст и конституция пациента
определяют выбор напряжения на рентгеновской трубке, фильтра и материала
анода трубки. При выборе величин анодного тока и времени экспозиции
исходя только из графиков для конкретного типа пленок не учитываются
действительные характеристики излучения, что приводит к возникновению
недо- и переэкспонированию, т.е. к потере диагностической информации и,
следовательно, к необходимости в повторном исследовании или к пропуску в
89
биообъекте патологий. Поэтому измерение мощности дозы и автоматическое
экспонирование при рентгеновском исследовании существенно улучшает
качество диагностики. Для определения точного времени экспозиции, при
котором обеспечивается минимальная доза облучения пациента для
достижения максимально качественного рентгеновского снимка, необходимо
знать спектральный состав рентгеновского излучения, либо показатель, его
характеризующий.
Анализ литературы. В экспонометрии раньше старались получить
наиболее
близкую
зависимость
чувствительности
детекторов
к
чувствительности пленки [2, 3]. В настоящее время в связи с невозможностью
сделать универсальный детектор для всех возможных типов применяемых
пленок и люминесцентных экранов, приоритетным методом стало измерение
пространственного распределения мощности дозы за биообъектом. Для
контроля мощности дозы в отдельных точках диагностической области
используют различные матрицы и экраны [4]. Использование в блоках
регистрации рентгеновского излучения детекторов с разной энергетической
зависимостью по чувствительности позволяет получить максимально
контрастные изображения биообъектов с разными атомными номерами для
разделения костей и мягких тканей [5, 6].
Цель работы. Обосновать выбор типа сцинтиллятора и конструкции
двухэнергетического детектора в разработанной схеме экспонометра для
медицинской рентгенографии.
Теоретическое обоснование. Совокупность требований, предъявляемых
к детекторам для медицинской рентгенографии, включает высокую
чувствительность, стабильность энергетических характеристик, линейность
характеристик в динамическом диапазоне не менее 10 4, а также отсутствие
фотопамяти с точностью не более 0,1% через 5 – 20 мс [7]. Поэтому из
твердотельных детекторов типа полупроводниковый детектор, сцинтилляторФЭУ и сцинтиллятор-фотодиод для качественной экспонометрии следует
выбирать последнюю структуру.
Пусть на исследуемый биообъект падает поток квантов рентгеновского
излучения с плотностью потока N(Е) и перед детектором стоит фильтр, тогда
плотность потока квантов, прошедших фильтр и биообъект будет равна
N Ф ( E )  N ( E )e O ( E ) d O e Ф ( E ) dФ ,
(1)
где  O ( E ) – линейный коэффициент ослабления в биообъекте;  Ф ( E ) –
линейный коэффициент ослабления в фильтре; d O
– толщина биообъекта;
d Ф – толщина фильтра. На площади 1 см2 детектора поглощается
90
N ДЕТ ( E )  N Ф ( E )(1  e
СЦ ( E ) d СЦ
)
 СЦ ( Е )
 СЦ ( Е )
[-квантов/с],
(2)
где  CЦ ( E ) – линейный коэффициент ослабления в сцинтилляторе;  СЦ –
коэффициент электронного преобразования сцинтиллятора; d СЦ
– толщина
сцинтиллятора. Следовательно, поток энергии, поглощаемый на площади 1 см2
сцинтилляционного детектора равен
EДЕТ  1,6 10 19
Emax
N
ДЕТ ( E ) EdE
[Вт/см2],
(3)
0
где E – энергия -кванта [эВ], а ток в фотодиоде:
I ДЕТ  EДЕТ СЦ К СВ К СБОР S СЦ ФД ,
(4)
где  СЦ – конверсионная эффективность сцинтиллятора;  ФД – квантовый
выход фотодиода; S СЦ – площадь сцинтиллятора в см2; K СБОР – коэффициент
светособирания в сцинтилляторе; K СВ – коэффициент спектрального
согласования излучения сцинтиллятора и чувствительности фотодиода в A/Вт,
который можно вычислить по формуле

K СВ 
I
0
СЦ ( )K ФД ( ) d
,

I
(5)
СЦ ( ) d
0
где I CЦ ( ) – спектр высвечивания сцинтиллятора; К ФД ( ) – спектральная
чувствительность фотодиода в А/Вт. Мощность дозы P1 перед фильтром
детектора определяется как
1,6 10 12
P1 
0,11
EMAX
N
O ( E ) E В ( E )dE
, [P/c],
(6)
0
где  В – линейный коэффициент преобразования рентгеновского излучения в
воздухе, см-1; 1,610-12 – энергетический эквивалент 1 эВ, ерг/эВ; 0,11 –
энергетический эквивалент 1 Р в воздухе, эрг/(см 3Р) [7].
Анализ приведенных выражений показывает, что при использовании двух
детекторов с разными фильтрами, либо использование различных
сцинтилляторов в двух детекторах позволит оценить отношение сигналов,
91
характеризующее спектральный состав излучения падающего на детектор. При
использовании в экспонометре двух одинаковых детекторов, когда только
один детектор используется с фильтром, отношение токов в фотодиодах двух
детекторов будет оставаться постоянным при одном и том же значении
анодного напряжения, т.к. плотность падающего на детектор потока прямо
пропорциональна току на рентгеновской трубке. Пропорциональное
увеличение тока на рентгеновской трубке приводит к соответствующему
увеличению мощности дозы и пропорциональному увеличению токов обоих
детекторов, что видно из выражения:
Emax
I2

I1

Emax
N ДЕТ 2 ( E ) EdE

0
Emax
N
N


N

ДЕТ1 ( E ) EdE
0
N ( E )e   O ( E ) d O e   Ф ( E ) d Ф
(1  e
 СЦ ( E ) d СЦ
0

N ( E )e
EdE
Emax
ДЕТ1 ( Е ) ЕdE
Emax
 Ф ( E ) d Ф
0
0
Emax
ДЕ Т 1 ( E )e
 O ( E ) d O
(1  e
 СЦ ( E ) d СЦ
0
)
)
 СЦ ( Е )
 СЦ ( Е )
 СЦ ( Е )
 СЦ ( Е )
(7)
EdE
.
EdE
Отношение (7) зависит от плотности распределения падающего на биообъект
потока по энергиям -квантов, т.е. от напряжения на аноде и поглощения в
биообъекте. Если известны материал анода и фильтра рентгеновской трубки,
то можно отградуировать экспонометр по значениям напряжения на аноде и
определять напряжение на аноде в любой момент времени. Это позволит более
точно определять экспозицию для выбранного типа пленки для исследования
объекта.
Скорректировать
дозу
облучения
биообъекта
в
ходе
диагностического исследования позволит блок автоматического управления
длительностью экспозиции на основании отношения токов в двух фотодиодах
и мощности дозы измеренной одним детектором.
Результаты и обсуждение. Для практической реализации полученных
теоретических результатов предлагается использовать схему экспонометра,
представленную на рис. 1. На первом этапе экспонометр определяет
предварительное значение времени экспозиции на основании измерения
изменений анодного напряжения во времени без биообъекта и рентгеновской
пленки. На втором этапе использования экспонометра проводится
корректировка времени экспозиции в зависимости от характеристик
биообъекта в реальном масштабе времени.
92
Отношение сигналов детекторов, полученное практически, представлено
на рис. 2, и соответствует теоретическим расчетам (рис. 2) [8, 9]. Необходимо
лишь подбирать материал и толщину фильтров перед детекторами в
зависимости от используемого диапазона напряжений на трубке. Часто в
медицинской рентгенографии используют медные или алюминиевые фильтры.
В данном случае для 30 – 60 кВ – это 0,3 мм меди для одного детектора, 0,5 мм
меди для второго детектора, для 60 – 150 кВ – это 0,5 мм меди для одного
детектора, 0,9 мм меди для второго.
Сцинтиллятор для детектора выбирался на основе таких критериев:
– уровень послесвечения ≤ 0,05% через 10 мс и время высвечивания
≤ 20 мкс [9, 10]. Это необходимо для отслеживания изменения анодного
напряжения в виде пульсаций, приводящих к уменьшению эффективного
анодного напряжения. Основная причина пульсаций анодного напряжения –
несовершенство выпрямления;
– радиационная стойкость более 106 рад для обеспечения долговечности
работы детекторов в жестких условиях облучения;
– эффективное поглощение и преобразование рентгеновского излучения в
диапазоне 15 – 150 кВ (см. рис. 3), что включает в себя высокую
конверсионную эффективность, длина волны высвечивания сцинтиллятора
должна лежать в диапазоне 500 – 900 нм для наилучшего согласования с
Si-фотодиодом, а так же наилучшие условия светособирания в сцинтилляторе.
Рентгеновский аппарат
Реле времени
– Напряжение
на аноде
– Анодный ток
Объект
Пленка
Компьютер
Экспонометр
Детекторы
Предварительный
усилитель
АЦП
Рис. 1. Схема экспонометра
93
– Тип пленки
– Тип объекта
I1 /I2
0.9
0.8
0.7
0.6
0.5
0.4
0.5мм Сu/0.3мм Cu - экспере мент
0.3
0.9мм Сu/0.5мм Cu - экспер емент
0.2
0.5мм Сu/0.3мм Cu - расчет
0.1
0.9мм Сu/0.5мм Cu - расчет
0
40
50
60
70
80
90
100
110
120
130 140
150
160
U, кВ
Рис. 2. Зависимость выходных токов детекторов от напряжения на рентгеновской
трубке
I, отн.ед
600
500
400
300
ZnSe(Te)
CsI(Tl)
CdWO4
200
100
E, кэВ
0
0
20
40
60
80
100
120
140
160
Рис. 3. Зависимость выходного сигнала детекторов от энергии гамма квантов
Наиболее подходящим сцинтиллятором оказался ZnSe(Te), имеющий
лучшие характеристики по этим критериям (см. табл.).
Выводы. В данной работе показана возможность использования
двухэнергетического детектирования рентгеновского излучения для
определения длительности экспозиции. Это позволит определять не только
мощность дозы, но и корректировать время экспозиции в зависимости от
изменяющегося спектрального состава излучения на рентгеновских трубках
94
диагностических комплексов. На основании сформулированных критериев
был выбран сцинтиллятор ZnSe(Te) для детекторов типа сцинтилляторфотодиод, что в свою очередь определило структуру двухэнергетического
детектирования. Совпадение теоретических и практических результатов
подтверждает целесообразность использования в блоке детектирования
разработанного экспонометра двух одинаковых детекторов с медными
фильтрами различной толщины перед детекторами.
Таблица
Характеристики сцинтилляционных кристаллов, используемых
для детекторов типа сцинтиллятор-фотодиод
Параметр
ZnSe(Te)
CdWO4
CsI(Tl)
Конверсионная эффективность
19,4
3,5
15
Световыход, %
120
20
100
Время высвечивания , мкс
5–7
5–9
1
г/cм3
5,4
7,9
4,5
Эффективный атомный номер Z
33
66
52
Максимум излучения m при 300 K, нм
610
490
550
Послесвечение,% (через 10 мс)
0,05
0,05
1–8
0,1–0,3
0,02–0,05
0,05
Коэффициент преломления m
2,4
2,25
1,8
Предел радиационной стойкости по
рентгеновскому излучению, Рад
107
107
104
Плотность,
Коэффициент поглощения для m,
cм-1
Список литературы: 1. Методические указания по методам контроля МУК2.6.1.1797-03
"Контроль эффективных доз облучения пациентов при медецинских рентгенологических
исследованиях" – М.: Минздрав РФ, 2004. 2. Рентгенотехника: Справочник / Под. ред.
В.В. Клюева. – М.: Машиностроение, 1980. – 431 с. 3. Рыжиков В.Д. Сцинтилляционные
кристаллы полупроводниковых соединений АІІBVI. Получение, свойства, применение. – М.:
НИИТЭХИМ, 1989. 4. U.S. Patent 4,250,103, feb. 10, 1981. 5. Harrison’s R.M. Digital radiography – a
review of detector design, NIM, 1991. – A310. – P. 24–34. 6. Barnes G.T., Sones R.A., Tesic M.M,
Morgan D.R., Sanders J.N. Detector for dual-energy digital radiography / Radiology. – August 1985. –
Vol.156. – №. 2. – P. 537–540. 7. Добромыслов В.А., Румянцев С.В. Радиационная интроскопия. – М:
Атомиздат, 1972. – 352 с. 8. Немец О.Ф., Гофман Ю.Ф. Справочник по ядерной физике. – К.:
Наукова думка, 1975. 9. Атрощенко Л.В., Гринев Б.В. Рыжиков В.Д. и др. Кристаллы
сцинтилляторов и детекторы ионизирующих излучений на их основе / Под ред. проф.
В.Д. Рыжикова – К.: Наукова думка, 1998. 10. Ryzhikov V., Kozin D., Grinev B., Lisetskaya E.,
Katrunov K., Kvyatnitskaya V., Chernikov V. Scintillator-photodiode detectors for scanning introscopy
with high-spatial resolution, NIM, A505. – 2003. – P. 58.
Поступила в редакцию 26.04.2006
95
УДК 519.81
О.А. КОЗИНА, канд. техн. наук, ХНУРЭ (г. Харьков)
СИСТЕМА ОПТИМИЗАЦИИ ИНФОРМАЦИОННОЙ
ЭФФЕКТИВНОСТИ КОМПЛЕКСОВ ЛАБОРАТОРНОЙ
ДИАГНОСТИКИ
Розглянуто принципи застосування моделі інформаційного показника ефективності
функціонування комплексів лабораторної діагностики. Аналізуються можливості програмної
системи для проведення чисельного експерименту з оцінки діагностичних результатів
лабораторних досліджень.
Principles of using of functioning efficient informational index for laboratory diagnostic systems are
considered. Abilities of researched software system for numeric experiment of laboratory test results
estimation are analyzed.
Постановка проблемы. Диагностические комплексы, которые
используются в крупных лабораториях, больницах и клиниках во всем мире,
часто являются зеркалом исторического развития медицинского учреждения.
По этой причине комплексы лабораторной диагностики (КЛД) представляют
собой связанные в единый комплекс блоки-модули по проведению
специальных типов лабораторных исследований как одного производителя,
так и разных. Оценить наиболее важную – медицинскую эффективность
функционирования таких КЛД можно путем применения информационного
подхода к анализу проблемы. Информационный анализ эффективности КЛД
позволяет численно сопоставить результаты лабораторных исследований,
проведенных с помощью анализируемого КЛД, с информационной
потребностью в результатах такого лабораторного исследования для процесса
диагностики у конкретного пациента. При этом информационный результат
КЛД определяется только структурой самого КЛД. В то же время
информационная потребность в результатах лабораторного исследования
определяется как предрасположенностью популяции, которую обслуживает
данная клиника, к тому или иному заболеванию, так и теми диагностическими
стратегиями, которые практикуют врачи-клиницисты для данной популяции.
Поэтому информационная ценность лабораторного исследования, т.е.
количество информации, содержащееся в результате лабораторного
исследования, которое необходимо для различения клинических состояний у
пациента, определяет полезность применения данного КЛД в конкретном
лечебном учреждении.
Анализ литературы. Проблемам вычислительной диагностики
посвящено достаточное количество работ за последние годы [1 – 3]. Этому
способствует
также
популяризация
«медицины,
основанной
на
доказательствах».
Однако
в
медицинской
научной
литературе
96
рассматриваются в основном возможности применения характеристических
кривых для разделения популяции на больных и здоровых по критической
точке разделения [2, 4]. В технической литературе рассматриваются вопросы
создания тех или иных блоков КЛД без учета информационной эффективности
разработанных модулей для диагностических потребностей того лечебного
учреждения, в котором КЛД будет эксплуатироваться [3, 5]. В известных
немногочисленных
работах
[6 – 8],
посвященных
сопоставлению
информационных потребностей клиницистов в лабораторных анализах с
информационными результатами, которые дают КЛД, рассмотрены лишь
несколько типов распределений вероятности обнаружения больных для одного
типа исследования биопробы.
Цель статьи. Создание программной системы, которая численно
определяет: на сколько влияют параметры различных распределений
вероятности на информационный результат функционирования КЛД.
Исходные данные для построения системы моделирования.
Сравнение диагностической значимости лабораторного исследования L(E) с
информационным параметром результата R(E) исследования концентрации
вещества E в биопробе, т.е. с количеством информации, которое содержится в
выходной величине КЛД об анализируемом веществе E, дает объективную
численную характеристику целесообразности использования данного КЛД в
заданных клинических условиях. В предложенной системе величина
параметра результата функционирования КЛД может быть либо задана на
основе ранее полученных значений, либо рассчитана. Для расчета необходимы
данные о величинах вероятности ошибок или безотказной работы всех
функциональных блоков КЛД, которые принимают участи в движении
информационных потоков согласно анализируемому лабораторному
исследованию. В общем случае это такие блоки как блок пробоподготовки,
транспортировки биоматериалов, измерительный и вычислительный блоки, а
также модуль управления, ввода-вывода и передачи данных.
Вычисление диагностической значимости лабораторного теста L(E)
проводится в соответствии с математической моделью информационных целей
функционирования КЛД при условии первичной диагностической
неопределенности. Количество информации, которое содержится в веществе E
относительно известной группы диагнозов D, численно определяется как [6]:
L E   
 pE
K
K
x
 
D j p D j ln
x 1 j 1

p Ex D j
 pE
K
x

 
,
(1)
Dj p Dj
j 1
где К – количество клинических состояний, которые необходимо различить и
соответственно количество диапазонов, на которые необходимо разбить весь
интервал значений концентрации вещества Е в биопробе (Emin,Emax); p(EX|Dj) –
97
вероятность того, что текущее значение концентрации вещества EX(Ej,Ej+1)
при диагнозе-состоянии Dj; p(Dj) – априорное значение вероятности диагноза
Dj. В отличие от большинства характеристических кривых, построенных для
случая разделения популяции на больных и здоровых, т.е. только на два
различных клинических состояния, в предлагаемой системе можно выбрать
любое другое количество различных клинических состояний. Это может быть
и двухстороння дифференциация состояний: пониженный уровень
концентрации вещества в биожидкости, нормальный или референтный
уровень для данной популяции и повышенный уровень концентрации. В
предлагаемой системе можно добавить и степени выраженности отклонений
от референтных интервалов концентраций в качестве отдельных
диагностических состояний и тогда К может быть равно 4 или 5 (например,
были выбраны такие состояния: повышенный уровень концентрации,
нормальный, слабо пониженный и сильно пониженный). Выбор количества
диагнозов-состояний, которые могут быть дифференцированы на результатах
данного лабораторного теста и, следовательно, точек разделения представляет
собой самую спорную часть всего процесса диагностики. С одной стороны,
смещение точки разделения диагнозов влечет за собой изменения в
распределении плотности вероятности p(EX|Dj). Поэтому лучше всего
применять параметры распределения вероятности, которые были эмпирически
получены в результате статистической обработки данных для той популяции,
которую обслуживает данное лечебное учреждение. При отсутствии такой
статистики можно воспользоваться теоретически возможными параметрами
распределений [2]. С другой стороны, положение дискриминантной точки на
оси концентраций зависит от преваленса каждого диагноза у данной
популяции. Это означает, что если для выбранной популяции существует
предрасположенность к какому-либо клиническому состоянию, т.е. преваленс
p(Dj) одного из диагнозов значительно выше уровня остальных априорных
значений вероятностей диагнозов, то точка разделения таких состояний
должна быть сдвинута в сторону увеличения чувствительности лабораторного
теста. Следует также отметить, что как распределение p(EX|Dj), так и
распределение p(Dj) не являются статическими даже для одной и той же
популяции. Под воздействием быстро изменяющихся климатических условий
и состояний экологии эти распределения вероятностей могут изменяться и
поэтому должны периодически проверяться. Предлагаемая система
оптимизации позволяет быстро и объективно оценить, например, как
изменится полезность использования данного КЛД, если точка разделения
выбранных диагнозов-состояний будет смещаться в сторону уменьшения
специфичности лабораторного теста на протяжении интервала концентраций
min
max
, E реф
[ E реф
] или если преваленс одного из диагнозов увеличится.
Анализ результатов моделирования. Численный эксперимент
проводился на интервале концентраций иммуноглобулина IgG1 в сыворотке от
98
0,5 г/литр до 25 г/литр для трех состояний: пониженный уровень
концентрации IgG1 – состояние D1, нормальный уровень – состояние D2 и
повышенный уровень – состояние D3. Априорные вероятности наличия
каждого из трех состояний рассматривались для различных клинических задач
(см. табл. 1).
Таблица 1
Преваленс состояний
Априорная
вероятность состояния
D1
D2
D3
Тип клинической задачи
1 – предрасположенность к состоянию D1, когда
понижен уровень иммуноглобулинов
2 – скрининг
3 – предрасположенность к состоянию D3, когда
повышен уровень иммуноглобулинов
0.68
0.28
0.04
0.33
0.34
0.33
0.04
0.28
0.68
Для вычисления диагностической значимости лабораторного теста L(E)
использовалось выражение:
№ эксперимента
(2)
L( E )  H ( E )  H ( D)  H ( E, D) ,
где Н(Е) – безусловная энтропия концентраций иммуноглобулина; H(D) –
безусловная энтропия наличия состояний Dj; H(E, D) – совместная энтропия.
Распределение вероятности p(E,D) концентрации EX при состоянии Dj,
описано нормальным законом со средним значением концентрации m и
средним квадратическим отклонением d (см. табл. 2).
1
2
3
Распределение вероятности p(E)
Клиничес- КлиничесКлиникая задача
кая задача
ческая
1
2
задача 3
Таблица 2
Распределение вероятности p(E,Dj)
Состояние
D1
Состояние
D2
Состояние D3
m
d
min
max
m
D
m
d
m
d
m
d
11
11
11
6
6
4
5
5
5
30
30
30
18
18
20
8
8
3
8
15
15
2.5
1.5
1.5
13
18
18
4
4
4
26
21
21
4
2.5
2.5
Распределение априорной вероятности p(E) уровня концентрации EX для
клинической задачи 1 и 3 описано нормальным законом, а для клинической
задачи 2, т.е. для скрининга, равномерным (см. табл. 2). Графически динамика
изменений параметров распределений представлена на рис. 1.
Как видно по результатам эксперимента (см. табл. 3), для разделения
клинических состояний при априорно равномерной вероятности наличия
любого клинического состояния, т.е. при скрининге, необходимо больше
информации от КЛД, чем при других клинических задачах.
99
Таблица 3
№
эксперимента
Информационная цель L(E)
1
2
3
Тип клинической задачи
Априорно пониженный
уровень концентрации
28.9059
30.2858
29.8871
Скрининг
Априорно повышенный
уровень концентрации
38.7412
38.5173
38.6303
34.4544
32.5502
33.0863
Сравнение результатов эксперимента 2 и 3 показывает, что чем больше
площадь области наложения априорных распределений вероятности
концентраций p1(E) и p2(E) при прочих равных параметрах вероятностей, тем
больше информации должно требоваться от КЛД. Сравнение значений L(E)
при априорной предрасположенности популяции к пониженному содержанию
иммуноглобулина и априорно повышенному уровню концентраций для
эксперимента 1 и 2 показывает, что увеличение количества информации от
КЛД требуется при увеличении разницы между математическими ожиданиями
распределений p(E) и p(E,D).
p(EX,Dj)
p(Е)
2
1
Эксперимент 1
Эксперимент 2
D2
D1
D3
3
Е
Е
3
1
2
D1
D2
D3
Е
Эксперимент 3
1
Е
3
D1
D2
D3
2
Е
Е
Рис. Динамика изменений параметров распределений
Результаты моделирования для случая разделения только двух
клинических состояний: пониженный и нормальный уровень концентрации
100
иммуноглобулина при таких же параметрах безусловных вероятностей и таких
же трех клинических задачах представлены в табл. 4.
№ экспериментаа
Таблица 4
1
2
3
4
5
Параметры
нормального
распределения
p(E)
m1 = 9
m2 = 16
m1 = 8
m2 = 17
m1 = 9
m2 = 16
m1 = 9
m2 = 16
m1 = 9
m2 = 16
d1 = 2
d2 = 2
d1 = 2
d2 = 3
d1 = 2
d2 = 3,5
d1 = 2,5
d2 = 3,5
d1 = 4
d2 = 5
Точка
разделения
состояний
Информационная цель L(E)
ПредраспоРавновеложенность к роятные
пониженому состояния D2
уровню D1
Предрасположенность
к норм.
уровню D3
11.53
31.1347
42.4566
37.5749
11.83
31.2694
42.0733
37.4183
12.09
30.5669
41.8348
37.1682
12.33
30.5814
41.8289
37.1199
12.50
30.9452
41.8246
37.1141
Выводы.
Использование
системы
оценки
информационной
эффективности КЛД позволяет выбрать оптимальное соответствие между
реальными потребностями конкретного лечебного учреждения в результатах
теста и функциональными возможностями конкретного КЛД. Разработанная
система позволит быстро произвести вычисления информационных целей
данного теста при изменении клинической ситуации. Для расширения
возможностей по оптимизации информационной эффективности КЛД в
систему моделирования необходимо добавить дополнительные методики
проведения лабораторных тестов для определения информационных
показателей результата функционирования КЛД.
Список литературы: 1. Okrongly D. Taking testing to the next step // IVD Technology. – 2004. –
January/February. – P. 12 – 15. 2. Власов В.В. Эффективность диагностических исследований. – М.:
Медицина, 1988. – 256 с. 3. Staab T.A., Elling J.W. ASTM E1989-98 – The New Instrument Control
Standard // Journal of the Association for Laboratory Automation. – 1999. – Vol. 4. – № 3. – P. 40 – 42.
4. Ockene1 I.S., Matthews C.E. Variability and Classification Accuracy of Serial High-Sensitivity
C-Reactive Protein Measurements in Healthy Adults // Clinical Chemistry. – 2001. – № 47. – P. 444 –
450. 5. Huscher Cl. Olympus Laboratory Automation: The Visible Difference // Journal of the
Association for Laboratory Automation. – 1999. – Vol. 4. – № 3. – P. 4 – 5. 6. Козина О.А. Метод
оценки эффективности лабораторных систем // Медицинская техника. – 2000. – № 1. – С. 43 – 45.
7. Козина О.А,
Поворознюк А.И.
Анализ
информационной
полезности
применения
автоматизированных систем в лабораторной диагностике // Вісник НТУ "ХПІ". – Харків: НТУ
"ХПІ". – 2005. – № 46. – С. 100 – 108. 8. Lamb DA, Lopinski R, Sun DH, Janowiak D. Operational
effects of total laboratory automation // Clinical Leadersh Managament Review. – 2000. – № 14. – P. 173
– 177.
Поступила в редакцию 20.04.2006
101
УДК 651.326
Э.Н. КУЛАК, канд. техн. наук, ХНУРЭ (г. Харьков),
М.А. КАМИНСКАЯ, ХНУРЭ (г. Харьков),
О.Б. СКВОРЦОВА, канд. техн. наук, ХНУРЭ (г. Харьков)
АНАЛИЗ ТЕСТОПРИГОДНОСТИ ЦИФРОВЫХ СХЕМ НА
УРОВНЕ РЕГИСТРОВЫХ ПЕРЕДАЧ
Запропоновано метод аналізу тестопридатності цифрових схем для детермінованого тестування
більш адекватний порівняно з відомими класичними методами. Він орієнтований на комбінаційні
та послідовностні схеми і базується на топологічному аналізі їх представлення на вентильному
рівні та RTL. Отримані показники дозволяють легко модифікувати схему для мінімізації числа
несправностей.
It is proposed more suitable method of the testability analysis of the digital systems in comparison with
known classical algorithmic and probabilistic methods. It is oriented on the complex combinational and
sequential asynchronous logic circuits. Estimation of the testability is based on the topological analysis of
the circuit. The new method and above mentioned methods were approved on the circuits of different
complexity, including circuits from ISCAS’85, ‘89 Libraries. Proposed method can be used on gate-level
and RT-level circuit description.
Постановка проблемы. Современные системы генерации тестов должны
носить все более интеллектуальный характер. Такой задумана система
SIGETEST [1], разрабатываемая исследовательской группой ХНУРЭ под
руководством компании АLDEC (США). Это привело к необходимости
создания системы анализа тестопригодности, отражающей различные аспекты
развивающейся методологии тестирования. Одной из многочисленных задач,
стоящих
перед
разработчиками,
является
реализация
анализа
тестопригодности в системах автоматизированной генерации тестов
детерминированным способом (deterministic ATPG (Automatic Test Pattern
Generation)). Несмотря на значительные успехи в области проектирования
интегральных
схем,
проблема
поиска
дефектов
и
повышения
тестопригодности устройств остается актуальной. Тестопригодность – это
один из наиболее важных показателей, который должен учитываться при
проектировании цифровых устройств наряду с такими показателями, как
быстродействие и стоимость устройства. Низкий уровень тестопригодности
изделия приводит к увеличению времени и ухудшению качества тестирования
изделия, как на стадии производства, так и на стадии эксплуатации, что может
подорвать шансы производителя на успех при выходе изделия на рынок.
Существует множество методов анализа тестопригодности цифровых схем, в
том числе ориентированных на детерминированное тестирование. В процессе
проектирования тестопригодного электронного устройства учитываются такие
моменты как анализ тестопригодности (на всех этапах проектирования) и
внедрение в устройство прозрачной по отношению к нормальному
функционированию устройства DFT логики (использование стандартов
102
тестопригодного проектирования). Все эти меры ориентированы на
повышение качества теста (процента покрытия неисправностей), повышение
процента выхода годных изделий в производство (Yield Ratio) и снижение
затрат, обусловленных трудоемкостью верификации функционально и
структурно сложных схем, которые могут достигать 70% от общего времени
разработки проекта. Это и послужило причиной разработки нового метода
анализа тестопригодности.
Объект исследования: комбинационные и последовательностные схемы,
представленные на вентильном уровне и уровне регистровых передач, не
ограниченные решениями методов DFT, а также в DFT-системах для
комбинационных схем или их частей, плохо поддающихся псевдослучайному
тестированию.
Цель исследования: разработка и программная реализация в рамках
системы SIGETEST нового метода анализа тестопригодности, предваряющего
построение теста.
Для решения поставленной цели решались следующие задачи:
1) анализ существующих методов анализа тестопригодности,
ориентированных на детерминированное тестирование; 2) реализация
основных методов для получения сравнительной характеристики их
возможностей и пределов использования; 3) разработка метода расчета
показателей управляемости, наблюдаемости и тестопригодности, выявляющих
проблемные участки схем, которые необходимо модифицировать, с целью
увеличения их тестопригодности; 4) программная реализация метода в рамках
системы SIGETEST, экспериментальное подтверждение его эффективности.
Сравнительный анализ существующих методов. Первые работы в этой
области принадлежат Рутману [2] и независимо от него Стефенсону и Грасону
[3 – 4]. Эти работы были ориентированы на детерминированное тестирование.
Работа Рутмана была усовершенствована и расширена Брейером [5]. Его
результаты были обнародованы в публикациях, описывающих программу
анализа
управляемости
и
наблюдаемости
SCOAP
(Sandia
Controllability/Observability Analysis Program) [6 – 7]. Эти разработки легли в
основу для других систем, которые вычисляли значения наблюдаемости и
управляемости для детерминированных ATPG, таких как TESTSCREEN [8],
[9], CAMELOT (Computer-Aided Measure for Logic Testability) [10], и VICTOR
(VLSI Identifier of Controllability, Testability, Observability, and Redundancy)
[11], а также [12 – 14]. Перечисленные системы вычисляли множества
значений для каждой линии в схеме. Эти значения предназначены для
определения относительной степени сложности решения следующих задач:
установки линии X в 1(0) (управляемость); распространение ошибки с линии X
на первичный выход (наблюдаемость).
103
Существуют две проблемы [15]. Во-первых, не была достигнута
корреляция между значениями тестопригодности и числом проверяемых
неисправностей (качеством теста). Во-вторых, осталось невыясненным как
модифицировать схему, чтобы повысить тестопригодность. Тривиальное
решение, состоящее в добавлении дополнительных контрольных точек на
линии с плохой наблюдаемостью, а также схем, повышающих управляемость
на линии с плохой управляемостью не всегда эффективно. В [12] был
предложен более сложный подход, но его вычислительная сложность слишком
высока, чтобы он мог быть использованным на практике. В целом,
большинство существующих методов предполагают очень сложные
вычисления, применимые только для небольших схем, и трудно поддаются
анализу [15 – 16]. Анализируемые методы оказались неприемлемыми даже для
относительно небольших схем уже на первом этапе – подсчете основных
показателей.
В [18] описывается вероятностный метод анализа тестопригодности на
уровне регистровых передач. Он основан на методе Паркера-МакКласки [19] и
используется при анализе двоичных диаграмм решений (Binary Decision
Diagrams). Результаты по покрытию неисправностей существенно не
отличаются от результатов, полученных на более точном уровне
представления – вентильном уровне описания. Разработанные методы и
алгоритмы основаны на распространении сигналов в схеме, представленной
диаграммой решений. Главная цель этой работы – повысить тестопригодность
устройства и соответственно повысить качество теста на вентильном уровне и
уровне регистровых передач. В работе для сравнительного анализа были
использованы такие известные методы как SCOAP, CAMELOT, VICTOR.
Разработанный
метод,
представленный
ниже,
не
содержит
вышеописанных недостатков. Рассчитываемые показатели могут быть
использованы для построения взвешенного теста.
Описание метода анализа тестопригодности. Предложенный метод
является вероятностным методом, позволяющим осуществлять оценку путем
топологического анализа схемы вентильного уровня или уровня регистровых
передач. Значения тестопригодности вычисляются для каждого узла. Под
узлами понимаются эквипотенциальные линии схемы. Вычисляемые
показатели предназначаются для сравнительного анализа тестопригодности
узлов рассматриваемой схемы. Метод состоит из трех этапов: вычисление
показателей управляемости, наблюдаемости и тестопригодности.
Вычисление управляемости. Управляемость С – количественная мера
способности устройства устанавливать на рассматриваемой линии значение 0
(C0) или значение 1 (C1). Она зависит от логической функции вентиля и
уменьшается по мере отдаления линии от внешних входов схемы.
Управляемость может принимать относительное значение, лежащее в
интервале [0; 1].
104
C = 1 – имеется внешний вход схемы, через который можно легко
установить логические "0" и "1". C = 0 – имеется линия, которую нельзя
установить ни в одно из логических состояний. Практически значения
управляемости большинства линий лежат между границами интервале [0; 1].
Для n-входного вентиля «ИЛИ»:
C 0 (Y )  1  C 1 (Y ) ;
(1)
n
C 1 (Y )  1   C 1 ( xi ) .
(2)
i 1
Для n-входного вентиля «И»:
C1 (Y )  1  C 0 (Y ) ;
(3)
n
C 0 (Y )  1   C 0 ( xi ) .
(4)
i 1
Значения C 0 ( X i ) и C1 ( X i ) выбираются по таблице истинности примитива.
Пример.
x1
x1
x2
x2
x3
x3
aa
Yy
bb
Рис. 1. Пример схемы для анализа
C 0 ( x1)  C 0 ( x 2)  C 0 ( x3)  0,5 ; C1 ( x1)  C1 ( x 2)  C1 ( x3)  0,5 ;
C 0 (a)  1  C 0 ( x1)  C 0 ( x 2)  1  0,5  0,5  0,75 ;
C1 (a )  1  C 0 (a)  1  0,75  0,25 ;
C 0 (b)  1  C 0 ( x1)  C 0 ( x3)  1  0,5  0,5  0,75 ;
C1 ( y )  1  C1 (a)  C1 (b)  1  0,25  0,25  0,9375 ;
C 0 ( y )  1  C1 ( y )  1  0,9375  0,0625 .
Вычисление наблюдаемости. Наблюдаемость O – количественная мера
способности устройства транспортировать состояние рассматриваемой линии
на внешние выходы схемы. Наблюдаемость может принимать относительное
значение, лежащее в интервале [0; 1].
O = 1 для внешнего выхода.
105
O = 0, если невозможно обеспечить такие условия, при которых
изменение значения в узле приводило бы к изменению значения на первичном
выходе. Практически значения управляемости большинства линий лежат
между границами интервала [0;1].
Наблюдаемость узлов в схеме уменьшается от первичных выходов к
первичным входам.
В общем случае процесс распространения информации о неисправности
через элемент зависит как от способности активизировать определенный вход,
так и от способности установить фиксированные значения на некоторых или
всех других входах устройства, позволяющих активизировать путь к
определенному выходу устройства (функция управляемости этих входов), (см.
рис. 2 путь активизации X – Y – Primout).
X
X
Y
Y
Primout
...
...
Рис. 2.
Поэтому наблюдаемость определяется по формуле:
O(X – Primout) = O(Y – Primout)g,
где Primout – первичный выход устройства;
X – Y – Primout – путь активизации;
g – среднее арифметическое значений управляемостей
обеспечивающих прохождение активизации с входа X на выход Y.
g
C i ( X 1 )  C j ( X 2 )    C k ( X n 1 )
,
n 1
(7)
входов,
(8)
где n – число входов элемента; (X1, X2, , Xn-1) – набор входных значений (za),
обеспечивающих активизацию пути Xn – Y, i, j,…, k {0,1} и равны 0, если X1,
X2, , Xn-1 на наборе zа принимают нулевые значения, и равны 1, если X1, X2,
, Xn-1 на наборе zа принимают единичные значения.
Например, для трехвходового вентиля «И»
O(X1 – Primout) = O(Y – Primout)[С1(X2)+С1(X3) ]/2.
Выбираются С1(X2) и С1(X3), потому что X2 = X3 = 1 обеспечивают
активизацию пути с входа X1 на выход Y вентиля.
Если у элементов отсутствуют входы активизации, а, следовательно, и zа,
то g = 1. Примером таких элементов являются инвертор и повторитель. У них
один вход и один выход, причем наблюдаемость входа равна наблюдаемости
выхода.
106
В случае сходящихся ветвлений (рис. 3) наблюдаемость линии ветвления
определяется как среднее арифметическое наблюдаемостей этой линии по
каждому из путей (формула 9).
В данном случае не выбирается путь минимальной длины, рассчитывая
на то, что остальные пути при построении теста будут блокироваться, а
учитывается наблюдаемость по каждому из путей, поскольку может
возникнуть ситуация, когда блокировка неосуществима.
Y
Y1
...
YY
...
Y22
Y
UU
...
...
YYt
t
...
Рис. 3. Случай сходящихся ветвлений
t
O(Y  U )  [  O(Yi  U )] / t .
i 1
(9)
Наличие ветвления на выходе устройства (рис. 4) позволяет наблюдать
его состояние на нескольких первичных выходах схемы. Состояние узла Y
может наблюдаться на первичном выходе Primout 1 и на первичном выходе
Primout 2. Можно вычислить оба значения наблюдаемости: O(Y  Primout 1 ) и
O(Y  Primout 2 ).
Primout1
...
...
Y
Primout2
...
Рис. 4. Случай ветвления выхода
107
Как учитывать оба значения наблюдаемости при вычислении общей
оценки наблюдаемости узла с ветвлением выхода? Ответ следует из
сопоставления рассматриваемой задачи с задачей надежности системы с
параллельным соединением элементов. В этом случае работоспособность
гарантируется, если функционирует по меньшей мере один из параллельных
путей, т.е.
R(S) = 1 – Q(S) = 1 – [Q(каждого пути)] = 1 – [1 – R(каждого пути)],
где R – функция надежности процесса, Q – функция ненадежности процесса.
Переходя к терминологии наблюдаемости, можно сказать, что при
условии активизации одного из возможных путей состояние узла можно
успешно наблюдать на первичном выходе. Если можно активизировать
больше одного пути, то
O (составное) = 1– [1 – O(каждого Primout)].
(10)
Для случая ветвления выхода, изображенного на рис. 4, наблюдаемость
линии ветвления определяется по формуле (11).
О(Y – (Primout1, Primout2)) = 1 – ([1 – O(Y – Primout1)][1– O(Y – Primout2)]).(11)
Вычисление значений наблюдаемости узлов схемы начинается с
первичных выходов и продвигается далее через всю схему к первичным
входам.
Определение тестопригодности. Простая мера тестопригодности узла
может быть получена перемножением значений его управляемости и
наблюдаемости:
T 0 (Y )  C 0 (Y )  O(Y ) ;
(11)
T 1 (Y )  C1 (Y )  O(Y ) ;
(12)
T (Y )  (T 0 (Y )  T 1 (Y )) / 2 ,
(13)
где T 0 (Y ), (T 1 (Y )) – 0-тестопригодность (1-тестопригодность) узла Y; T(Y) –
тестопригодность узла Y.
Общий показатель тестопригодности всей схемы должен представлять
собой меру средней трудоемкости получения теста для узла схемы,
следовательно, эта мера может быть представлена как среднее арифметическое
значение тестопригодностей всех узлов схемы, т.е.
L
Tсхемы  [  T (Yi )] / L ,
i 1
(14)
Tсхемы – тестопригодность всей схемы, L – количество узлов схемы.
Для удобства интерпретации результатов берется корень восьмой степени
значений управляемости, наблюдаемости, тестопригодности.
108
Сложность
(быстродействие)
метода
расчета
показателей
тестопригодности линейная. Для расчета управляемости необходим один
проход по всем линиям схемы, от первичных входов к первичным выходам, а
для расчета наблюдаемости и тестопригодности, необходим один проход по
всем линиям схемы, от первичных выходов к первичным входам. Поэтому
порядок сложности равен 2L, где L – количество узлов (линий) схемы. Время
расчета показателей приведено в табл. 1.
Таблица 1
Время расчета показателей тестопригодности и моделирования неисправностей в
системе SIGETEST
Схема
ISCAS’85
с432
с499
с880
с1355
с1908
с3540
с6288
Число
линий
схемы
398
599
623
1015
1307
2007
4579
Число
входов
схемы
36
41
60
41
33
50
32
Время моделирования
неисправностей
на одном наборе, с
0,00135
0,0002
0,00048
0,00086
0,00612
0,00928
0,00901
Время расчета
показателей
тестопригодности, с
0,01
0,01
0,03
0,03
0,03
0,04
0,12
Значения в табл. 1 были получены с помощью системы SIGETEST на
компьютере INTEL(R) Pentium с рабочей частотой процессора 2,4 гГц и
размером памяти RAM 514796 кбайт.
Пример. Расчет показателей рассмотрен на примере комбинационной
схемы, изображенной на рис. 5.
1
2
7
bb
3
8
cc
4
5
ee
9
dd
6
a
Рис. 5. Пример схемы для анализа
109
Таблица 2
Показатели тестопригодности схемы
line
1
2
3
4
5
6
7
8
9
a
b
c
d
e
C0
0,5
0,5
0,5
0,5
0,5
0,5
0,75
0,25
0,25
0,25
0,81
0,75
0,06
0,04
C1
0,5
0,5
0,5
0,5
0,5
0,5
0,25
0,75
0,75
0,75
0,19
0,25
0,94
0,96
O
0,101
0,152
0,051
0,152
0,206
0,098
0,303
0,101
0,413
0,195
0,405
0,435
0,78
1
T0
0,051
0,076
0,026
0,076
0,103
0,049
0,227
0,025
0,103
0,049
0,328
0,326
0,047
0,04
T1
0,051
0,076
0,026
0,076
0,103
0,049
0,075
0,135
0,309
0,146
0,077
0,109
0,733
0,96
Общая тестопригодность схемы Tсхемы  0,159 .
Исследуемые классические методы анализа тестопригодности и новый
метод, предложенный в данной статье, были реализованы программно в
рамках системы SIGETEST. В качестве исходного описания схем
использовалось VHDL-описание, система SIGETEST конвертировала его во
внутреннюю модель представления схемы, которая использовалась для
исследования реализованными методами анализа тестопригодности. Методы
были апробированы на примерах схем различной сложности, в том числе на
схемах из библиотеки ISCAS’85, ISCAS’89, ISCAS’99.
Выводы Разработан новый метод расчета показателей тестопригодности
более адекватный по сравнению с известными классическими методами.
Преимущества метода:
1) отсутствие потери информации при расчете показателей
тестопригодности для схем, тестируемых детериминированным тестом;
2) простота метода, при анализе последовательностных схем (не нужно
решать систему линейных уравнений);
3) метод обеспечивает простой способ выбора участков схемы для
модификации. Полученные показатели могут быть использованы для
генерации взвешенного теста [16]. Такой подход позволит уменьшить время
тестирования. Метод может быть использован для нужд SoC [20 – 21]. Также
рассчитанные показатели могут быть использованы для внедрения пути
сканирования в схему [22].
Список литературы: 1. Zaychenko S., Melnikova O., Shahab S.K., Albitar Z.S. High-performance
Compiler of Gate-level HDL Net Lists for Testing Faults in Digital Circuits // Proceedings of the Work in
110
Progress Session. – Rennes (France). – 2004. 2. Rutman R.A. Fault Detection Test Generation for
Sequential Logic Heuristic Tree Search // IEEE Computer Repository. – Paper №. R-72-187. – 1972.
3. Grason J. TMEAS – A Testability Measurement Program // Proc. 16th Design Automation Conf. –
1979. – P. 156–161. 4. Grason J., Nagel A.W. Digital Test Generation and Design for Testability.
// Journal Digital Systems. – 1981. – Vol. 5. – № 4. – P. 319–359. 5. Breuer M.A. New Concepts in
Automated Testing of Digital Circuits // Proc. EEC Symp. on CAD of Digital Electronic Circuits and
Systems, Brussels. – 1978. – P. 69–92. 6. Goldstein L.H. Controllability/Observability Analysis of Digital
Circuits // IEEE Trans. on Circuits and Systems. – 1979. – Vol. 9. – P. 685–693. 7. Goldstein L.M.,
Thigen E.L. SCOAP: Sandia Controllability/Observability Analysis Program // Proc. 17th Design
Automation Conf. – 1980. – P. 190–196. 8. Kovijanic P.G. Computer Aided Testability Analysis // Proc.
IEEE Automatic Test Conf. – 1979. – P. 292–294. 9. Kovijanic P.G. Single Testability Figure of Merit
Proc. Intn'l. Test Conf. – 1981. – P. 521–529. 10. Bennetts R.G., Maunder C.M., Robinson G.D.
CAMELOT: A Computer-Aided Measure for Logic Testability // IEEE Proc. – 1981. – Vol. 128. –
Part E. – № 5. – P. 177–189. 11. Ratiu I.M., Peterson D.O. A Sangiovanni-Vincentelli Fast VLSI
Testability Analysis Program // Proc. Intn'l Test Conf. – 1982. – P. 397–401. 12. Chen T-H. Breuer M.A.
Automatic Design for Testability Via Testability Measures // IEEE Trans. on Computer-Aided Design. –
1985. – Vol. CAD-4. – P. 3–11. 13. Spillman R., Glaser N., Peterson D. Development of a general
testability figure-of-merit // IEEE International conference of Computer-Aided Design. –1983. – P. 34–
35. 14. Breuer M.A. The Automatic Design of Testable Circuits // Automation Test Program Generation
Proceedings of The San Francisco, USA. – 1983. – P. 3–6. 15. Abramovichi M., Breuer M.A.,
Friedman A.D. Digital systems testing and testable design // IEEE Inc. – 1998. – 760 p. 16. Stroud C.E.
A Designer’s "Guide to Built-in Self-Test.” Kluwer Academic Publishers, 2002. – 320 p. 17. Kulak E.,
Kaminskaya M., Parfentiy A., Guz O. Analysis of the Testability of the High Complexity Digital Devices
// CADSM’2005. – 2005. – Lviv-Poliana. – P. 331–333. 18. Raik J., Nommeots T., Ubar R. A New
Testability Calculation Method to Guide RTL Test Generation // JOURNAL OF ELECTRONIC
TESTING: Theory and Applications. – 2005. – № 21. – P. 71–82. 19. Parker K.P., McCluskey E.J.
Probabilistic Treatment of General Combinational Networks // IEEE Trans. on Computers. – 1975. –
№ 6. – P. 668–670. 20. Jervan G., Peng Z., Ubar R., Kruus H. A Hybrid BIST Architecture and its
Optimization for SoC Testing // IEEE 3rd International Symposium on Quality Electronic Design
(ISQED'02). – 2002. – P. 273–279. 21. Ubar R., Jervan G., Peng Z., Orasson E., Raidma R. Fast Test
Cost Calculation for Hybrid BIST in Digital Systems // Euromicro Symposium on Digital Systems
Design. – 2001. – P. 318–325. 22. Кулак Э.Н., Каминская М.А. Модификация цифровых схем с
использованием метода анализа тестопригодности TADATPG // Радиоэлектроника и информатика.
– 2005. – № 3. – C. 113–119.
Поступила в редакцию 23.03.2006
111
УДК 004.81
А.И. КУРСИН, НТУ "ХПИ",
А.Г. ЮЩЕНКО, НТУ "ХПИ"
ВОЗМОЖНОСТЬ МЕТАФОРИЗАЦИИ В СЕТЯХ ХОПФИЛДА
Раніш було показано, що нейронні мережі, працюючі за принципом злагодженої активності
компонентів та прогнозування вхідних даних, могуть демонструвати явища метафоризації –
навчання подібного до утворення понять в людський психіці. На основі порівняльного аналізу
таких мереж з нейронними мережами хопфілдовського типу робиться висновок, що є підстави для
пошуку зазначених явищ і в мережах Хопфілда. Наводяться результати експериментів.
It was grounded in the previous publications that neural networks maintaining coherent activity of its
elements and working via anticipation of its subsequent input may exhibit phenomenon of
metaphorization, which is a kind of unsupervised learning resembling concept formation in human
thinking. Comparative analysis of anticipatory networks and Hopfield-type models, leads to the
conclusion that this phenomenon can be reproduced in simpler Hopfield networks as well. That is
supported by simulation results.
Введение. В предыдущих работах [1, 2] нами была предложена модель
нейронной сети ансамблевого типа, самоорганизация которой основана на
подержании согласованной активности своих элементов и предсказании
последующих входных данных – предсказательная нейронная сеть (ПНС).
Такая сеть на каждом шаге генерирует предсказания относительно следующих
фрагментов данных, которые будут поданы на её вход, сверяет это
предсказание с реально поступившими данными и модифицирует свою
структуру по результатам сравнения с тем, чтобы генерировать более
успешные предсказания в будущем.
Было обосновано, что в такой сети можно ожидать явления
самообучения, основанные на кооперации нейронных ансамблей,
напоминающие процессы понимания в человеческом мышлении, называемые
метафоризацией [3]. В самом общем смысле, метафоризация – это создание
ментальной модели для нового объекта или явления на основе и по подобию
ментальной модели, уже существующей для некоторого похожего объекта или
явления.
Однако сложность предложенной нейросетевой архитектуры и большое
количество её параметров затрудняют реализацию таких сетей. В связи с этим
представляется
целесообразным
исследовать
более
простые
и
распространённые нейросетевые модели, в частности, сети хопфилдовского
типа [4] на предмет наличия в них искомых свойств. Особое внимание мы
хотели бы обратить на модели из LIF-нейронов, разрабатываемые научной
школой под руководством профессора Амита [5 – 7] и используемые этими
исследователями для моделирования процессов рабочей памяти, которые
наблюдаются в определённых участках коры головного мозга животных при
112
распознавании образов [8, 9]. Эти модели содержат расширения оригинальных
сетей Хопфилда, собственно и подвигшие нас к поиску в этом направлении.
Цель данной статьи – провести сравнительный анализ ПНС с
нейронными сетями хопфилдовского типа (НСХ) и обосновать попытки
воспроизведения метафоризации в них. Для начала кратко охарактеризуем
сравниваемые модели.
Предсказательная нейронная сеть. Это сеть ансамблевого типа.
Процесс её функционирования состоит в том, чтобы свести текущее
возбуждение на входном слое к активности одного из нейронных ансамблей во
внутреннем слое сети. Сработавший нейронный ансамбль через
ассоциативные связи передаёт мощный сигнал связанным с ним нейронам
сети, подготавливая их активность на следующем шаге распознавания. Тем
самым формулируется предсказание относительно данных, которые поступят
на вход. То есть каждый шаг распознавания заключается во взаимодействии
предсказания, сформулированного на предыдущем шаге, и возбуждения от
действительно поступающих данных. Специальные механизмы позволяют
сети самообучаться, оценивая качество предсказания и модифицируя
структуру внутренних связей с целью улучшения предсказаний в будущем.
К таким механизмам относится, прежде всего, 3-х ступенчатая модель
активации нейрона [10], в которой промежуточная ступень означает слабую,
недостаточную
активацию, возникающую вследствие несогласованной
активности нейронов, от которых приходят входные связи на данный нейрон.
Это позволяет 3-х ступенчатому нейрону выступать датчиком согласованности
активности в сети, т.е., например, соответствия предсказания и поступивших
данных.
3-х ступенчатая модель нейрона определяет и особое правило
модификации межнейронных связей, по которому усиливаются связи,
приводящие нейрон в состояние высокой активности, и ослабляются – те,
которые доводят его только до промежуточного уровня. Тем самым в памяти
сети закрепляются случаи согласованных внутренних состояний.
Дополнительно, для повышения качества работы сети, в механизм обучения
вводят постепенность закрепления изменений – в зависимости от
продолжительности последовательности успешных предсказаний.
Регулирующая, тормозная функция осуществляется управляющим
центром, который регулирует пороги перехода нейронов между состояниями
активности, повышая их с ростом числа активных нейронов в сети. Действие
центра дополняется ростом усталости отдельных нейронов, когда постепенно
исключаются наиболее слабые претенденты из борьбы за высокие уровни
активации.
В ПНС нейронный ансамбль, выделяемый за счёт более сильной
связности нейронов, функционирует как группа взаимопомощи [10], члены
которой помогают друг другу достигать высоких уровней активации.
113
Взаимопомощь возникает и между ансамблями, а именно при обучении новым
данным, когда вновь обучаемый ансамбль кооперируется с похожим уже
обученным. Такая взаимопомощь поощряется сочетанием неполной связности
нейронов сети, 3-х ступенчатой моделью нейрона, пересекающимися
ансамблями и необходимостью постоянно генерировать предсказания. При
этом новый ансамбль, как правило, более подходящий для новых входных
данных, помогает старому, недостаточно подходящему, сработать (довести
свои нейроны до высокой степени активации), а старый предоставляет новому
свои ассоциативные связи для генерации предсказаний, пока собственные
связи новичка не окрепнут в достаточной степени.
Если мы будем рассматривать нейронный ансамбль вместе с его
ассоциативными связями как аналог ментальной модели, то получим процесс,
при котором новая ментальная модель создаётся на базе старой, что
фактически и понимается под метафоризацией [3].
Описанная модель нейронной сети позволяет предположить наличие в
ней интересных явлений самообучения. Однако она обладает и рядом
недостатков. Главный из них – большая сложность и многопараметричность
модели (подробное описание см. в [2]). Это, в сочетании с недостаточной
экспериментальной проработкой её ближайших аналогов [10 – 12], затрудняет
реализацию действующих моделей такой сети. В связи с этим в настоящий
момент реализована только самоорганизация сети в холостом режиме – без
входных данных – в цепочку последовательных спонтанных срабатываний
нейронных ансамблей [2]. Также, остаётся недостаточно разработанным
механизм предсказаний более чем на один шаг. В связи с этим, модели,
рассматриваемые далее, обладают определёнными преимуществами. Им также
присущ аттракторный характер функционирования. Они воспринимают
последовательности входных данных и способны к их предсказанию, причём,
более чем на один шаг.
Сети Хопфилда. Сеть этого типа [4], как правило, функционирует
следующим образом. Периодически на её вход подаются входные данные,
вызывающие определённый рисунок возбуждения внутри сети. После
отключения входных данных сеть переходит в одно из внутренних состояний,
называемых аттракторами. Выбор аттрактора зависит от входных данных и от
внутренней структуры сети. Так, если сеть структурирована на нейронные
ансамбли, то аттрактором, скорее всего, станет ансамбль, наиболее близкий к
входным данным. В состоянии аттрактора сеть может находиться
продолжительное время. В этом иногда видят аналогию со способностью
человеческого мышления сохранять временную память о внешних объектах
или явлениях, когда они уже не воздействуют на органы чувств.
Сети хопфилдовского типа строятся на нейронах разного уровня
сложности: от простых бинарных – до LIF-нейронов, достаточно близко
моделирующих пирамидальные нейроны коры [6]. Связи в таких сетях
обучаются, как правило, хеббовским способом. Например, в [13] предложено
114
интересное правило обучения связей хеббовского типа, которое сочетает
долговременную потенциацию и долговременное торможение, а также
порождает кратковременные изменения проводимости, служащие основой
кратковременной памяти в аттракторах. Простой механизм торможения,
увеличивающий тормозной сигнал пропорционально суммарной активности
нейронов и подающий его одинаково на все нейроны сети, достаточен для
поддержания количества активных нейронов в определённых пределах [5].
Показано, что НСХ обладают спонтанным состоянием активности,
возникающим в ответ на пустой (зашумленный) вход – глобальным
аттрактором, а также – специфическими аттракторами, которые формируются
для фрагментов данных, подаваемых на вход сети в процессе обучения [5]. Как
правило, входные данные подаются на сеть путём возбуждения конкретных
нейронов на внутреннем и единственном слое сети, а обучению при этом
подвергаются ассоциативные связи таких нейронов. Показано, что при
определённых процедурах обучения, сеть образовывает внутри себя
нейронные ансамбли-аттракторы для фрагментов входных данных,
взаимосвязанные между собой ассоциативно в соответствии с протоколами
обучения [5, 6].
Сравнительный анализ нейросетевых моделей. Несмотря на
отмеченные существенные различия, в описанных моделях нейронных сетей
можно усмотреть определённые сходства. Функционирование обоих типов
нейронных сетей имеет аттракторную природу. Как в ПНС и НСХ,
аттрактором может быть наиболее активный нейронный ансамбль.
Кратковременность срабатывания ансамбля в ПНС является в определённой
степени минусом по сравнению с его устойчивой продолжительной
активностью в НСХ – если принять во внимание способность человеческой
психики сохранять рабочую память о внешнем воздействии уже после
прекращения последнего. Наличие кратковременной памяти, которая в ПНС
распределена: а) по уровням активности нейронов; б) по нескольким
компонентам модифицируемых связей; в) по показателям уровня усталости
нейронов, а в НСХ поддерживается: а) динамической компонентой
проводимости связей и б) продолжительной коллективной активностью
нейронов аттрактора. Также описанный выше механизм торможения в НСХ,
несомненно, проще и может быть достаточно эффективным по сравнению с
торможением при помощи глобальных порогов и нарастающей усталости
нейронов, предложенном в ПНС. Различия в подаче входных данных: через
тренируемые связи от входного слоя (в ПНС) и непосредственной активацией
нейронов – в НСХ могут быть несущественными на начальном этапе
моделирования и устранены в дальнейшем.
Можно сделать вывод, что ПНС обладают, несомненно, более мощным
потенциалом, например, функции показателя усталости нейрона могут быть
использованы для разделения нейронов на фракции по частоте участия в
работе сети. Однако большие возможности ПНС делают их и гораздо более
115
сложными для моделирования. Вместе с тем, НСХ по многим параметрам
предлагают разумно более простую альтернативу. Это побудило нас
рассмотреть сети Хопфилда в качестве альтернативной модели для
воплощения метафоризации.
Поиск метафоризации в НСХ. Метафоризация предполагает наличие в
сети пересекающихся нейронных ансамблей: трудно предположить, чтобы
сходство между входными паттернами не отражалось в общности нейронов
для ансамблей, представляющих эти паттерны внутри сети. Пересечение
ансамблей происходит не только по нейронам, но и по связям, их
объединяющим. Следовательно, можно предположить, что у вновь
тренируемого ансамбля, который имеет пересечение с уже обученным, часть
связей, находящаяся в этом пересечении, уже обучена должным образом. Этот
«аванс» обучаемый ансамбль может использовать для своего более быстрого
обучения. В эксперименте, проведенном нами с довольно простой сетью
хопфилдовского типа, мы получили подтверждение данной гипотезы.
Ансамбли, пересекающиеся с уже обученными, действительно обучаются
быстрее (см. рис. 1) и, что самое главное, при соблюдении определённых
ограничений на величину пересечения, обученные таким образом ансамбли
сохраняют способность срабатывать впоследствии по отдельности.
Рис. 1. Зависимость меры обучения L (%) – средней для ансамблей из
обучаемого множества – от количества повторов (S) обучающей
последовательности. Сплошная линия соответствует ансамблям,
имеющим пересечения с ранее обученными, пунктирная – ансамблям,
не имеющим таких пересечений.
Подробно эти эксперименты будут описаны позже. Здесь же мы хотим
заметить, что полученное ускорение обучения пересекающихся ансамблей
вполне можно рассматривать как упрощённое проявление кооперации между
116
ансамблями в процессе метафоризации. Действительно, можно предположить
только два способа осуществления такой кооперации: через общие нейроны
или посредством ассоциативных связей. Из них – первый является наиболее
действенным и вероятным, т.к. ассоциативные связи у нового, ранее не
задействованного ансамбля будут, скорее всего, слишком слабы, чтобы
обеспечить достаточную кооперативную помощь, хотя и этот аспект
необходимо исследовать в полном объёме.
Выводы. Сравнительный анализ структур и функционирования
предсказательной нейронной сети и сетей Хопфилда вместе с описанными
экспериментами по обучению пересекающихся ансамблей подтвердили
правомерность поиска явлений метафоризации в сетях хопфилдовского типа.
Ускорение обучения ансамблей за счёт пересечения с уже обученными
является несомненным проявлением кооперации между ментальными
моделями, которая предполагается при метафоризации. Дальнейший поиск
планируется направить на развитие опробованной модели: введение
ассоциативных связей между ансамблями, моделирование предсказаний
последовательностей данных и зависимости обучения от качества
предсказаний, присутствующих в ПНС. Эти исследования, по нашему мнению,
могут сделать возможным полное моделирование метафоризации и других
сложных когнитивных процессов в сетях хопфилдовского типа.
Благодарности. Данное исследование выполнено при поддержке INTAS,
грант YSF 03-55-1661.
Список литературы: 1. Kursin A. Neural Network: Input Anticipation May Lead To Advanced
Adaptation Properties // Artificial Neural Networks and Neural Information Processing. – BerlinHeidelberg: Springer-Verlag, 2003. – C. 779–785. 2. Kursin A. Self-Organization of Anticipatory Neural
Network // Scientific Proceedings of Riga Technical University, series Computer Science, Information
Technology and Management Science. – Riga: RTU. – 2004. – Vol. 20. – C. 51–59. 3. Сергеев В.
Проблема понимания: некоторые мысленные эксперименты // Теория и модели знаний. Труды по
искусственному интеллекту. Уч. Зап. Тартуского гос. ун-та. – Тарту: Изд-во Тарт. ун-та, 1985. –
Вып. 714. – С. 133–147. 4. Hopfield J. Neural Nets and Physical Systems with Emergent Collective
Computational Abilities // Proc. of the National Academy of Sciences USA. – 1982. – Vol. 79. –
P. 2554–2558. 5. Amit D., Brunel N., Tsodyks M. Correlations of Cortical Hebbian Reverberations:
Experiment Versus Theory // Journal of Neuroscience. – 1994. – № 14. – P. 6435–6445. 6. Brunel N.
Hebbian Learning of Context in Recurrent Neural Networks // Neural Computation. – 1996. – № 8. –
P. 1677–1710. 7. Brunel N. Dynamics and Plasticity of Stimulus-Selective Persistent Activity in Cortical
Network Models // Cerebral Cortex. – 2003. – № 13. – P. 1151–1161. 8. Miyashita Y. Neuronal Correlate
of Visual Associative Long-Term Memory in the Primate Temporal Cortex // Nature. – 1988. – Vol. 335.
– P. 817–820. 9. Sakai K., Miyashita Y. Neural Organization for the Long-Term Memory of Paired
Associates // Nature. – 1991. – Vol. 354. – P. 152–155. 10. Емельянов-Ярославский Л.
Интеллектуальная квазибиологическая система. Индуктивный автомат. – М.: Наука, 1990. – 112 с.
11. Wickelgren W. Webs, Cell Assemblies, and Chunking in Neural Nets // Canadian Journal of
Experimental Psychology. – 1999. – Vol. 53. – № 1. – P. 118–131. 12. Амосов Н. и др., Автоматы и
разумное поведение. – К.: Наукова думка, 1973. – 370 c. 13. Amit D., Brunel N. Learning Internal
Representations in an Attractor Neural Network // Network. – 1996. – № 6. – P. 359–388.
Поступила в редакцию 14.04.2006
117
УДК 003.26:51:004
В.М. ПОШТАРЕНКО, канд. техн. наук, НТУ «ХПИ»,
А.Ю. ВАРЛЫГИНА, НТУ «ХПИ»
РАЗРАБОТКА КЛАССА ДЛЯ РАБОТЫ С ЭЛЕМЕНТАМИ ПОЛЕЙ
GF(2m)
Представлено клас, що дозволяє представляти елементи поля GF(2m) згідно стандарту ДСТУ 41452002 «Криптографічний захист інформації. Цифровий підпис, що грунтується на еліптичних
кривих», а також виконувати операції над цими елементами.
Class which allows to represent the elements of the field GF(2m) according to DSTU «Cryptographic
techniques. Digital signatures based on elliptic curves» standard is suggested. It also allows to fulfil
various operations under these elements.
Постановка проблемы. Стандарт ДСТУ 4145-2002 «Криптографическая
защита информации. Цифровая подпись, основанная на эллиптических
кривых» (далее стандарт) задаёт механизм цифровой подписи, который
базируется на свойствах групп точек эллиптических кривых над полями
GF(2m). Для реализации этого стандарта необходимо создать такую структуру
данных для представления элемента поля, которая бы отвечала определённым
в стандарте требованиям, а также реализовать операции над ними для
корректной работы алгоритма создания цифровой подписи, основанной на
эллиптических кривых.
Анализ литературы. [1] является государственным стандартом Украины
на цифровую подпись, основанную на эллиптических кривых, в котором
изложены основные принципы создания подписи, а также правила
представления элементов полей, над которыми задаётся эллиптическая кривая.
Стандарт строго определяет, как необходимо представлять элементы поля,
однако не задаёт конкретных алгоритмов произведения операций над этими
элементами. В статье [2] изложены принципы произведения операций
сложения, умножения и деления элементов полей, представленных в
полиномиальном базисе. В [3 – 5] рассмотрены основы теории полей Галуа, а
также предложена реализация операций умножения и деления с
использованием таблиц логарифмов (для умножения) и антилогарифмов (для
деления). Такой подход для решения поставленной задачи неприемлем, так как
создание таких таблиц является очень трудоёмкой задачей для элементов
большой разрядности. В [6] также рассматривается теория конечных полей;
один из подразделов посвящен операциям над многочленами, где приведены
соответствующие формулы, которые, однако, сложно применять при
программировании соответствующего класса работы с элементами полей. В
[4] приведен алгоритм Евклида для нахождения наибольшего общего
делителя, который при определённых условиях используется для определения
118
обратного элемента поля для заданного. В [8] рассматривается стандарт
цифровой подписи Украины на эллиптической кривой. Здесь кроме общих
рекомендаций, связанных с реализацией данного стандарта, также даётся
обоснование того, что при программировании более удобным является задание
элементов полей через полиномиальный базис. В [9] рассмотрена теория полей
Галуа, даны определения основных понятий. В [10] рассматриваются
алгебраические основы криптографии, такие понятия как поля, кольца и т.п.,
однако здесь не описаны алгоритмы операций над элементами этих полей. [11]
является справочным пособием программиста по языку С++, в котором
представлена информация о ключевых словах, операторах, функциях и
классах, и, что очень важно для нас, информация о стандартной библиотеке
шаблонов (STL).
Цель статьи – разработать класс для работы с элементами полей GF(2m),
т.е. разработать структуры данных для представления элементов полей GF(2m),
а также реализовать соответствующие функции выполнения операций над
ними.
Представление элементов полей GF(2m). Любой элемент основного
поля (в нашем случае поля GF(2m)) однозначно определяется через элементы
полиномиального базиса. Удобно задавать полиномиальный базис
примитивным полиномом.
Согласно стандарту поле задаётся либо примитивным трехчленом либо
примитивным пятичленом.
Примитивным трехчленом называется примитивный многочлен вида
(1)
f (t )  t m  t k  1, 0  k  m .
Примитивным пятичленом называется примитивный многочлен вида
(2)
f (t )  t m  t l  t j  t k  1, 0  k  j  l  m .
m
Основное поле GF(2 ) представляется набором четырёх целых чисел (m,
k, j, l). Число m определяет степень расширения простого поля, а числа (k, j, l)
– параметры примитивного многочлена, который задаёт полиномиальный
базис [1].
Выполнение операций над элементами полей GF(2m). В поле
характеристики 2 противоположным для элемента х есть сам элемент х. Таким
образом, в таком поле операция вычитания тождественна операции сложения
и в записях не употребляется [2, 3].
В конечном поле – это операции над многочленами степени не более
m – 1, с получением результата, в случае необходимости, по модулю
примитивного многочлена.
Рассмотрим операции сложения и умножения над многочленами
m
f (t )   a i t i ;
i 0
119
(3)
n
g (t ) 
b t
j
j
, nm.
(4)
j 0
Сумма f(t) и g(t) определяется равенством:
n
f (t )  g (t ) 
 (a  b )t , где a
i
i
i
i
 0 при m  i  n .
(5)
i 0
Умножение двух элементов конечного поля производится как умножение
соответствующих многочленов с последующим сведением результата по
модулю примитивного многочлена. Напомним, что произведение многочленов
f(t) и g(t) определяется равенством:
f (t ) g (t ) 
m n
 ck t k ,
(6)
k 0
где
ck 
a b
i j
.
(7)
i j k ,
0i  m,
0 j  n
Операция деления также соответствует операции деления многочлена на
многочлен [6], при этом, если g(t) ≠ 0 некоторый многочлен из поля, то тогда
для каждого многочлена f(t), принадлежащего этому же полю, существуют
такие многочлены q(t) и r(t), принадлежащие полю, что f(t) = qg + r, где
deg(r) < deg(g). Для нахождения обратного элемента используется
обобщенный алгоритм Эвклида [7] нахождения наибольшего общего делителя
двух многочленов, т.е. многочлена наибольшей степени, который делит два
эти многочлена. Данный алгоритм будет рассмотрен подробнее в описании его
программной реализации.
Структура данных для представления элементов полей GF(2m).
Согласно требованиям стандарта [1] элементы основного поля GF(2m)
представляются в виде двоичных строк длины m. Таким образом, если
x  GF(2m), то x = (xm–1, …, x0), где xi равняется 0 или 1 для всех значений
индекса i.
Стандартом разрешается задавать поле либо в полиномиальном, либо в
оптимальном нормальном базисе Гаусса типа 2. При программной реализации
более предпочтительным является полиномиальный базис, а при аппаратной –
нормальный базис Гаусса [8]. Поэтому в рамках этой реализации стандарта
был выбран полиномиальный базис представления элементов полей GF(2m).
Если основное поле задано в полиномиальном базисе, то крайний правый
разряд представления элемента основного поля отвечает элементу базиса 1, а
крайний левый разряд представления отвечает элементу базиса xm–1 [1]. В
стандарте использованы конечные поля GF(2m) характеристики 2 [7 – 9],
степень расширения m – простое число, где 163  m  509, т.е. максимальная
120
длина двоичного вектора, необходимая для представления примитивного
многочлена, равна 510 бит, и максимальная длина, необходимая для
представления некоторого элемента поля с допуском на выполнение операций,
равна 1020 бит.
В качестве среды программирования предложено выбрать язык С++,
который является объектно-ориентированным и предоставляет множество
полезных при решении поставленной задачи возможностей.
Исходя из требований, предъявленных к представлению элементов поля
GF(2m), заданных в полиномиальном базисе, предлагается, использовать
объектно-ориентированный подход при решении поставленной задачи.
Рекомендуется создать соответствующий класс, закрытыми членами
которого будут являться:
– элемент поля, представленный двоичным вектором;
– указатель на структуру, которая будет хранить параметры основного
поля.
Как уже было сказано ранее, длина двоичного вектора элемента поля для
максимального случая равна 1020 бит, а для примитивного многочлена – 510
бит (предполагается, что поля, не указанные в стандарте, использоваться не
будут).
Основное поле предлагается представить в виде структуры, даннымичленами которой будут четыре целых числа (m, k, j, l), а также двоичный
вектор, представляющий примитивный многочлен, задающий основное поле.
Для данного класса предлагается:
– перегрузить операторы сложения, умножения, деления, и нахождения
остатка от деления для удобного оперирования переменными созданного типа
и произведения операций над ними;
– создать функцию нахождения обратного элемента;
– задать несколько типов конструкторов, для наиболее подходящей
инициализации элементов поля GF(2m);
– реализовать функцию задания и возврата значения элемента поля в
шестнадцатеричном виде;
– организовать доступ к закрытым членам класса.
Для представления двоичных векторов было бы удобно использовать
структуру данных «битовое множество» из стандартной библиотеки шаблонов
STL. Это решение обусловлено тем, что класс bitset поддерживает операции с
битами [11] и позволяет создавать битовые множества достаточной длины для
рассматриваемого случая. На основании вышеперечисленных рекомендаций
предлагается следующая структура данных для представления некоторого
элемента поля (представлен фрагмент программы, написанной на языке
программирования C++):
struct Field
{
//числа задающие поле
121
int m; int l; int j; int k;
//битовое мн-во для представления примитивного полинома
bitset <510> Poli;
};
class GFElem
{
//битовое мн-во для представления эл-та поля
bitset <1020> Elem;
//указатель на структуру, которая представляет поле согласно стандарту
Field *FieldParam;
public:
GFElem (Field *F);
…//другие необходимые конструкторы
GFElem operator+(GFElem &A);
GFElem operator*(GFElem &A);
GFElem operator%(GFElem &A);
GFElem operator/(GFElem &A);
GFElem operator~();
void operator=(GFElem A);
//возврат в шестнадцатеричном виде (строка) значения элемента поля
char* GetElem();
//установка значения поля в шестнадцатеричном виде (строка)
void SetElem(char *Hex);
//возврат степени расширения простого поля
int GetDeg();
…//другие необходимые функции члены класса
};
При работе с объектами данного класса рекомендуется перед их
созданием, выделить память под структуру, которая задаёт параметры поля, и
занести в неё соответствующие значения. А затем при первоначальном
создании объекта передавать указатель на эту структуру соответствующему
конструктору.
Реализация функций для выполнения операций над элементами
полей GF(2m). Для реализации сложения двух элементов поля GF(2m) согласно
оговоренным принципам необходимо перегрузить бинарный оператор «+».
Возвращаемое значение данной функции – объект этого же класса, в котором
сохранен результат сложения. Сложение элементов поля GF(2m),
представленных в полиномиальном базисе, соответствует сложению по
модулю 2 многочленов, которое в полях Галуа тождественно вычитанию и
реализуется битовой операцией XOR [5]. Для получения правильного
результата операции сложения необходимо для входных операндов применить
логическую побитовую операцию «исключающего или», и так как при
122
сложении приведение по модулю примитивного многочлена не требуется, то
результат этой операции и будет искомым элементом поля.
Для реализации нахождения остатка от деления одного элемента поля
GF(2m) g(t) на другой f(t), степень которого меньше степени делимого,
согласно оговоренным принципам необходимо перегрузить бинарный
оператор «%». Возвращаемое значение данной функции – объект этого же
класса, в котором сохранен результат нахождения остатка от деления. Этот
алгоритм действует следующим образом:
1. Принимаем r(t) = g(t), a(t) = 0.
2. Находим степени многочленов r(t) и делителя f(t). Если степень r(t)
больше или равна степени f(t), то переходим к шагу 3, иначе
завершается выполнение алгоритма и результатом будет являться
многочлен r(t).
3. Принимаем многочлен a(t) равным сдвигу влево многочлена f(t) на
количество разрядов, равное разности степеней многочлена r(t) и f(t).
4. r(t) = r(t) + a(t). Переходим к шагу 2.
Для реализации нахождения частного от деления одного элемента поля
GF(2m) g(t) на другой f(t), степень которого меньше степени делимого,
согласно оговоренным принципам необходимо перегрузить бинарный
оператор «/». Возвращаемое значение данной функции – объект этого же
класса, в котором сохранен результат нахождения частного. Этот алгоритм
действует следующим образом:
1. Принимаем r(t) = g(t), h(t) = 0, a(t) = 0.
2. Находим степени многочленов r(t) и делителя f(t). Если степень r(t)
больше или равна степени f(t), то переходим к шагу 3, иначе
завершается выполнение алгоритма и результатом будет являться
многочлен h(t).
3. Принимаем многочлен a(t) равным сдвигу влево многочлена f(t) на
количество разрядов, равное разности степеней многочлена r(t) и f(t).
4. В векторе бит, представляющем многочлен h(t), устанавливаем в
единицу бит, который соответствует степени равной разности
степеней многочленов r(t) и f(t).
5. r(t) = r(t) + a(t). Переходим к шагу 2.
Для реализации умножения двух элементов поля GF(2m) a(t) и b(t)
согласно оговоренным принципам необходимо перегрузить бинарный
оператор «*». Возвращаемое значение данной функции – объект этого же
класса, в котором сохранен результат умножения. Так как умножение
элементов поля GF(2m), представленных в полиномиальном базисе,
соответствует умножению двух многочленов с последующим сведением
результата по модулю примитивного многочлена p(t). Этот алгоритм действует
следующим образом:
1. s(t) = 0, s1(t) = a(t).
2. Находим степень i множителя b(t).
123
3. Для j от i до 0 выполняем шаги 3.1 – 3.3:
3.1. Если bj равен 1, то переходим к шагу 3.2, иначе переходим к шагу 3.
3.2. Принимаем s1(t) равным сдвигу влево многочлена a(t) на j разрядов.
3.3. s(t) = s(t) + s1(t).
4. Сводим s(t) по модулю примитивного многочлена p(t):
s(t) = s(t) % p(t).
5. Конец алгоритма. Результатом будет являться многочлен s(t).
Для реализации нахождения обратного элемента для элемента поля
GF(2m) согласно оговоренным принципам необходимо перегрузить унарный
оператор «~». Возвращаемое значение данной функции – объект этого же
класса, в котором сохранен обратный элемент поля. Для вычисления
обратного элемента используется обобщенный алгоритм Евклида для
нахождения наибольшего общего делителя двух многочленов f(t) и c(t). Этот
алгоритм выражает наибольший общий делитель d(t) как d(t) = a(t)f(t) + b(t)c(t),
где a(t) и b(t) – некоторые многочлены, которые находятся при выполнении
обобщенного алгоритма Эвклида. Этот алгоритм действует следующим
образом:
1. Принимают a(t) = 1, d(t) = f(t), u(t) = 0, v(t) = c(t).
d (t )  f (t )a(t )
2. Если v(t) = 0, то принимают b(t ) 
и заканчивают
c(t )
выполнение алгоритма.
3. С помощью деления с остатком вычисляют d(t) = q(t)v(t) + r(t), далее
вычисляют w(t) = a(t) + u(t)q(t), a(t) = u(t), d(t) = v(t), u(t) = w(t),
v(t) = r(t) и переходят к шагу 2.
Для данного алгоритма f(t) – примитивный многочлен поля, c(t) –
многочлен, который представляет элемент поля, а b(t) – многочлен,
представляющий элемент обратный c(t) [1].
Выводы. Предложен класс для работы с элементами полей GF(2m),
который соответствует стандарту ДСТУ 4145-2002 и может использоваться
для обеспечения корректой работы алгоритма создания цифровой подписи.
Список литературы: 1. ДСТУ 4145-2002 «Криптографическая защита информации. Цифровая
подпись основанная на эллиптических кривых». 2. Псевдослучайные последовательности чисел
criptograf.narod.ru/kr4.html 3. Вернер М. Основы кодирования. – М.: Техносфера, 2004. – 288 с.
4. Биркгоф Г., Барти Т. Современная прикладная алгебра. – М.: Мир, 1976. – 400 с.
5. Касперски К. Могущество кодов Рида-Соломона или информация, воскресшая из пепла.
http://insidepro.com/kk/027/027r.shtml. 6. Лидл Р., Ниддерайтер Г. Конечные поля: В 2-х т. Т.1. –
М.: Мир, 1988. – 430 с. 7. Грэхем Р., Кнут Д., Паташник О. Конкретная математика. Основание
информатики. – М.: Мир, 1998. – 703 с. 8. Безопасность информационных технологий
security.ukrnet.net/modules/sections/index.php?op= printpage&artid=79 9. Артін Е. Теорія Галуа. – К.:
Радянська школа, 1963. – 99 с. 10. Харин Ю.С., Берник В.И., Матвеев Г.В., Агиевич С.В.
Математические и компьютерные основы криптологии. – М.: Новое знание, 2003. – 382 с.
11. Шилдт Герберт Справочник программиста по С/С++. – М.: Издательский дом «Вильямс»,
2003. – 432 с.
Поступила в редакцию 14.04.2006
124
УДК 519.673
И.В. РУБАН, канд. техн. наук, ХУВС (г. Харьков),
К.С. СМЕЛЯКОВ, канд. техн. наук, ХУВС (г. Харьков),
С.В. ОСИЕВСКИЙ, канд. техн. наук, ХУВС (г. Харьков)
ВЫДЕЛЕНИЕ МАЛОРАЗМЕРНЫХ ИЗОБРАЖЕНИЙ
ОБЪЕКТОВ НЕРЕГУЛЯРНОГО ВИДА
З метою підвищення стійкості, адекватності і точності виділення малорозмірних зображень
об’єктів нерегулярного вигляду в автоматичному режимі в роботі запропоновано підхід, який
засновано на аналізі контрастності розглядаємих зображень відносно фону з використанням
спеціального виду регіональних масок, адаптованих до параметрів форми аналізуємих об’єктів
нерегулярного вигляду.
With the aim to increase stability, adequacy and accuracy of segmentation of small-sized images of
irregular objects in automatic mode, an approach is suggested that is based on the image vs. background
contrast analysis that uses the proposed regional masks being adjusted to the form parameters of the
considered irregular objects.
Постановка проблемы. В связи с существенным ростом возможностей
современных технических средств получения цифровых фотографий объектов
различной физической природы, все большее число таких снимков
используется для компьютерного анализа свойств объектов, например, для
мониторинга чрезвычайных ситуаций, поиска месторождений ископаемых и
иных объектов на поверхности Земли по аэрофотоснимкам [1 – 5]. Важный
класс задач этого типа связан с выявлением особенностей структуры объектов
по их изображениям. При этом возникает необходимость анализа фрагментов
исходного (входного) изображения, линейные размеры которых не выходят за
границы заданного интервала значений
[diam* , Diam* ] ,
(1)
и на два-три порядка меньше размеров входного изображения. Для таких
малоразмерных изображений (МИ) их границы, особенно для объектов
естественного происхождения, как правило, не имеют приемлемого
аналитического представления (кривыми первого и второго порядка) с
заданной точностью. Поэтому в общем случае МИ имеют нерегулярный вид.
Для этих задач в рамках данной работы считается, что в качестве
исходных данных задано полутоновое входное изображение некоторой
совокупности объектов в поле зрения. Под сегментацией понимается
отделение изображений объектов от фона по контрастности с целью их
последующей идентификации и анализа свойств интересующих объектов.
Анализ литературы. Изменение условий получения исходных данных,
например, по уровню освещения, может приводить к значимым вариациям
125
яркости изображений объектов и фона. В этих условиях пороговые методы
сегментации по яркости неустойчивы, а использование методов
аппроксимации распределения яркости изображения не обеспечивает
требуемую оперативность [6], что не позволяет на их основе автоматизировать
сегментацию и идентификацию МИ. Поэтому основное распространение
получил подход, основанный на сегментации изображений по контрастности с
использованием масок. В сравнении с пороговыми методами сегментации по
яркости этот подход обладает существенно большей устойчивостью к
вариациям яркости изображений [6 – 8]. В развитие этого подхода разработано
большое количество масок и детекторов граничных пикселей изображений [9
– 14], а также методов построения границ по выделенным граничным
пикселям, включая методы устранения разрывов, утоньшения и сглаживания
границ [6 – 8, 15 – 18]. При этом для обеспечения устойчивости сегментации в
условиях зашумления разработан широкий спектр сглаживающих фильтров.
Вместе с присущими им достоинствами, существующие маски и
граничные детекторы преимущественно не ориентированны на работу с МИ.
Структура и параметризация существующих масок и граничных детекторов не
всегда позволяет обеспечивать требуемую полноту их настройки и адаптации
к условиям получения исходных данных и параметрам изображений [19]. В
результате во многих важных приложениях возникает актуальная проблема
адекватной сегментации МИ с требуемым уровнем автоматизации и
вычислительной эффективности.
Целью данной работы является разработка подхода к автоматизации
сегментации МИ объектов нерегулярного вида по контрастности на основе
использования масок, адаптируемых к параметрам формы анализируемых
объектов.
1. Построение модели и критерия сегментации МИ
Считаем, что входное изображение отфильтровано и содержит одно
односвязное МИ некоторого класса объектов. При этом координаты пикселей
изображения могут принимать неотрицательные целочисленные значения;  –
окрестность пикселя d на дискретном поле – множество пикселей
{d i } : (d , d i )   , где   0 – действительное число. Здесь  – евклидово
расстояние, а радиусы рассматриваемых окрестностей принадлежат множеству
типовых расстояний {  } 1, 2,...  {1, 2 , 2, 5 , 8 , 3, ...}
между пикселями
дискретного поля снимка.
Одномерный случай. При анализе по выделенному направлению
контрастность пикселя d i с яркостью f i с использованием одномерной маски
радиуса   относительно пикселя d j с яркостью f j оценивается так
u i;   f i  f j .
126
(2)
Использование одномерных масок служит для оперативного обнаружения
МИ на начальной фазе сегментации с целью локализации области поиска МИ.
При этом увеличение радиуса маски позволяет оценивать контрастность
пикселей МИ относительно фона, а не тени, яркость пикселей которой
значимо варьируется; зная, что яркость МИ больше (или меньше) яркости
фона, контрастные пиксели фона можно отфильтровать по знаку выражения
( f i  f j ) в (2). Под тенью изображения [19] здесь понимается множество
пикселей входного изображения, яркость которых
образована излучением объекта и фона (рис. 1).
после
оцифровки
Рис. 1. Слева направо: оптическое изображение объекта, цифровое
изображение объекта и его тень
Двумерный случай. Пусть задано односвязное множество G – регион.
Его огибающая l , – это множество пикселей, расположенных на расстоянии
не ближе   и не далее   от границы региона G . Совокупность региона и
его огибающей назовем региональной маской r mask , (рис. 2).
Рис. 2. Региональная маска r mask 3,5 , где черным отмечены пиксели региона G ,
а серым – пиксели огибающей l3,5
Пусть f G и f l – средние яркости региона и его огибающей. Тогда
127
контрастность региона G оценим так
uG  f G  f l .
(3)
Эти модели далее используются для описания свойств МИ с целью его
сегментации по контрастности посредством адаптации формы региона на
форму МИ. При этом возможность изменения радиусов   и   позволяет
добиваться ситуации, когда при совмещении МИ и региона G его огибающая
состоит из пикселей фона, а тень содержится между регионом и его
огибающей, что требуется для отделимости МИ от фона.
Таким образом, основные элементы модели МИ, в дополнение к
ограничениям (1), которые служат для быстрой идентификации объектов по
диаметру, представлены: радиусами масок   ,   ,   , нижней оценкой
контрастности (порогом) T1 для быстрого обнаружения МИ с использованием
одномерной маски по (2), а также нижней оценкой контрастности (порогом)
T2 для выделения МИ с использованием региональной маски по (3). Кроме
этого, для снижения степени маскирования ложных пикселей в процессе
сегментации может проверяться выполнение ограничения на неоднородность
яркостей пикселей получаемого региона. Критерий Kr1 сегментации пикселя
МИ: пиксель входного изображения d i считается пикселем искомого МИ,
если для него выполняются соотношение ui;  T1 , при условии, что f i  f j
(предполагаем, что яркость фона ниже яркости объекта). Критерий Kr2
сегментации МИ: регион G считается искомым МИ, если его диаметр
удовлетворяет (1), а контрастность удовлетворяет соотношению u G  T2 , при
условии, что f G  f l .
2. Сегментация МИ
На основе введенной системы критериев предлагается метод адаптивной
сегментации МИ, основные шаги которого состоят в следующем.
Шаг 1. По критерию Kr1 построчным сканированием входного
изображения ищем контрастный пиксель; при обнаружении такового –
переход к шагу 2, иначе (по окончании просмотра) – переход к шагу 4.
Шаг 2. Пусть f – яркость полученного пикселя. В качестве базового
региона G(i ) ( i  0 ) принимаем объединение этого пикселя с теми 8-связными
с ним пикселями, яркость которых не ниже f . Далее выполняется адаптивная
итерационная процедура наращивания региона.
Шаг G0. Принимаем значение f в качестве начального порога по яркости
B(i ) для региона G(i ) .
128
Шаг G1. Полагаем i  i  1 .
Шаг G2. Снижаем порог B(i 1) и наращиваем множество G(i 1) за счет
8-связных пикселей с яркостью не меньшей B(i ) .
Шаг G3. Если диаметр G(i ) превышает Diam* , переход к шагу G4; иначе –
к шагу G1.
Шаг G4. Удаляем из системы {G(i ) } регионы, диаметр которых меньше
diam* .
Пример равномерного построения порога имеет вид B(i ) = B(i 1) – k, где
k – целое положительное число, определяющее скорость наращивания
региона; с целью повышения эффективности сегментации правило построения
порога следует формировать с учетом особенностей рассматриваемых
изображений.
Шаг 3. Для регионов {G(i ) } строим региональную маску (по-существу –
огибающую) и оцениваем их контрастность согласно (3). Применяя критерий
Kr2 к регионам {G(i ) } , определяем, какой из них определяет искомое МИ.
Если несколько регионов удовлетворяет критерию Kr2 , выбираем
регион с максимальной контрастностью.
Шаг 4. Конец.
из них
3. Автоматизация сегментации МИ в условиях вариаций их
яркостных и контрастностных свойств
Основной причиной значительного разброса яркостно-контрастностных
свойств изображений является изменение условий освещения и вариации
фотометрических параметров объектов. В этих условиях яркостные и, в
значительно меньшей степени, контрастностные свойства изображений также
будут варьироваться. В связи с этим использование фиксированного набора
параметров модели (радиусов масок и порогов) может существенно снижать
устойчивость и адекватность сегментации МИ в автоматическом режиме. Для
решения этой проблемы предлагается применять следующие процедуры. На
этапе настройки параметров модели определяется диапазон F  [ F min , F max ]
возможных средних яркостей входного изображения. Затем диапазон F
разбивается на n частей {Fi }i 1,n по заданному критерию и для каждого
уровня яркости Fi настройка параметров (радиусов масок и порогов)
производится индивидуально; в результате получается n кортежей
параметров модели МИ {K i }i 1,n . Перед сегментацией поступившего
изображения вначале оценивается средняя яркость входного изображения, по
которой выбирается требуемый кортеж параметров модели. После этого
сегментируется МИ.
129
Выводы. При выполнении определенных ограничений на вариации
исходных данных (после выполнения процедуры настройки радиусов масок и
порогов и, при необходимости, после фильтрации шума с целью обеспечения
устойчивости) предложенный в работе метод позволяет обеспечить высокую
точность сегментации МИ нерегулярного вида в автоматическом режиме за
счет адаптации региона маски r mask , на форму МИ. Решение ряда
практических задач сегментации МИ по аэрофотоснимкам подтвердило
эффективность предложенного подхода в отношении точности сегментации
МИ нерегулярного вида в автоматическом режиме. При этом быстрая
локализация МИ с применением одномерных масок позволяет добиваться
высоких показателей вычислительной эффективности сегментации МИ.
Список литературы: 1. Rudel T.K., Bates D., Machinguiashi R. A tropical forest transition?
Agricultural change, out-migration, and secondary forests in the Ecuadorian Amazon // Annals of
Association of American Geographers. – 2002. – Vol. 92. – № 1. – P. 87–102. 2. Malanson G.P.
Extinction-debt trajectories and spatial patterns of habitat destruction // Annals of Association of
American Geographers. – 2002. – Vol. 92. – № 2. – P. 177–188. 3. Cowell C.M., Dyer J.M. Vegetation
development in a modified riparian environment: Human imprints on an Allegheny River wilderness
// Annals of Association of American Geographers. – 2002. – Vol. 92. – № 2. – P. 189–202. 4. Lo C.P.
Urban indicators of China from radiance-calibrated digital DMSP-OLS nighttime images // Annals of
Association of American Geographers. – 2002. – Vol. 92. – № 2. – P. 225–240. 5. Lloyd R.,
Hodgson M.E., Stokes A. Visual Categorization with Aerial Photographs // Annals of Association of
American Geographers. – 2002. – Vol. 92. – № 2. – P. 241–266. 6. M. Sonka, V. Hlavak, R. Boyle Image
processing, analysis, and machine vision. California (USA): Cole Publishing Company, 1999. – 770 p.
7. Chen C.H., Pau L.F., Wang P.S.P. Handbook of Pattern Recognition and Computer Vision. London
(UK): Word Scientific Publishing Company, 1993. – 984 p. 8. Форсайт Д.А., Понс Д. Компьютерное
зрение. Современный подход. – К.: Вильямс, 2004. – 928 с. 9. Семенов С.И. Теория неадаптивных
масок для обработки изображений // Биомедицинские технологии и радиоэлектроника. – 2002. –
№ 12. – С. 33–40. 10. Smith S.M., Brady J.M. SUSAN – a new approach to low level image processing
// Int. Journal of Computer Vision. – 1997. – Vol. 23. – № 1. – P. 45–78. 11. Robert. M. Haralick Digital
step edges from zero crossing of second directional derivatives // IEEE Transaction on Pattern Analysis
and Machine Intelligence. – 1984. – Vol. 6. – № 1. –. P. 58–68. 12. Canny J.F. A computational approach
to edge detection // IEEE Trans. on Pattern Analysis and Machine Intelligence. – 1986. – Vol. 8. – № 6. –
P. 679–698. 13. Sobel I. An isotropic 3х3 image gradient operator. In H. Freeman, editor, Machine Vision
for Three-Dimensional Scenes, Academic Press, 1990. – P. 376–379. 14. Shen J., Castan S. An optimal
linear operator for step edge detection // Computer Vision, Graphics and Image Processing. – 1992. –
Vol. 54. – № 2. – P. 112–133. 15. Cohen L.D., Cohen I. Finite-Element Methods for Active Contour
Models and Balloons for 2-D and 3-D Images // IEEE Trans. on Pattern Analysis and Machine
Intelligence. – 1993. – Vol. 15. – № 11. – P. 1131–1147. 16. Haris K., Efstratiadis S. N., Maglaveras N.
and Katsaggelos A. K. Hybrid Image Segmentation Using Watersheds and Fast Region Merging // IEEE
Trans. Image Processing. – 1998.– Vol. 7. – № 12. – P. 1684–1699. 17. Peter Meer, Bogdan Georgescu
Edge Detection with Embedded Confidence // IEEE Transactions on pattern analysis and machine
Intelligence. – 2001. – Vol. 23. – № 12. – P. 1351–1365. 18. Konishi S., Yuille A.L., Coughlan J.M.,
Zhu S.C. Statistical Edge Detection: Learning and Evaluating Edge Cues // IEEE Transactions on Pattern
Analysis and Machine Intelligence. – 2003. – Vol. 25. – № 1. – P. 57–74. 19. Смеляков К.С. Модели и
методы сегментации границ изображений нерегулярного вида на основе адаптивных масок:
Автореф. … канд. техн. наук: 18.11.04. / ХНУРЭ. – Харьков, 2005. – 16 с.
Поступила в редакцию 14.04.2006
130
УДК 621.327
В.В. СКОРОДЕЛОВ, канд. техн. наук,
В.В. КРАШЕНИННИКОВА
СОЗДАНИЕ ВИРТУАЛЬНЫХ ИЗМЕРИТЕЛЬНЫХ КОМПЛЕКСОВ
НА ОСНОВЕ ПЕРСОНАЛЬНЫХ КОМПЬЮТЕРОВ
Запропоновано варіант побудови віртуального вимірювального комплексу, що складається з п’яти
різних приладів (мультиметра, осцилографа, вимірювача частоти та генератора сигналів довільної
форми). Розроблені апаратні та програмні засоби такого комплексу.
The variant of construction of virtual measuring complex consisting of five different devices is proposed
(multimeter, oscillograph, measuring device of frequency, and generator of signals of arbitrary form ).
Vehicle and programmatic facilities of such complex are developed.
Постановка проблемы. Технология виртуальных приборов (ВП) при
создании различного рода измерительных устройств (цифровых вольтметров,
мультиметров, осциллографов, генераторов сигналов, частотомеров), средств
технической диагностики и контроля (анализаторов спектра, генераторов
слов, логических и сигнатурных анализаторов) в настоящее время получает
все более широкое применение.
Виртуальные приборы реализуются на основе персонального компьютера
(ПК) и дополнительных нестандартных программных и аппаратных средств.
Последние представляют собой периферийное устройство для сопряжения с
ПК и объектом измерения и контроля (УСО).
Непрерывное расширение сферы применения виртуальных приборов,
появление новых технологий для создания аппаратных и программных
средств, необходимость получения различных функциональных возможностей
и характеристик ВП приводит к необходимости проведения новых
исследований и разработок в этой области.
Анализ литературы. В настоящее время известно большое количество
разнообразных виртуальных приборов [1 – 9]. При создании ВП приходится
решать следующие задачи:
– распределение функций прибора между аппаратными и программными
средствами;
– определение способа подключения УСО к ПК (через внешний
интерфейс или к внутренним интерфейсам);
– определение способа реализации УСО (на "жесткой" или на
"программируемой" логике);
– поиск оптимального варианта реализации УСО и виртуального прибора
в целом;
– получение необходимых точностных и качественных показателей;
131
– создание удобного программного интерфейса с пользователем и
остальным программным обеспечением;
– разработка драйвера, позволяющего осуществлять обмен данными
между УСО и ПК;
– разработка целого ряда сервисных программ (приложений),
необходимых для использования УСО.
Взаимосвязь аппаратных и программных средств виртуальных приборов
в соответствии с перечисленными выше задачами представлена на рис. 1.
Ядро операционной системы
Интерфейс
Аппаратные
средства ПК
Объект
измерения и
контроля
УСО
Драйвер
УСО
Интерфейс
пользователя
Программы
пользователя
Рис.1. Взаимосвязь программных и аппаратных средств ВП
Характеристики виртуальных приборов определяются, в основном,
техническими параметрами УСО. Результаты анализа существующих
способов построения последних показывают, что они могут быть реализованы
как: универсальные платы сбора данных на базе АЦП; универсальные платы
ЦАП; специализированные платы (вольтметры, осциллографы и т.д.);
универсальные платы для цифровой обработки сигналов.
Анализ показывает, что платы АЦП и ЦАП реализуются в основном на
основе «жесткой» логики. Это позволяет, в ряде случаев, минимизировать как
размеры, так и стоимость УСО. Однако при этом увеличиваются требования к
ПК, потому что на него возлагается вся обработка входных сигналов.
Специализированные платы реализуются сегодня в основном на основе
"программируемой" логики (на микроконтроллерах – МК и/или
программируемых логических интегральных схемах – ПЛИС). Это позволяет
переложить часть обработки входных сигналов на УСО, что существенно
разгружает ПК.
132
Таким образом, в каждом способе возможны варианты реализации схем
как на "жесткой" так и на "программируемой" логике. В первом случае
наличие нескольких каналов ввода-вывода сигналов позволяет получить более
низкое потребление и создать интеллектуальное УСО. Однако таким способом
реализуются в основном только отдельные ВП.
Целью работы является создание виртуального измерительного
комплекса (ВИК), состоящего из ряда различных ВП, которые реализованы как
на основе одного многофункционального УСО, так и в виде отдельных ВП.
Особенности построения виртуальных измерительных комплексов.
Особенности построения отдельных виртуальных приборов типа частотомера и
генератора сигналов произвольной формы были рассмотрены в предыдущих
работах [8, 9]. Оба они реализованы на основании концепции построения ВП,
изложенной выше при анализе литературы. Эта же концепция положена в
основу разработки как мультиметра, осциллографа и анализатора спектра на
основе одного многофункционального УСО, так и ВИК в целом.
Все перечисленные выше ВП объединены в единый виртуальный
измерительный комплекс с помощью многооконного графического
интерфейса пользователя, главное окно которого приведено на рис. 2. Для
выбора прибора нужно нажать соответствующую кнопку. После чего
появляется окно, имитирующее лицевую панель выбранного прибора (см.
рис. 3), в котором осуществляются настройки (задание режимов работы, выбор
измеряемых параметров, диапазоны измерений и т.д.) и отображается
результат измерений.
Рис. 2. Главное окно интерфейса ВИК
Работа ВИК при этом осуществляется в соответствии с алгоритмом,
приведенным на рис. 4.
133
Рис. 3. Окно анализатора спектра
Запуск
программы
пользователя
Запуск АЦП, сбор и
накопление данных в МК
Выбор прибора,
задание его параметров
Передача данных в ПК.
Их обработка и
интерпретация
Инициализация
прибора.
А
Данные о режиме работы - в МК . Настройка
МК на выбранный режим
Настройка
коэффициентов деления
и усиления.
Настройка временных
характеристик
да
Остановка
прибора?
Выход в главное окно
Выход из программы
пользователя
да
нет
нет
Изменились
параметры прибора ?
А
Рис. 4. Алгоритм работы ВИК
Данный алгоритм реализуется аппаратными и программными средствами
ВИК, взаимосвязь которых была показана на рис. 1.
Программное обеспечение состоит из следующих компонентов:
134
– программы генерирования многооконного графического интерфейса
пользователя;
– драйвера, позволяющего осуществлять обмен данными между ПК и
УСО, а также управление последним;
– библиотека программ пользователя, моделирующих работу отдельных
виртуальных приборов;
– программы микроконтроллера.
Программа микроконтроллера позволяет осуществить следующее:
управление аппаратными средствами УСО в соответствии с выбранным типом
прибора и его настройками (программирование структуры УСО); выполнение
измерений; накопление полученных данных в памяти ПК; формирование и
передачу блока данных в ПК и прием от него управляющей информации.
Аппаратные средства ВИК состоят из УСО, подключенного к COM порту
ПК через интерфейс RS-232. Структурная схема ВИК приведена на рис. 5.
RD
RD
7
2
2
ДН
3
НСУ
УЗА
D0-D7
ТD
ТD
Uвх
МК
ПЛУ
INT0
ПК
Запуск
ПТН
АЦП
Рис. 5. Структурная схема ВИК
Измеряемый сигнал Uвх поступает одновременно на программноуправляемый делитель напряжения (ДН), который позволяет расширить
амплитудный диапазон измеряемых сигналов, и преобразователь тока в
напряжение (ПТН). В режиме мультиметра Uвх проходит через ПТН, а в
режиме осциллографа и анализатора спектра – через ДН. Далее входной
сигнал поступает в блок нормирования сигнала по уровню (НСУ),
работающий во взаимодействии с делителем напряжения. С выхода НСУ
сигнал через узел защиты (УЗА) поступает на вход аналого-цифрового
преобразователя (АЦП). В случае превышения уровня сигнала выше
допустимого, УЗА ограничивает его по амплитуде и извещает об этом
микроконтроллер (МК), выдавая сигнал прерывания INT0. Результаты
преобразования в виде однобайтных кодов (D0 – D7) поступают в МК,
накапливаются в его памяти и далее в виде большого блока, через
преобразователь уровней логических сигналов (ПЛУ), по линии интерфейса
TD передаются в ПК. Управление всеми блоками УСО, процессами
135
преобразования и накопления данных, обмен данными с ПК осуществляется
микроконтроллером (см. рис. 4). Все это осуществляется с помощью рабочей
программы МК, которая начинает выполняться сразу после включения
питания. Но, поскольку после инициализации прибора (см. рис. 4) ожидаются
команды управления из ПК, то УСО, а значит и виртуальный прибор в целом,
начинает работать лишь после того, как придет первая команда запуска. Вслед
за этой командой из ПК по линии интерфейса RD поступят и загрузятся в МК
данные о режиме работы и настройках УСО. Если длительное время в
микроконтроллер не приходят команды управления, то он переходит в режим
пониженного энергопотребления SLEEP.
Выводы. В результате проделанной работы предложен вариант
построения виртуального измерительного комплекса, который объединяет в
себе
ВП,
построенные
различными
способами:
на
основе
многофункционального УСО и в виде отдельных приборов. Разработаны
аппаратные и программные средства такого ВИК, обеспечивающие работу в
режимах мультиметра, осциллографа, анализатора спектра, частотомера и
генератора сигналов произвольной формы. Использование при реализации
аппаратных
средств
ВИК
микроконтроллера
позволило
создать
многофункциональное программно-перестраиваемое со стороны пользователя
УСО, существенно уменьшить аппаратурные затраты на его реализацию и
энергопотребление.
Дальнейшим
развитием
работы
может
быть:
модернизация ВИК путем замены используемого МК типа ATmega128 на
микроконтроллер со встроенным многоканальным АЦП; добавление в
структуру УСО дополнительных функциональных узлов (ЦАП и др.);
рассмотрение вопросов использования ВИК в составе виртуальных
лабораторий, например, для дистанционного обучения.
Список литературы: 1. Гелль П. Как превратить персональный компьютер в измерительный
комплекс. – М.: ДМК, 1999. – 144 с. 2. Скороделов В.В. Виртуальные приборы на основе
персонального компьютера // Сборник научных трудов «Системы обработки информации» –
Харьков: НАНУ, ПАНМ, ХВУ, 2001. – Вып. 6 (16) – C. 109 – 115. 3. Бударин А. Концепция
построения виртуальной измерительной лаборатории. – http://www.rudshel.ru. 4. Скорин Ю.І.,
Макаров О.В. Віртуальні вимірювальні прилади // Збірка наукових праць НАН України. Тем. вип.
«Моделювання та інформаційні технології» – Київ: ІПМЕ, 2004. – № 26 – C. 188 – 190.
5. Руднев П., Шелковников Д., Шиляев С. Один компьютер – вся измерительная лаборатория. –
http://www.rudshel.ru. 6. Белоруков В.А., Михайлов А.М. Виртуальные приборы: опыт создания,
сферы применения в области электросвязи. – http://www.tehnohals.spb.ru. 7. Шиляев С.Н.,
Руднев П.И. Компьютер и виртуальные приборы. – http:// www.rudshel.ru. 8. Скороделов В.В.,
Шершнёв А.А. Виртуальный генератор сигналов произвольной формы // Вестник НТУ «ХПИ».
Сборник научных трудов. Тем. вып. «Автоматика и приборостроение» – Харьков: НТУ «ХПИ»,
2001. – №4 – С. 101 – 105. 9. Скороделов В.В., Шершнёв А.А. Виртуальный измеритель частоты и
генератор сигналов на основе персонального компьютера // Вестник НТУ «ХПИ». Сборник
научных трудов. Тем. вып. «Автоматика и приборостроение» – Харьков: НТУ «ХПИ», 2002. –
№ 18. – С. 119 – 122.
Поступила в редакцию 15.04.2006
136
УДК 681.3.016
С.С. ТАНЯНСКИЙ, канд. техн. наук,
В.В. ТУЛУПОВ, канд. техн. наук,
Д.А. РУДЕНКО, канд. техн. наук
МОДИФИКАЦИЯ ОГРАНИЧЕНИЙ НА ВЕДЕНИЕ ДАННЫХ ДЛЯ
ОБЕСПЕЧЕНИЯ ЦЕЛОСТНОСТИ КРУПНОМАСШТАБНЫХ
ИНФОРМАЦИОННЫХ СИСТЕМ
В статті досліджені методи підтримки цілісності в базах даних і визначені властивості деяких
операцій реляційної алгебри при їхньому використанні в розподілених системах. Для розширення
можливостей роботи з даними введені узагальнені операції, що дозволяють коректно виконувати
запити при наявності невизначених значень у відношеннях бази даних. Для визначення
необхідних умов забезпечення цілісності пропонується використовувати алгоритм Грехема, що
перевіряє властивість повного з'єднання відношень. Якщо схема бази даних не задовольняє цим
умовам, то розглядається варіант її модифікації без порушення схем відношень і зв'язків між ними.
In article the methods of support of integrity in databases are investigated and the properties of some
operations of relational algebra are determined at their use in the allocated systems. For expansion of
possibilities of work with the data the generalized operations are entered allowing it is correct to carry out
searches at presence of indeterminate values concerning a database. For definitions of necessary
conditions of provide integrity, it is offered to use algorithm Grahama, checking property complete
joining of the relations. If the scheme of a database does not satisfy with it conditions, the variant of its
updating without infringement of the schemes of the relations and Relationships between them is
considered.
Постановка проблемы. Современные тенденции информационных
систем (ИС) состоят в переходе от централизованных вычислительных систем
к распределенным системам. Выделяется два вида систем обработки данных:
системы распределенных баз данных (БД) и системы распределенной
обработки данных. В системе распределенных БД данные распределены
между несколькими (возможно территориально разобщенными) ЭВМ и
обеспечены соответствующие возможности для управления этими
разделенными частями. В системах распределенной обработки данных,
которые
имеют
распределенные
между
взаимосвязанными
ЭВМ
вычислительные мощности и программное обеспечение, данные хранятся на
централизованной БД. Системы распределенной обработки данных в
дальнейшем будем называть крупномасштабными.
В статье основное внимание уделяется именно крупномасштабным
системам. Использование крупномасштабных систем необходимо, с одной
стороны, для обеспечения управляемого доступа к распределенным данным, с
другой стороны, для независимого функционирования локальных БД при
обеспечении согласованности данных во всей системе (глобально).
Существует два типа представлений логической структуры БД:
глобальное представление и пользовательское (локальное) представление. При
137
этом с одним и тем же глобальным логическим представлением может быть
связано несколько локальных представлений.
Один из способов построения системы управления крупномасштабной
системой состоит в интеграции всех БД на основе глобальной схемы. В
дальнейшем под глобальной схемой будем понимать схему, состоящую из
имен всех атрибутов БД, которые соответствуют как синтаксической, так и
семантической уникальности. Схему, отвечающую таким свойствам, будем
называть универсальной схемой.
Предположим, что универсальной схемы не существует. На практике это
трудно осуществимо, так как необходимо решить следующие задачи:
– определить адреса, где находятся запрашиваемые данные;
– сформулировать запрос, который будет выполняться в разных БД;
– передать результаты на один компьютер для их объединения;
– собрать и объединить результаты;
– выделить из объединенных результатов ответ на исходный запрос.
Эти задачи требуют больших затрат времени, подвержены ошибкам и
поэтому являются объектами автоматизации в крупномасштабных системах.
Анализ литературы. Среди работ, посвященных моделированию
данных, можно выделить монографии Д. Цикритзиса [1] и М.Ш. Цаленко [2],
позволяющие определить основные требования к функционированию ИС и
моделированию БД в частности.
Для детального изучения методов проектирования и обработки
реляционных БД можно обратиться к работам Д. Мейера [3], Дж. Ульмана [4]
и Н.Н. Буслика [5], в которых определены основные свойства операций над
отношениями и рассмотрены ограничения на возможные состояния БД.
Несмотря на подробное описание методов обработки данных, в
литературе мало внимания уделяется расширению моделей для включения в
качестве допустимых значений неопределенностей.
Цель статьи. Свойства БД, основанные на реляционной модели,
соответствуют первоначальным предложениям Кодда. Из [6] следует, что
наиболее очевидным "узким местом" предложенной реляционной модели
данных является неразвитость средств выражения ограничений целостности,
которые в общем случае требуется определить для отношений, связи между
которыми нарушены (иными словами, речь идет о недостаточности средств
выражения "семантики").
В связи с этим целью статьи является расширение возможностей
реляционной алгебры за счет введения в множество возможных значений
значения "неопределенно" и соответствующей модификации некоторых
операций.
Обобщение реляционных операторов. Операции, предложенные в [3],
при использовании неопределенностей не отражают необходимую
информацию. Рассмотрим обобщенные операции реляционной алгебры на
138
отношениях с неопределенными значениями. Здесь Rel и Rel обозначают
множества всех частичных (допускаются неопределенности) и полных (не
содержащих неопределенные значения) отношений соответственно, чьи схемы
входят в некоторый фиксированный универсум атрибутов U.
Лякруа и Пирот в [3] предложили обобщенную операцию естественного
соединения, обозначаемую ><+, при которой каждая строка отношенийоперандов попадает в соединение. Строки, которые не соединяются с другими
строками, дополняются неопределенными значениями и присоединяются к
результату. Если применять операцию ><+ для более чем двух отношений, то
закон ассоциативности не выполняется, то есть (r><+s)><+р  r><+(s><+р), и
следовательно, операция неоднозначна при любых соединениях отношений.
Заниоло в [3] предложил обобщение операции соединения, в обозначении
><Z, при которой строки соединяются, если на всяком общем атрибуте они
согласованы, либо в точности одна из них не определена. Если строка не
определена на некотором атрибуте, соединенная строка берет значение из
другой строки. Если некоторая строка, не соединяется ни с какой другой
строкой, то она дополняется неопределенными значениями и добавляется к
результату. Однако, операция ><Z также не ассоциативна, то есть
(r><Z s)><Z р  r><Z (s><Z р) и однозначно не выполняется для отношений, при
многократных соединениях.
Введем операцию соединения, в обозначении ><U, при котором каждая
строка попадает в соединение. Отличие ><U от рассмотренных операций
состоит в следующем: во-первых, отношения, участвующие в соединении,
должны принадлежать множеству из Rel; во-вторых, строки соединяются
только тогда, когда они полностью соединимы, несоединимые строки
дополняются неопределенными значениями и присоединяются к результату.
Рассмотрим операцию ><U для нескольких отношений. Пусть даны
отношения r(А, В), s(В, С), р(С, D) представленные на рис. 1. Результат
операции r><U s><U р показан на рис. 2.
r
A
a
a
a1
a2
s
B
b
b1
b1
b2
B
b
b1
b1
p
C
c
c
c1
A
a
a
a1
a2
C
c
c1
c
c2
Рис. 1. Пример трех не полностью соединимых отношений
r
A
a
a
a
a1
a2
a2
B
b
b1
b1
b1
b2

C
c
c
c1
c

c2
Рис. 2. Пример операции ><U при многократном соединении
139
Сформулируем утверждение ассоциативности операции ><U.
Утверждение: Пусть r(R), s(S) и р(Р) – несогласованные отношения из
Rel, тогда оператор ><U ассоциативен, то есть r><U(s><U р) = (r><Us)><U р.
Справедливость утверждения следует из определения полностью
соединимых отношений, дополняя недостающие значения при соединении
неопределенными значениями. Отношения S = {r1,…, rn} называются
полностью соединимыми, если каждый кортеж в каждом отношении является
элементом некоторого списка соединимых на S кортежах. Другими словами,
отношения являются полностью соединимыми, если выполняется условие
ri = Ri(S), где Ri – схема отношения ri, а  – операция проекции.
Например, воспользовавшись отношениями, представленными на рис. 1,
применяя операцию ><U, получим результат, соответствующий рис. 3.
r><U(s><U p)
A
a
a
a
a2
a2
B
b
b1
b1

b2
(r><Us)><U p
C
c
c
c1
c2

A
a
a
a1
a2
a2
B
b
b1
b1
b2

C
c
c
c

c2
Рис. 3. Пример ассоциативности операции ><U
Введем модифицированную операцию проекции для отношений с
неопределенными значениями в обозначении XU.
Пусть r – отношение из Rel со схемой R и Х  R, тогда XU(r) есть
отношение r(Х), полученное вычеркиванием столбцов, соответствующих R-Х,
где R, X  U и X  R, а также исключением из оставшихся повторяющихся
строк и строк с неопределенными значениями.
Проекции отношения r (см. рис. 2) на схемы r1 (А, В), r2 (В, С), r3 (АС) с
помощью обобщенного оператора имеют вид, соответствующий рис. 1.
Рассмотренная модификация операций проекции и соединения позволяет
поддерживать некоторый вид ограничений, в частности функциональные
зависимости (ФЗ) между атрибутами, путем соединения не полностью
соединимых отношений, получив при этом отношение, подобное
универсальному представлению U, но с неопределенными значениями в
несоединимых кортежах. Если правая часть ФЗ однозначно определяет левую
или является неопределенным значением, то неопределенность в правой части
зависимости недопустима. Для анализа возможных вариантов использования
модифицированных операций необходимо рассмотреть "поведение" ФЗ на
отношениях с неопределенными значениями.
Слабоуниверсальное отношение и функциональные зависимости.
При рассмотрении интегрированной БД потребуем, чтобы атрибут имел
одинаковый смысл всюду, где он появляется, то есть, чтобы он играл
140
определенную роль некоторого класса сущностей. Такое ограничение будем
называть предположением об универсальной реляционной схеме (ПУРС).
Следствием ПУРС является то, что строки с данным множеством атрибутов
имеют одинаковый смысл, следовательно, БД, удовлетворяющая ПУРС, не
может содержать двух отношений с одной и той же схемой. Множество
атрибутов определяет единственную семантическую связь между ними.
Рассматривая БД как семантическое целое, будем допускать отношения
со схемами, являющимися подсхемами других отношений. В таких случаях
для того, чтобы БД удовлетворяла ПУРС, определим ограничения на такие
отношения. Пусть r(R) и s(S) – отношения БД, причем R  S. По ПУРС
множество атрибутов должно однозначно определять семантическую связь
между ними. Поскольку R  S, то, какова бы ни была связь между его
атрибутами, она должна быть частью связи между атрибутами S. То есть, если
t – строка в S, то t(R) должна быть строкой в r. Другими словами, в r должна
входить R(s). Это ограничение будем называть условием вхождения схем.
Рассмотрим условие вхождения при обновлении БД. При выполнении
условия вхождения может показаться, что разрешение на обновление s влечет
за собой разрешение на обновление r. С другой стороны, обновление r
накладывает ограничение на обновление s, поскольку строка t не может быть
добавлена к s, если t(R)  r. Введенное ограничение на ПУРС необходимо для
поддержки ограничений на зависимости существования [7], так как эти
ограничения накладываются на тип связи. Условие вхождения схем
используется также при поддержке ФЗ. При проектировании БД по средствам
нормализации, поддержка зависимостей в каждом локальном отношении
гарантирует выполнение этих зависимостей и в U, то есть глобальное
выполнение ФЗ. Для поддержки ФЗ при интеграции некоторого множества
локальных БД, не всегда возможно получить U из-за несогласованности
локальных БД. На основе введенных ранее модифицированных операций
определим понятие слабоуниверсального отношения для несогласованных БД.
Пусть d – БД со схемой R = {R1, ..., Rn}, причем U = R1R2 ...  Rn.
Отношение s со схемой U будем называть слабоуниверсальным отношением
для d, если Ri(s)  r(Ri) для каждой схемы Ri  R.
Слабоуниверсальное отношение является результатом применения
модифицированной операции естественного соединения ><U. Такие
отношения необходимы для поддержки глобального выполнения зависимостей
в БД.
Пусть дана база d(R) и множество атрибутов U, а также множество ФЗ
над U. База d глобально удовлетворяет множеству ФЗ, если для него
существует слабоуниверсальное отношение s(U), и проекции Ri(s)
удовлетворяют данному множеству ФЗ. Здесь под операцией проекции
понимается модифицированная операция проекции.
141
Для базы d и множества ФЗ над U отношение s(U) будем называть
F-слабоуниверсальным отношением (в обозначении F-U) для d, если s есть
слабоуниверсальное отношение для d, удовлетворяющее множеству ФЗ.
Утверждение: База d имеет F-U если d глобально удовлетворяет
множеству ФЗ.
Справедливость
утверждения
следует
из
определения
F-слабоуниверсального отношения.
В случае, когда атрибуты одной схемы являются подмножеством
атрибутов другой схемы, условие вхождения значительно сократит временные
затраты на поддержку глобального выполнения ФЗ.
Если множество атрибутов Х – ключ отношения Ri соответствует
некоторому множеству атрибутов отношения Rj, то в любой момент времени
каждое значение Х, существующее в Rj, должно также существовать в Ri. Такое
ограничение будем называть ограничением на чужой ключ. Трудность
поддержки такого ограничения заключается в поиске отношений, которые
содержат атрибуты из множества Х.
Введем дополнительное требование для ограничения на чужой ключ.
Пусть d(R) – БД со схемой R и К – ключ в R. Пусть F – множество ФЗ, которые
полностью определяются ключами из R. БД d удовлетворяет
модифицированному ограничению на чужой ключ (МОЧК) относительно F,
если для каждого Ri  R и t  r(Ri) найдется такая строка t в Ri+, что Rj  Ri+
t (R)  r(Rj), и, в частности, t(Ri) = t. Если в каждом отношении БД
поддерживаются свои ключи и удовлетворяется ограничение на МОЧК
относительно полностью определяемого этими ключами множества ФЗ, то БД
глобально удовлетворяет ФЗ. Этот факт подтверждает следующее
утверждение, доказательство которого можно найти в [3].
Утверждение: Пусть даны БД d и множество ФЗ F, полностью
определяемое ключами из d. Если d удовлетворяет МОЧК относительно F и
каждое отношение удовлетворяет своим ключам, то d глобально
удовлетворяет F.
Соблюдение ограничения МОЧК все же не исключает просмотра
нескольких отношений при обновлении одного отношения, так как замыкание
атрибутов одного отношения может включать почти все отношения БД. Таким
образом,
процесс
поддержки
ФЗ
сводится
к
рассмотрению
слабоуниверсального отношения.
Синтаксические условия на схему слабоуниверсального отношения.
Для слабоуниверсальных отношений рассмотрим один класс схем, а именно –
класс ациклических схем, обладающих рядом свойств, необходимых для
обеспечения глобальной целостности. Важным свойством при проверке
целостности данных для этих схем является возможность обойтись без U.
Определим эти свойства. Пусть R = {R1, R2, ..., Rp} – схема БД и
d = {r1 ,r2, ..., rp} – экземпляр БД. Говорят, что d согласована в целом (СЦ),
142
если r1 ,r2, ..., rp обладают свойством полноты соединения. Базу d будем
называть попарно-согласованной (ПС), если свойством полноты соединения
обладает произвольная пара отношений ri и rj. Сложность проверки свойства
ПС полиномиально зависит от количества отношений в БД. При этом СЦ с
необходимостью влечет за собой ПС, но ПС не всегда достаточно для СЦ [3].
ПС влечет СЦ (ПССЦ) для БД со схемой R = {r1(ABC), r2(BCD),
r3(CDF)}. Покажем, что каждый кортеж из r2 входит в r1 >< r2 >< r3. Пусть t2 –
кортеж из r2. Поскольку r1 и r2 обладают свойством полноты соединения, то r1
содержит кортеж t1, соединимый с t2. Аналогично, r3 содержит кортеж t3, также
соединимый с t2. Эти три кортежа соединимы, поскольку t1(C) = t2(C) = t3(C) и
C – атрибут, общий для t1 и t3. С другой стороны, для БД над схемой
R = {r1(ABC), r2(BCD), r3(CE), r4(DE)} свойство ПС не достаточно для СЦ.
Видно, что свойство ПССЦ зависит от того, каким образом атрибуты
отношений пересекаются между собой. Используя синтаксис схемы,
используем алгоритм, проверяющий, выполняется ли свойство ПССЦ.
Алгоритм редукции Грэхема [3] состоит в последовательном выполнении
шагов, на каждом из которых к схеме БД применяется одно из двух правил
редукции – до тех пор, пока не окажется, что ни одно из них применить
больше нельзя. Правила редукции состоят в следующем:
– (УС) удаление схемы отношения; если схема отношения собственным
образом содержится в некоторой другой схеме отношения;
– (УА) удаление атрибута; атрибут принадлежит не более чем одной
схеме отношения.
Говорят, что алгоритм Грэхема завершился успешно, если в результате
его применения к атрибутам схем БД получается пустое множество. В
противном случае формируется набор атрибутов, образующих связный блок,
то есть когда каждый атрибут принадлежит более чем одной схеме, и ни одна
схема не входит собственным образом в другую. В дальнейшем такие схемы
будем называть циклическими, а схемы, для которых алгоритм Грэхема
завершается успешно – ациклическими. Таким образом, для ациклических
схем ПС влечет СЦ, а для циклических схем это свойство не выполняется. Для
успешного завершения алгоритма Грэхема необходимо, чтобы схема была
ациклическая, в противном случае ее необходимо привести к ациклическому
виду.
Пусть d = {r1, ..., rp} – БД со схемой R = {R1, ..., Rp}, и пусть d' = {ri, ..., rj}
– связной блок со схемой R' = {Ri, ..., Rj}, тогда отношение b = ri >< ... >< rj со
схемой B = Ri ... Rj, в обозначении b(B), будем называть сильно-связным
блоком для d(R). Замена в циклической схеме связных блоков на сильносвязные приведет ее к ациклическому виду. Это следует из того, что все схемы
связного блока будут собственным образом входить в схему сильно-связного
блока, и, таким образом, алгоритм Грэхема завершится успешно.
Ациклические схемы с сильно связным блоком будем называть блочноациклическими.
143
Пусть база d имеет схему R = {AB, BCD, CDE, DEK, EKM, KMN}. В
результате применения алгоритма Грэхема остается связный блок со схемой
R' = {BCD, CDE, DEK}. Естественное соединение отношений со схемой R'
порождает
сильно-связный
блок
B = {BCDEK}.
Таким
образом,
преобразованная исходная схема будет иметь вид RB = {AB, BCDEK, EKM,
KMN} и является ациклической.
Итогом полученных результатов является следующее утверждение.
Утверждение: Для того чтобы циклическая схема удовлетворяла
свойству ПССЦ, необходимо и достаточно заменить все связные блоки
сильно-связными. Справедливость утверждения следует из редуктивного
алгоритма Грэхема и определения сильно-связного блока.
Выводы. Проанализировав операционную спецификацию реляционной
модели данных можно отметить, что при использовании неопределенности в
качестве допустимого значения реляционного отношения не позволяет
поддерживать целостность традиционными методами. Таким образом,
научной новизной статьи является модификация некоторых операций
реляционной алгебры для их применения к отношениям БД с
неопределенными значениями. С другой стороны, для повышения
эффективности поддержки целостности при интеграции данных в статье
рассматривается модификация схемы БД, позволяющая использовать
попарное соединение для проверки согласованности в целом.
Практическая значимость полученных результатов состоит в
возможности использовать несогласованные отношения локальных БД в
интегрированной среде, обеспечивая однозначность представления данных.
При этом приведение циклической схемы к блочно-ациклической значительно
снижает время проверки целостности интегрированной информации.
Рассмотренные
вопросы
определяют
дальнейшие
направления
исследований в области поддержки данных в интегрированной среде
обработки информации, направленные на разработку прикладных средств,
расширяющих традиционные возможности СУБД и систем управления
распределенными БД.
Список литературы: 1. Цикритзис Д., Лоховски Ф. Модели данных. – М.: Финансы и статистика,
1985. – 344 с. 2. Цаленко М.Ш. Семантические и математические модели баз данных. –
М.: ВИНИТИ, 1985. – 208 с. 3. Мейер Д. Теория реляционных баз данных. – М.: Мир, 1987. – 608 с.
4. Гарсиа-Молина Г., Ульман Дж., Уидом Дж. Системы баз данных. Полный курс. –
М.: Издательский дом "Вильямс", 2003. – 1088 с. 5. Буслік М.М. Моделі і структури даних: Навч.
посібник – Харків: ХТУРЕ, 2000. – 136 с. 6. Codd E. A relational model of data for large shared data
banks // CACM 13. – 1970. – № .6. – P. 1958–1982. 7. Буслик Н.Н. Глобальные схемы реляционных
баз данных: концепция и методы построения. Монография. – Харьков: ХНУРЭ, 2002. – 68 с.
8. Ульман Дж. Основы систем баз данных. – М.: Финансы и статистика, 1983. – 334 с.
Поступила в редакцию 31.03.2006
144
УДК 629.424.067.4
Е.Н. ШАПРАН
СОВЕРШЕНСТВОВАНИЕ МИКРОПРОЦЕССОРНЫХ СИСТЕМ
УПРАВЛЕНИЯ ТЕПЛОВОЗОВ С ВЫСОКИМ ИСПОЛЬЗОВАНИЕМ
СИЛ СЦЕПЛЕНИЯ
У статті розглянуті перспективи застосування різних систем регулювання електропередач
тепловозів, а також використовуваних методів виявлення буксування.
In the article advanced application of different control systems of power transmissions of gasoline
locomotives, and also used methods of detection of skid are considered.
Постановка проблемы. Тенденция повышения эффективности
эксплуатации подвижного состава выдвигает высокие требования к
техническому совершенству локомотивов и повышению их тягово-сцепных
свойств, которые неразрывно связаны с улучшением тяговых передач. В
настоящее время идет разработка новых, а также модернизация
существующих тепловозов с применением микропроцессорных систем
управления, обеспечивающих высокое использование сил сцепления. Однако,
до настоящего времени не удалось выработать единого подхода по структуре
этих систем, а также определить для них оптимальные значения многих
параметров. Так, например, занижение допустимых уровней скольжения ведет
к недоиспользованию тяговых возможностей локомотивов. С другой стороны,
значительное скольжение при буксовании приводит к повышенному износу
бандажей колесных пар и рельсов, а также к повреждениям тяговых
двигателей (ТД) и передач из-за интенсификации динамических режимов.
В связи с вышеизложенным особый интерес вызывают исследования,
направленные на совершенствование систем регулирования электропередач
тепловозов за счет придания им адаптивных свойств, исходя из реальных
процессов, происходящих в системе локомотив – тяговый привод – колесная
пара – рельсовый путь – состав.
Анализ последних достижений и публикаций. Теоретическими
исследованиями повышения тягово-сцепных свойств локомотивов занимались
известные отечественные и зарубежные учёные: А.Л. Голубенко [1],
В.Е. Гайдуков, Л.К. Филиппов [2], М.Р. Барский [3], Е.Г. Бовэ [4], И.П. Исаев
[5], Д.К. Минов [6], А.П. Павленко [7], Ohishi K., Ogawa Y [8], B.Meyer [9] и
др.
В настоящее время в США на локомотивах SD50 и SD60 используются
высокоэффективные электропередачи с противобуксовочными системами
Super Series фирмы General Motors [9]. Созданием подобных систем активно
занимаются ведущие фирмы России [10], Германии (АЕG) [11] и Японии [8].
145
Появившиеся за последние годы в Западной Европе и США
противобуксовочные системы [9], имеющие радиолокационный (с
использованием эффекта Доплера) измеритель абсолютной скорости движения
экипажа, датчики непрерывного измерения диаметров колес локомотива по
кругу катания каждой колесной пары, позволяют исключить ряд известных
недостатков противобуксовочных систем (влияния синхронности буксования и
различия диаметров колес по кругу катания) и существенно повысить их
чувствительность. Однако, как известно [7], доплеровские системы измерения
скорости дают достаточно большую погрешность при малых скоростях
движения локомотивов (от 0 до 5 – 8 км/ч), для которых наиболее характерны
режимы буксования. Имеется ряд других микропроцессорных систем [11],
алгоритмы работы которых недостаточно адаптированы к реальным условиям
сцепления колеса с рельсом. Поэтому поиск путей решения этой проблемы
является перспективным направлением научных исследований [5, 8 – 12].
Целью данной работы является исследование методов и технических
средств регулирования тяговых передач локомотивов, повышающих
использование сил сцепления, особенно при незначительных скоростях
движения по загрязненным рельсам.
Изложение основного материала. Прежде всего, более подробно
проанализируем работу двух высокоэффективных микропроцессорных систем
регулирования скольжения колесных пар локомотивов - Super Series (тепловоз
SD50) [9] и УСТА-М (тепловоз 2ТЭ116 с поосным регулированием) [10].
Из рис. 1 видно, что Super Series – не только противобуксовочная
система. Она является общей системой управления для тяговых двигателей с
последовательным возбуждением и регулирует при необходимости крип,
чтобы использовать повышенный коэффициент сцепления. Ее назначение –
реализация преимуществ, которые дает более высокий уровень крипа в
условиях ограниченного сцепления при движении по руководящему уклону, в
кривых малого радиуса и при неблагоприятных погодных условиях. При
движении по пути, где сцепление не лимитировано, эта система устраняет
случайные проскальзывания колес более эффективно, чем традиционные
противобуксовочные системы при меньших или таких же уровнях крипа.
В системе Super Series, благодаря использованию радиолокационного
измерителя скорости движения локомотива ИС, программируемых
характеристик тяговых двигателей и фактических (измеренных) значений
токов якорей, постоянно рассчитывается изменяющееся ограничение по
напряжению, по величине которого регулируют допустимое проскальзывание
колес в пределах мощностных возможностей локомотива. Рассмотрим более
подробно алгоритм работы этой системы.
146
I
I1
I4
Рис. 1. Функциональная схема тяговой передачи тепловоза SD50 [9] с
микропроцессорной системой управления Super Series: Д – дизель; В – возбудитель; ТГ
– тяговый генератор; ВУ – выпрямитель; УВ – управляемый выпрямитель; КМ –
контроллер машиниста; РД – регулятор дизеля; ДП – датчик положения реек
топливных насосов; 1 – 4 – тяговые двигатели; САР – система регулирования тяговой
передачи; ДТ1 – ДТ4, ДН – датчики тока и напряжения; ИС – измеритель скорости
локомотива
Напряжение U
на тяговых
возбуждением можно выразить так:
U=
двигателях
с
последовательным
30  Е 
VЛ  +IRΣ ,
πr  n 
(1)
где I – ток якоря двигателя; Е – ЭДС двигателя; n – частота вращения
якоря; V Л – скорость движения локомотива (измеренная радаром); R –
суммарное сопротивление цепи якоря двигателя; r – радиус колеса. В памяти
микропроцессорной системы записаны параметры нагрузочных характеристик
всех тяговых двигателей E n  f I  , поэтому при измерении токов I1  I 4
имеется возможность вычисления мгновенных значений
E n j
и IR
каждого двигателя j  1, 4 . Затем определяется предельное напряжение на
каждом тяговом двигателе, при котором он может работать со скольжением,
превышающим фактическую скорость локомотива на величину V , по такой
зависимости:
147
U max
j =
30
VЛ+ Δ V   E +IRΣ .
πr
n
(2)
Если U < U max
, т. е. внешние условия, определяющие уровень сцепления,
j
таковы, что соотношение между реализуемыми мощностью и коэффициентом
сцепления позволяют использовать более низкий уровень крипа чем V ,
определенный системой управления, то система Super Series не уменьшает ток
возбуждения тягового генератора (напряжение U ). Только в случае, если
U  U max
, возникает необходимость уменьшения уровня заданной мощности
j
дизель-генератора и, соответственно, напряжения U на тяговых двигателях
так, чтобы реализуемая величина скольжения не превысила допустимого
значения V .
В работе [9] показано, что максимум кривой крипа может соответствовать
различным его уровням – от 1 до 15%. Поэтому в систему было добавлено
устройство поиска максимального значения крипа, которое непрерывно
анализирует величину тока тягового генератора I (выпрямительной
установки ВУ), являющегося показателем общего уровня сцепления
локомотива. В результате периодических измерений определялась тенденция
изменения тока тягового генератора, и при его росте дискретно изменялся
предел крипа V на один шаг в том направлении, в котором произошло
последнее изменение тока. В противном случае предел V изменялся на один
шаг в противоположном направлении.
Приведенный алгоритм работы системы Super Series позволяет отметить
следующие недостатки:
1. Снижение эффективности регулирования скольжения из-за большой
постоянной времени канала возбуждения тягового генератора.
2. Большая погрешность радарной системы измерения малых скоростей
движения локомотива, для которых наиболее характерны режимы буксования.
3. Возможные перегрузки по току параллельно работающих тяговых
двигателей, которые имеют повышенные скоростные характеристики или
связаны с колесными парами, имеющими наибольшие диаметры колес по
кругу катания.
Одним из эффективных способов устранения вышеперечисленных
недостатков и повышения тяговых свойств локомотивов с электрической
передачей является индивидуальное распределение мощности между
тяговыми двигателями в зависимости от сцепных свойств колесных пар с
рельсами. Рассмотрим технические особенности реализации этого способа на
примере электрической передачи переменно-постоянного тока магистрального
тепловоза 2ТЭ116 с микропроцессорной системой управления, структурная
схема которой приведена на рис. 2 [10].
В этой электропередаче за счет регулирования возбуждения тягового
148
генератора применена групповая защита от буксования одной или нескольких
колесных пар, а также избирательная защита путем регулирования напряжения
на каждом тяговом двигателе. Такой подход определил структуру системы
регулирования скольжения, элементы которой входят в контур регулирования
мощности дизель-генератора и контур регулирования скорости вращения
каждой колесной пары.
Необходимо отметить, что в системе УСТА-М пропорционально
свободной мощности дизеля устанавливается максимально допустимое
ускорение колесных пар d dt . Затем в регуляторе мощности этот сигнал
интегрируется по времени, в результате чего определяется заданная угловая
скорость вращения колесных пар  3 , т.е. скорость движения локомотива. При
этом фактическая угловая скорость вращения колесных пар ωср определяется
путем усреднения сигналов 1 –  6 тахогенераторов Тх1 – Тх6.
УВМ1
УВМ2
Контроллер
машиниста
УВМ3
Синхронный
тяговый
генератор
Nвх
Дизель
УВМ4
Iвх
ИД
УВМ5
U1
U2
U3
U4
U5
ТД1
Тх1
ТД2
Тх2
ТД3
Тх3
ТД4
Тх4
ТД5
Тх5
ТД6
Тх6
ВУ
Uид
УВМ6
Синхронный
возбудитель
Iв
ω2
ω3
ω4
ω5
ω6
в1-6
БУУВМ
U1-6
УСТА-М
U6
ω1
I1-6
ω1-6
Рис. 2. Структурная схема электрической передачи тепловоза 2ТЭ116 с системой
поосного регулирования касательной силы тяги: УВМ1 – УВМ6 – управляемые
выпрямительные установки; ТД1 – ТД6 – тяговые двигатели; Тх1 – Тх6 –
тахогенераторы; УСТА-М – микропроцессорная система управления электропередачей;
БУУВМ – блок управления выпрямительными установками; ВУ – выпрямитель; ИД –
индуктивный датчик
В каждом i-м цикле выполнения управляющей программы определяется
разность ±Δ = ω3  ωср , согласно которой каналом регулирования мощности
149
задаётся ток возбуждения I в синхронного возбудителя СВ и, соответственно,
ток возбуждения I ВГ и напряжение U c тягового генератора (рис. 2). При
буксовании одной или нескольких колесных пар рассогласование  будет
иметь отрицательное значение ( ω ср > ω з ). Это приведет к тому, что мощность
на выходе тягового генератора, которая передается тяговым двигателям, будет
ограничиваться на достигнутом уровне, обеспечивая защиту от синхронного
буксования колесных пар. Кроме того, дальнейшее перераспределение
мощности между буксующими колесными парами производится в контурах
регулирования угловых скоростей вращения тяговых двигателей путем
изменения сигналов блоком управления БУУВМ управляемых выпрямителей
УВМ1 – УВМ6 (рис. 2) в соответствии с законом:
 j  180Z j ,
(3)
где 0  Z j  1 – нормированный сигнал, зависящий от угловой скорости
вращения j-й колесной пары  j , ее углового ускорения d j dt и скорости
2
изменения углового ускорения d 2  j dt . Условие включения регулятора
частоты вращения колесных пар определяется логической функцией:
d j

 1,15 рад/с 2 ,
1, если  j   j  min  K 6  min или
dt


d 2 j
d j
3
(4)
F ( j ,  j )   или

1
,
35
рад/с
при



0

 0;
j
dt
dt 2

0,


где
d j
– расчетное ускорение буксующей колесной пары;
d 2 j
– скорость
dt
dt 2
изменения ускорения; K6 = 0,06 – 0,0012; Vл – коэффициент усиления контура.
При выполнении условия (4) напряжение на выходе управляемого
выпрямителя УВМ изменяется согласно уравнению:
U i  U i 1 (1  К 3 i  К 4
di
d 2 i
 К5
),
dt
dt 2
(5)
где U i , U i 1 – выпрямленное напряжение, подведенное к тяговому двигателю,
связанному с буксующей колесной парой в i-м и (i – 1)-м шаге измерений;
К3 – К5 – коэффициенты усиления.
150
Структурная схема системы УСТА-М, а также описанные алгоритмы её
работы, представляющие по сути методы регулирования с псевдобегунковой
колёсной парой, позволяют отметить следующие недостатки:
1. Интегрирование ускорений в контуре регулирования мощности дизельгенератора без коррекции коэффициента усиления может привести к
синхронному буксованию колесных пар, так как происходит постепенное
накопление влияния систематических погрешностей, которые не распознаются
системой регулирования ввиду случайных параметров скоростных
характеристик тяговых двигателей и диаметров колесных пар.
2. Не обеспечивается, по сравнению с системой Super Series, адаптивное
управление электропередачей по максимуму коэффициента сцепления в
широком диапазоне возможных состояний поверхностей рельсов из-за
относительно жёсткого нормирования условия включения контура
регулирования частоты вращения колесных пар согласно функциональной
зависимости (4).
Кроме того, не обеспечивается более высокий уровень скольжения
передних колесных пар (по ходу движения), поэтому не реализуется эффект
очистки рельсов для улучшения условий сцепления последующих колёсных
пар без применения песка.
Исходя из вышеизложенного, рассмотрим возможность придания системе
УСТА-М адаптивных функций для устранения указанных недостатков. Для
этого необходимо на программном уровне реализовать алгоритм поиска
экстремума коэффициента сцепления за счет динамического регулирования
скольжения каждой колесной пары. Блок-схема такого алгоритма приведена на
рис. 3.
Из блок-схемы алгоритма (рис. 3) видно, что путем периодических
измерений токов якорей I1 – I6 тяговых двигателей определяются тенденции
роста уровней сцепления.
При росте тока Ii в i-м цикле измерения по сравнению с Ii–1 его значением
дискретно (на 5%) уменьшаются коэффициенты усиления K3 – K6, что ведет
(согласно уравнениям 4, 5) к росту допустимых значений скольжения
колесных пар Vск. В противном случае коэффициенты K3 – K6 увеличиваются,
т. е. уровень скольжения ограничивается на один шаг в противоположном
направлении.
Кроме того, для исключения значительного роста величины скольжения
при отсутствии максимума кривой крипа (сильные масляные загрязнения)
производится ограничение возможных диапазонов изменения коэффициентов
усиления K3 – K6 в пределах  40%.
Таким образом, по максимуму кривой крипа (рис. 4) настраиваются все
контуры регулирования угловых скоростей вращения тяговых двигателей ТД1
– ТД6. Так, например, для тяговых двигателей ТД1 и ТД6 на рис. 4 показаны
возможные динамические диапазоны изменения скольжения при настройке на
максимальный коэффициент сцепления.
151
Эффективность предложенных алгоритмов управления исследовалась на
математических моделях [13], подтвердивших целесообразность их
применения.
Вход
1
ωj = 0,5 рад/с
2
Измерение
ω1 – ω6,
I1 – I6
3
τ = 0,07 c
нет
да
нет
6
di
рад
 0,6 2
dt
с
нет
да
7
Ii > I4–L
Суммарное
увеличение
K3–K6<40%
8
Расчет
ωmin, ωср,
Ii, Ii–1
да
нет
нет
4
5
ω4 – ωср ≥
≥ Kωср
да
9
Суммарное
снижение
K3–K6<40%
нет
да
да
11
10
K3:=1,95 K3
K4:=1,95 K4
K5:=1,95 K5
K6:=1,95 K6
K3:=1,05 K3
K4:=1,05 K4
K5:=1,05 K5
K6:=1,05 K6
Выход
Рис. 3. Блок-схема алгоритма динамической настройки коэффициентов усиления
K3 – K6 контуров регулирования скорости вращения тяговых двигателей согласно
уравнению (5)
152
Ij
I 1max
ТД1
I max
j
I 6max
ТД6
0
1
2
V1
3
V6
4
5
Vск ,%
Зона регулирования
Рис. 4. Адаптивная настройка контуров регулирования угловых скоростей
вращения тяговых двигателей на экстремум коэффициента сцепления: I j – ток якоря
j-го двигателя; I1, I6 – токи якоря первого и шестого ТД; Vск – относительное
скольжение; V1 , V6 – соответственно динамические диапазоны скольжений первой
и шестой колёсных пар при изменении коэффициентов усиления K3 – K6
Выводы по данной работе и перспективы дальнейших исследований
1. Анализ путей повышения тягово-сцепных свойств современных
локомотивов
позволяет
сделать
выводы,
что
применяемые
микропроцессорные системы управления и регулирования электропередач
тепловозов должны решать значительно более широкие задачи, чем просто
предупреждать возникновение и развитие процессов буксования. Поэтому в
отличие от традиционных подходов создания таких систем, необходимо
обеспечивать поосное регулирование тяговых двигателей и допускать их
работу с различными токами и частотой вращения. Это позволит исключить
влияние на тяговые и противобуксовочные свойства локомотивов
расхождения диаметров колес, характеристик двигателей, загрязнений
рельсов, атмосферных осадков и профиля пути, которые случайным образом
влияют на характеристики сцепления. Кроме того, необходимо допускать для
первых колесных пар (по ходу движения) более высокие уровни крипа с целью
улучшения условий сцепления последующих колесных пар, на которые
возможно перераспределять недоиспользованную мощность дизель153
генератора.
2. Перераспределение мощности между буксующими и небуксующими
осями целесообразно осуществлять до тех пор, пока буксуют не более двух
колесных пар. В противном случае необходимо производить общее снижение
мощности дизель-генератора.
3. Многочисленные исследования отечественных и зарубежных авторов
подтверждают, что микропроцессорные системы управления и регулирования
электропередач кроме перечисленных выше свойств должны обеспечить
эффективное управление подачей песка при буксовании. Эти проблемы
требуют проведения дальнейших исследований, так как от их решения зависит
износ бандажей колес и рельсов, который непосредственно влияет на
эксплуатационные расходы железнодорожного транспорта.
Список литературы: 1. Голубенко А.Л. Сцепление колеса с рельсом. – К.: ВИПОЛ, 1993. – 448 с.
2. Гайдуков В.Е., Шумилин Г.Д., Филиппов Л.К. Унифицированное противобуксовочное устройство
для магистральных тепловозов // Вестн. ВНИИЖТ. – 1976. – №6. – С. 27 – 29. 3. Барский М.Р.,
Сердинова И.Н. Экпериментальное исследование процессов боксования и юза электровозов
// Проблемы повышения эффективности работы транспорта. – М.: АН СССР, 1953. – Вып 1. –
С. 130 – 180. 4. Бове Е.Г. Противобоксовочная защита на электровозах / Сб. Новое в устройстве и
содержании электровозов и тепловозов. Трансжелдориздат, 1962. – С. 57 – 60. 5. Исаев И.П.,
Лужнов Ю.М. Проблемы сцепления колес локомотивов с рельсами. – М.: Машиностроение, 1985.
– 238 с. 6. Минов Д.К. Повышение тяговых свойств электровозов и тепловозов с электрической
передачей. – М.: Транспорт, 1965. – 257 с. 7. Павленко А.П. Прогнозирование динамических
качеств и оптимизация параметров систем "экипаж – тяговый привод – путь" перспективных
локомотивов: Автореф. дис. … д-ра техн. наук. – Л., 1987. – 42 с. 8. Ohishi K., Ogawa Y. Adhesion
control of electric motor coach based on force nontrol using disturbance observer // IEEE, Advanced
Motion Control. – April, 2000. – P. 323 – 328. 9. Мейер Б. (Meyer B.) Локомотивы с высокими
тягово-сцепными качествами и регулируемым крипом // Железные дороги мира. – 1989. – № 5. –
С. 18 – 25. 10. Микропроцессорные системы автоматического регулирования электропередачи
тепловозов / А.В. Грищенко, В.В. Грачев, С.И. Ким, Ю.И. Клименко и др. – М.: Маршрут, 2004. –
172 с. 11. Бауэр Х.П. Оптимальное использование сцепления на электровозе с трехфазным
тяговым приводом // Железные дороги мира. – 1987. – № 8. – С. 10 – 23. 12. Клименко Ю.И.
Исследование привода с изменяемой жесткостью тяговой характеристики. Дис. … канд. техн.
наук. – Коломна, ВНИТИ, 2004. – 174 с. 13. Тасанг Э.Х., Шапран Е.Н. Моделирование
динамических процессов в электрических передачах тепловозов // Залізничний транспорт України.
– 2005. – № 3/1 (48). – С. 142 – 149.
Поступила в редакцию 28.03.2006
154
УДК 621.314.7
А.Г. ДЬЯКОВ, канд. техн. наук, ХГУПТ,
А.Ф. ДАНИЛЕНКО, канд. техн. наук, НТУ "ХПИ"
ПОВЫШЕНИЕ ТОЧНОСТИ ИЗМЕРЕНИЙ ПРИ ИССЛЕДОВАНИИ
ПРОДУКТОВ С НЕБОЛЬШИМ ВЛАГОСОДЕРЖАНИЕМ
Розглянуто підхід, що дозволяє підвищити точність визначення параметрів сигналу спектрометра ЯМР
шляхом багатократного вимірювання та узагальнення. Запропоновано рекурентне співвідношення для
визначення середнього значення по ходу проведення експериментів та структурна схема вимірювальної
системи.
The Considered approach, allowing raise accuracy of the determination of the value of the signal of the spectrometer
YAMR way of frequentative its measurement and averaging. The recurrence correlation is Offered for
determination of average importance in the course of experiment and structured scheme of the measuring system.
Постановка проблемы. В настоящее время при исследовании состояния
воды в пищевых продуктах широко используется метод ядерного магнитного
резонанса (ЯМР). Он основан на избирательном поглощении веществом
энергии электромагнитного поля на фиксированной частоте в результате
переориентации ядерных спинов при определенных условиях.
Анализ
литературы.
Вопросы
построения
и
практические
схемотехнические решения системы управления для проведения исследований
методом ЯМР рассмотрены в [1 – 3]. Однако, как показали дальнейшие
исследования, у образцов, имеющих незначительное влагосодержание,
уровень получаемого сигнала становится сравнимым с уровнем помех, что
затрудняет проведение измерений и получение точных значений исследуемых
величин. Поэтому, решение проблем, связанных с построением измерительной
системы [4 – 6] и разработкой специального программного обеспечения для
предварительной обработки получаемых сигналов, является актуальной
задачей.
Целью работы является повышение точности и достоверности
определения параметров влагосодержания в исследуемых образцах пищевых
продуктов на основе разработки и внедрении новых схемотехнических
решений при построении измерительной системы спектрометра ЯМР и
соответствующего программного обеспечения для обработки поступающей
информации [7].
Задачей исследования является разработка и обоснование новых
методов предварительной обработки информации ЯМР, выбора и обоснования
структурной схемы измерительной системы, реализующей поставленные
задачи.
155
Анализ сигналов ЯМР при исследовании продуктов с малым
влагосодержанием показал, что они сильно искажены помехами [3, 8]. В этих
условиях традиционный алгоритм обработки сигналов, заключающийся в
измерении сигнала, последующем определении его максимального значения и
нахождения среднего значения после проведения N экспериментов, не может
быть применен, т.к. данный сигнал существенно отличается от сигнала
образцов с большим влагосодержанием. Традиционный сигнал ЯМР имеет
колоколообразную форму и ярко выраженный один максимум. Поэтому
проведение порядка 10 измерений в каждой точке исследования дает
возможность достаточно точно определять параметры влагосодержания. На
рис.1а и 1б приведены типичные сигналы, которые необходимо обрабатывать
при малом влагосодержании образца.
20
20
15
15
10
10
05
05
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
а)
б)
Рис. 1. Типовой сигнал, снятый при обработке образца в ЯМР-установке
Формальное определение максимального значения сигнала без учета его
формы с последующим нахождением его среднего значения на основе
проведения N экспериментов в данном случае не является корректным.
Проблема определения максимального значения заключается в том, что
выделенные значения сигналов разнесены во времени и, следовательно, не
совпадают. Наиболее приемлемая методика выделения сигнала на фоне
шумов с целью получения необходимого отношения сигнал/шум заключается
в его накоплении в памяти системы измерения и последующем усреднении.
Предварительные исследования по анализу шумовых характеристик сигнала
показали, что данный сигнал имеет математическое ожидание равное нулю и
дисперсия его ограничена.
Представим измеряемый сигнал в виде суммы полезной составляющей
сигнала A(t ) и шума (t )
156
H (t )  A(t )  (t ),
(1)
где H (t ) измеренное значение сигнала; A(t ) – истинное значение сигнала;
(t ) – аддитивный шум с параметрами M ()  0, D()   .
Обозначим сигнал в n-м периоде измерения как H n (t ) . Шумовая
составляющая сигнала в каждом периоде измерения отличается и поэтому её
можно записать, как  n (t ) . Если брать один и тот момент времени измерения,
то составляющая A(t ) всегда одна и та же. Поэтому измеренный сигнал
можно представить в виде
H n (t )  A(t )  n (t ).
(2)
Приняв многократно сигнал, определим его среднее значение:
1 N
 H n (t ) 
N n 1
1 N

 A(t ) 
N n 1
1 N
 { A(t )   n (t )} 
N n 1
1 N
  n (t ).
N n 1
(3)
Следовательно, даже в случае сильно «зашумленного» сигнала при
суммировании результатов измерений и последующем его усреднении сигнал
можно выразить следующим выражением
1 N
N 
 H n (t )  A(t ).
N n1
(4)
Поэтому для получения достоверной информации об истинном
максимальном значении сигнала может потребоваться значительно большее
количество измерений, чем обычно проводится, и заранее определить их число
не представляется возможным. Оно зависит от свойств исследуемого образца,
технических параметров аппаратуры измерения и ряда других факторов.
Поэтому проведение небольшого числа измерений не дает возможности
получения значения амплитуды сигнала с необходимой для исследований
точностью, а с другой стороны, чрезмерное увеличение числа опытов,
приводит к возрастанию длительности проведения исследований и,
следовательно, снижает эффективность проведения экспериментов.
Наиболее приемлемым является подход, при котором число измерений в
эксперименте будет зависеть от характера протекания измерительного
процесса. Одним из методов решения данной проблемы является метод
последовательного планирования экспериментов [9, 10], при котором число
экспериментов не задается заранее, а определяется в процессе эксперимента.
Можно показать, что математическое ожидание некоторой величины,
157
подверженной случайным воздействиям, можно найти из следующего
рекуррентного соотношения:
M n1  M n 
An1  M n
,
n 1
(5)
где M n – математическое ожидание сигнала после n измерений; An 1 – вновь
измеренное значение сигнала; M 1  A1.
Если задать условие, что max M n1  max M n   , где  – наперед
заданная величина, то измерительная система будет производить
автоматическое измерение и накопление исследуемого сигнала до выполнения
вышезаданного соотношения. Таким образом, процесс измерения амплитуды
выходного сигнала будет автоматизирован и будет обеспечено получение
исходных данных с необходимой точностью. Дальнейшая обработка
полученной информации будет, заключается в дополнительном сглаживании
полученного усредненного сигнала, нахождении его максимального значения
и использования полученного значения для последующих вычислений. На
рис. 2 приведены математическое ожидание, полученное путем нахождения по
формуле (5) и сглаженное значение данного сигнала после обработки системой
MATHCAD, которое впоследствии
использовалось для нахождения
16
максимального значения сигнала.
Из полученных графиков
14
видно, что проведение операции
сглаживании
существенно
12
улучшает форму полученного
10
сигнала
и
дополнительно
устраняет ошибки вызванные
8
воздействием помех.
Для реализации данного
6
метода обработки произведена
модификация структурной схемы
4
измерительной
системы
по
0
20
40
60
80
100
120
140
сравнению
с
существующей
[3].
Рис. 2
Основная задача в этом случае –
обеспечение формирования двух отдельных управляющих сигналов для
автономного запуска генераторов зондирующих импульсов. В этом случае,
задавая шаг изменения временной задержки между импульсами, можно
полностью автоматизировать процесс проведения измерений сигналов для
образца. Модифицированная структурная схема измерительной системы
приведена на рис. 3.
158
ПК
G1
Процессор
Порт
LPT
Cумматор
импульсов
G2
АЦП
ЯМР
спектрограф
ВУ+Д
Рис. 3. Структурная схема информационно-измерительной системы ЯМР
Выводы. Предложен и обоснован алгоритм обработки измерительной
информации от спектрометра ЯМР, позволяющий повысить точность
определения параметров исследуемого сигнала. Обоснована и предложена
структурная схема измерительной системы, которая реализует предложенный
метод измерения. Данные технические решения позволяют повысить уровень
автоматизации измерений и эффективность проведения исследований.
Список литературы: 1. Дьяков А.Г., Даниленко А.Ф. Информационно-измерительная система
установки ЯМР // Вестник НТУ "ХПИ". – Харьков: НТУ ХПИ, 2003. – Вып. 19. – С. 127 – 131.
2. Дьяков А.Г., Даниленко А.Ф. Повышение точности измерений в ЯМР спектрометре // Вестник
НТУ "ХПИ". – Харьков: НТУ ХПИ, 2005. – Вып. 47. – С. 87 – 90. 3. Дьяков А.Г., Даниленко А.Ф.
Анализ точности измерительного канала спектрометра ЯМР // Вестник НТУ "ХПИ". – Харьков:
НТУ ХПИ, 2005. – Вып. 56. – С. 70 – 73. 4. Пивоваров П.П. Теоретична технологія продукції
громадського харчування. – Харків, 2000. – 116 с. 5. Котляр А.М. Современные проблемы
питьевой пресной воды. – Харьков: Факт, 2002. – 232 с. 6. Зацепина Г.Н. Физические свойства и
структура воды. – М.: МГУ, 1998. – 184 с. 7. Хартман К. Планирование эксперимента в
исследовании технологических процессов. – М.: Мир, 1977. – 522 с. 8. Эрнст Р., Боденхаузен Дж.
и др. ЯМР в одном и двух измерениях. – М.: Мир, 1990. – 711 с. 9. Олсон Г., Пиани Д. Цифровые
системы автоматизация процесса управления. – СПб.: Невский диалект, 2002. – 254 с.
10. Фаррар Т., Беккер Э. Импульсная и Фурье-спектроскопия ЯМР. – М.: Мир, 1973. – 164 с.
Поступила в редакцию 04.04.2006
159
УДК 61:007+004.932.721
А.Е. ФИЛАТОВА, канд. техн. наук
СИНТЕЗ РЕШАЮЩИХ ПРАВИЛ С РАЗЛИЧНЫМИ
ПОРОГОВЫМИ ФУНКЦИЯМИ ПРИ СТРУКТУРНОЙ
ИДЕНТИФИКАЦИИ БИОМЕДИЦИНСКИХ СИГНАЛОВ
Дана робота спрямована на вирішення задачі синтезу розв’язувального правила в методі
структурної ідентифікації біомедичних сигналів. У статті розглядаються різні способи розрахунку
порогової функції розв’язувального правила у випадку наявності й відсутності навчаючої вибірки.
The given work is directed on the decision of task of deciding rule synthesis in the method of biomedical
signals structural identification. The calculation different ways of threshold function of deciding rule in
the case of presence and absence of teaching selection are examined in the article.
Постановка
проблемы.
Проектирование
диагностических
компьютерных систем, предназначенных для автоматической диагностики
заболеваний сердца и сердечно-сосудистой системы, является актуальной
задачей медицинской кибернетики. Как правило, такие кардиологические
системы состоят из следующих подсистем и соответствующих им этапов
обработки биомедицинских сигналов [1 – 4]: подсистема регистрации и
оцифровки сигнала; подсистема предварительной обработки сигнала;
подсистема структурной идентификации сигнала; подсистема уточнения
параметров структурных элементов; подсистема расчета диагностических
показателей; подсистема постановки диагноза.
Одним из важнейших этапов анализа биомедицинских сигналов, который
влияет на конечный результат работы всей кардиологической системы, то есть
постановку диагноза, является этап структурной идентификации. Структурная
идентификация биомедицинских сигналов – это выделение на фоне помех
информационных
фрагментов
сигнала
(например,
зубцов
электрокардиограммы). Возможные ошибки, допускаемые на этом этапе
(пропуск структурного элемента или неправильное определение его типа),
могут приводить к значительным искажениям при постановке диагноза.
Таким образом, решение задачи структурной идентификации
биомедицинских
сигналов
является
важным
этапом
создания
автоматизированных кардиологических систем.
Анализ
литературы.
Задача
структурной
идентификации
биомедицинских сигналов различной природы традиционно решается
различными эвристическими методами, которые достаточно сложны в
реализации из-за большого разнообразия форм структурных элементов, а
также в силу наличия помех в рассматриваемых сигналах [5 – 8]. В [1, 2, 9]
предложен метод структурной идентификации биомедицинских сигналов, в
основу которого положена теория распознавания образов. В рассматриваемом
методе исходный квазипериодический сигнал рассматривается с 2-х точек
зрения. С одной стороны, биомедицинский сигнал – это решетчатая функция
160
xt  кв   xt ( t  1, w ), где xt – амплитуды сигнала в точках дискретизации;
w – длина исходного сигнала; кв – частота квантования сигнала. С другой
стороны, биомедицинский сигнал – это множество структурных элементов
  {, 2 , , P } (P – количество структурных элементов), причем
  1   2 , где 1 ,  2 – подмножества (классы), содержащие структурные
элементы заданного типа и все остальные объекты, соответственно. Такое
представление позволило перейти от описания объектов в исходном
пространстве признаков X, где признаками являются значения xt , в
пространство Y меньшей размерности, где признаками являются значения
опорных функций [1]. В новом пространстве признаков Y для построения
решающего правила предложено рассчитывать функцию дифференциации
расстояний f r [t ] , характеризующую расстояние от эталонного объект до всех
остальных объектов исходного сигнала. Решающее правило имеет следующий
вид [1]:
 1 , если ( t , Pd [t ])  Pd [t ]     0;
t  
t 1, w  N x  1 ,
 2 , если (t , Pd [t ])  Pd [t ]     0;
где t – классифицируемый объект; Pd [t ] – пороговая функция;  ξ –
значение локального минимума функции f r [t ] для объекта t ; N x –
количество признаков, задающих объект в пространстве X.
Цель статьи – обобщение метода структурной идентификации
биомедицинских сигналов при синтезе решающих правил с различными
пороговыми функциями.
Синтез решающего правила.
пороговой функции в зависимости от
выборки. Если обучающая выборка
определения пороговой функции – это
выражению:
Рассмотрим способы определения
наличия или отсутствия обучающей
задана, то самый простой способ
вычисление постоянного значения по
max    min  
Pd [t ] 
где
max  ,
t  l1
 ,  )
Pd l m


t  l 2

t  l 1
2
 const ,
(1)
min  – наибольшее и наименьшее значения локальных
t l2
1
2
минимумов функции
и 
f r [t ] для объектов 
l  1
l  2 ,
соответственно.
Исследования на реальных сигналах (различных отведениях ЭКГ)
показали, что значения рассчитанного по (1) порога лежат в пределах
161
0,5  0,15 . Поэтому, даже при отсутствии обучающей выборки, можно
вручную задавать значения пороговой функции Pd [t ] из интервала 0,5  0,15 .
Еще один способ определения пороговой функции Pd [t ] в случае
отсутствия обучающей выборки основан на использовании идеи кластерного
анализа. В этом случае функция Pd [t ] вычисляется по выражению:
Pd [t ] 
1 [t ]  2 [t ]
;
2
 N 1 [t ] 1 [t ]   

, если  1 [t ]       2 [t ]    ;
 1 [t  1]  
N 1 [t ]  1
 1 [t ],
если  1 [t ]       2 [t ]    ;

  2 [t ],
если  1 [t ]       2 [t ]    ;


  2 [t  1]   N 2 [t ]  2 [t ]   
, если  1 [t ]       2 [t ]    ;


N 2 [t ]  1
 N [t ]  1, если  1 [t ]      2 [t ]   ;


 1
N 1 [t  1]  
1
2
если  [t ]      [t ]    ;
 N 1 [t ],
 N [t ],
если  1 [t ]       2 [t ]    ;
 2
N 2 [t  1]  


 N 2 [t ]  1, если  1 [t ]      2 [t ]    ;
 1 [1]  0 ;  2 [1]  1 ; N1[1]  1 ; N 2 [1]  1 ,
где  1 [t ] ,  2 [t ] – усредненные значения локальных минимумов функции
дифференциации расстояний f r [t ] для объектов классов 1 и  2 ,
соответственно;  ξ – значение локального минимума функции f r [t ] для
классифицируемого объекта; N1[t ] , N 2 [t ] – количество найденных объектов
классов 1 и  2 , соответственно.
В [9] было предложено для расчета поровой функции использовать метод
расчета адаптивного порога. В этом случае также не требуется наличия
обучающей выборки. Идея расчета адаптивного порога лежит в следующем.
Рассмотрим функцию дифференциации расстояний f r [t ] как сумму
полезного сигнала S[t ] и шумовой составляющей N[t ] . Так как полезным
сигналом функции f r [t ] являются локальные минимумы, значения которых
для объектов искомого класса должны стремиться к 0, а сама функция может
принимать значения из интервала [0, 1] , то в начальный момент времени
162
можно принять S[1]  0 и N[1]  1 . При этом, если f r [t ]  Pd [t ] , то
необходимо выполнить коррекцию уровня шума, в противном случае – уровня
сигнала. Тогда функция адаптивного порога определяется по выражению:
Pd [t ]  N[t ]  k1 (S[t ]  N[t ]) ;
k f [t ]  (1  k 2 ) N [t ], если f r [t ]  Pd [t ];
N [t  1]   2 r
если f r [t ]  Pd [t ];
 N [t ],
если f r [t ]  Pd [t ];
S[t ],
S[t  1]  
k 2 f r [t ]  (1  k 2 ) S[t ], если f r [t ]  Pd [t ],
где S[t ] , N[t ] – скользящие оценки функции дифференциации расстояний и
уровня шума, соответственно; k1 , k 2 – весовые коэффициенты, принимающие
значения из интервала (0, 1) . Так как весовой коэффициент k1 определяет
среднее значение пороговой функции Pd [t ] , то предлагается выбирать
значение k1  0,6  07 . В свою очередь весовой коэффициент k 2 определяет
интервал усреднения и зависит от частоты квантования исходного сигнала.
Например, при частоте квантования 100 Гц можно выбирать значение
k2  0,2  0,3 .
Выводы. В данной работе выполнен синтез решающих правил с
использованием различных пороговых функций в задаче структурной
идентификации биомедицинских сигналов. Также даны некоторые
рекомендации по определению соответствующих параметров решающего
правила. В дальнейшем планируется выполнить сравнительный анализ
качества структурной идентификации биомедицинских сигналов при
использовании решающих правил с различными пороговыми функциями.
Список литературы: 1. Філатова Г.Є. Структурна ідентифікація сигналів у кардіологічних
системах: Автореф. дис. канд. техн. наук: 05.11.17 / Харківський національний університет
радіоелектроніки. – Харків, 2002. – 20 с. 2. Филатова А.Е. Разработка подсистемы структурной
идентификации сигналов в кардиологических системах // Системи обробки інформації: Зб. наук.
пр. – Харків: НАНУ, ПАНИ, ХВУ, 2002. – Вип. 3(19). – С. 203 – 206. 3. Абакумов В.Г., Геранін В.О.,
Рибін О.І. Біомедичні сигнали та їх обробка. – К.: Век+, 1997. – 352 с. 4. Сватош Й. Биосигналы с
инженерной точки зрения // Укр. журнал медичної техніки і технології. – 1998. – № 1–2. – С. 93–
97. 5. Мурашко В.В., Струтынский А.В. Электрокардиография: Учебное пособие. – М.: МЕДпресс;
Элиста: Джангар, 1998. – 313 с. 6. Матвейков Г.П., Пшонок С.С. Клиническая реография. – Минск:
Беларусь, 1976. – 176 с. 7. Чирейкин Л.В., Шурыгин Д.Я., Лабутин В.К. Автоматический анализ
электрокардиограмм. – Л.: Медицина, 1977. – 248 с. 8. Вычислительные системы и автоматическая
диагностика заболеваний сердца / Под ред. Ц. Касереса, Л. Дрейфуса. – М.: Мир, 1974. – 504 с. 9.
Поворознюк А.И., Филатова А.Е. Определение адаптивного порога при структурной идентификации
биомедицинских сигналов // Інформатика і моделювання: Вісник Національного технічного
університета «ХПІ»: Зб. наук. пр. – Вип. 19. – Харків: НТУ «ХПІ», 2003. – С. 125 – 128.
Поступила в редакцию 3.04.2006
163
УДК 62.505
О.В. СЕРАЯ, канд. техн. наук, НТУ "ХПИ"
ПРИМЕНЕНИЕ ПРОЦЕДУРЫ КЛАСТЕРИЗАЦИИ ПРИ РЕШЕНИИ
ЗАДАЧИ КОММИВОЯЖЕРА ВЫСОКОЙ РАЗМЕРНОСТИ С
ИСПОЛЬЗОВАНИЕМ ГЕНЕТИЧЕСКОГО АЛГОРИТМА
Проведено аналіз відомих методів розв’язання задачі комівояжера. Для ефективного вирішення
цієї проблеми великої розмірності запропоновано використання генетичного алгоритму з
попередньою кластеризацією пунктів призначення.
The analysis of the known methods decision of traveling salesman task is conducted. For the effective
decision of this largeness task is suggested to use a genetic algorithm with preliminary procedure of
cluster analysis of setting points.
Введение. Анализ методов решения задачи коммивояжера. Одной из
важных задач транспортной логистики является так называемая задача
коммивояжера. Суть задачи проста. Бродячий торговец должен посетить n
пунктов назначения, переезжая из одного пункта назначения в другой.
Маршрут должен быть составлен так, чтобы он охватывал все пункты
назначения, но не проходил через один и тот же пункт дважды. Расстояния
между пунктами считаются известными. Задача состоит в отыскании
кратчайшего маршрута.
Проблема коммивояжера может быть успешно решена непосредственно,
если количество пунктов назначения невелико. Принципиальной
особенностью задачи коммивояжера является то, что при увеличении числа
пунктов вычислительная сложность ее решения существенно и быстро
возрастает, и для некоторой размерности задачи она уже не может быть
решена за приемлемое время (или будет решена, но не оптимально).
Известные методы решения: комбинаторный перебор, использование теории
графов, метод ветвей и границ, аналитический.
Комбинаторный способ решения состоит в переборе всех возможных
вариантов решения и выборе лучшего. Количество всех просматриваемых
решений равно n! , где n – количество пунктов назначения. В реальной задаче
число объектов, которые необходимо посетить, достаточно велико (порядка
100). В этом случае объем пространства поиска (число вариантов решений)
приближается по порядку величины к числу атомов в видимой части
Вселенной. Поэтому этот способ принципиально неэффективен с точки зрения
вычислительной сложности. Достоинство этого метода в том, что полученное
с его помощью решение однозначно является оптимальным.
Задача коммивояжера в терминах теории графов формулируется
следующим образом [1]. Пунктам назначения соответствуют вершины графа, а
его дугам приписываются расстояния между соответствующими вершинами.
164
Задача состоит в отыскании кратчайшего замкнутого контура, проходящего
через все вершины графа, причем каждая вершина используется один раз.
Эта задача была впервые исследована Део и Хакими, давшими ее
формулировку на языке линейного программирования. Для полного графа с n
вершинами эта формулировка содержит n(n  1) переменных и n(n  3) / 2  1
ограничений. Кроме того, вводится большое число ограничений,
обеспечивающих
связность
маршрута,
которые
затруднительно
сформулировать явно. Этот метод, безусловно, более эффективен, чем полный
перебор, однако и его применение реально лишь для задач очень небольшой
размерности ( n  10  12 ).
Другой подход, использующий идеи линейного программирования [2, 3],
реализуется следующим образом. Введем набор булевых переменных
1,
x ij  
0
если коммивояжер из пункта i переезжает в пункт j ,
в противном случае.
Зададим матрицу (Cij ) расстояний между пунктами. Тогда
n
L( X ) 
n
 C x
(1)
ij ij
i 1 j 1
есть длина маршрута для выбранного плана переездов X . На матрицу
X  ( x ij ) должны быть наложены ограничения
n
x
ij
 1 , j  1, 2, .., n ;
(2)
 1 , i  1, 2, .., n .
(3)
i 1
n
x
ij
j 1
Система ограничений (2) обеспечивает построение маршрута, в котором
въезд в каждый пункт осуществляется один раз. Система ограничений (3), в
свою очередь, обеспечивает построение маршрута, в котором выезд из
каждого пункта осуществляется один раз. К сожалению, эти ограничения
оказываются недостаточными, так как среди допускаемых ими решений
имеются маршруты, не образующие полный цикл, включающий все пункта.
Можно показать, что устранение всех подциклов обеспечивается при
добавлении системы ограничений
ui  u j  nxij  n 1, i  2, 3, ..., n,
j  2, 3, ..., n .
Таким образом, исходная задача сведена к задаче линейного
целочисленного программирования. Для решения линейных целочисленных
задач существуют специальные алгоритмы, в частности, алгоритм Гомори [4].
165
Применение методов целочисленного линейного программирования
обеспечивает принципиальную возможность решения задачи коммивояжера.
Однако следует заметить, что и здесь количество переменных в задаче очень
быстро растет с увеличением размерности исходной задачи, что очень резко
ограничивает возможности практического применения этого метода.
Одним из наиболее эффективных методов решения задачи коммивояжера
является метод «ветвей и границ» [5 – 7]. Метод основан на итерационном
отсечении
бесперспективных
вариантов
построения
маршрута.
Вычислительную трудоемкость (продолжительность) решения задачи
коммивояжера этим методом можно оценить в условных единицах (одна
единица соответствует перебору 10 6 вариантов). Приведем экспериментально
полученную таблицу трудоемкости решения задачи от ее размерности.
Таблица 1
Зависимость продолжительности решения от размерности задачи
(в условных единицах)
Кол-во пунктов
Продолжительность, у.е.
Количество пунктов
Продолжительность, у.е.
3
4
5
0.14
0.19
0.26
9
10
6.67 24.24
11
167.88
6
7
8
0.34
0.73
1.41
12
13
774.25
2125.5
Экспоненциальный характер зависимости продолжительности решения
задачи от ее размерности позволяет использовать для ее описания модель
T  a0 e a1n
(4)
Параметры модели (a 0 , a1 ) легко отыскиваются. Логарифмируя (4) и
переходя к новым переменным, получим
y   0  1 n ; y  ln T ;  0  ln a 0 ; 1  a1 .
(5)
Теперь формируем функционал наименьших квадратов
J  HA  Y T HA  Y  ;
 1 n1 
 ln T1 




1
n




 ln T2 
2 
0
H 
; A    ; Y  
,
 
 
 1 




 ln T 
1 n 
m
m


минимизация которого дает вектор
регрессии (5):
Â
оценок параметров уравнения
Aˆ  ( H T H ) 1 H T Y .
166
  6.76 
 , откуда
Для исходных данных, помещенных в табл. 1, имеем Â  
 1.07 
T (n)  0.0012 e1.07n .
Ясно, что и этот метод не может быть использован для задач реальной
размерности.
Цель работы: исследовать возможность решения задачи коммивояжера с
помощью интенсивно развивающейся технологии генетических алгоритмов [8
– 10].
Основные результаты. Как известно, эффективность генетического
алгоритма решения конкретной задачи определяется, прежде всего, качеством
процедуры формирования популяции. Для многих задач, например, задач
безусловной оптимизации, разработаны простейшие и быстрые способы
формирования жизнеспособных особей. К сожалению, в задаче коммивояжера
дело обстоит не так.
Известные процедуры в результате применения стандартных операторов
(рекомбинация, мутация и т.д.) приводят к получению особей, значительная
часть которых – «инвалиды», соответствующие маршрутам, не удовлетворяют
требованиям. В связи с этим существенная часть времени работы алгоритма
расходуется непроизводительно. Тем не менее, генетические алгоритмы
реализуют, по-видимому, наиболее эффективный подход к решению
комбинаторных задач. В табл. 2 приведены экспериментально полученные
данные относительно продолжительности решения задачи коммивояжера
разной размерности.
Таблица 2
Зависимость продолжительности решения от размерности задачи
(в условных единицах)
Количество пунктов
Продолжительность, у.е.
Количество пунктов
Продолжительность, у.е.
10
18
26
34
1,02
11,1
31,2
56,3
42
50
58
66
126,7
205,3
275,6
396,8
Для описания соответствующей зависимости введем степенную модель
T (n)  b0 n 1 .
(6)
Логарифмируя (6) и переходя к новым переменным, получим
y   0  1 z ; y  ln T ; z  ln n ;  0  ln b0 ; 1  b1 .
(7)
Формируем функционал наименьших квадратов
J 1  H 1 B  Y T H 1 B  Y  ;
167
(8)
 1 ln( n1 ) 
 ln T1 




1
ln(
n
)
0 

 ln T2 
2 
; B    ; Y  
.
H1  

 
 
1 





 1 ln( n ) 
 ln T 
m 
m


Минимизация (8) дает вектор B̂ оценок параметров регрессии (7):
Bˆ  ( H1T H1 ) 1 H1T Y .
Для исходных данных табл. 2 имеем
T (n)  0.0014x 3.025 .
Таким образом, генетический алгоритм решения задачи коммивояжера на
много порядков более эффективен, нежели любой другой известный алгоритм
решения NP -полных задач. Предельная размерность задачи для этого
алгоритма 60–70 пунктов назначения. Вместе с тем, приближенное решение
этой задачи очень хорошего качества возможно получить даже для случая
существенно более высокой размерности в результате применения
комбинации «кластеризация – генетический алгоритм». Предлагаемая при
этом технология решения задачи коммивояжера является четырехэтапной.
На первом этапе все множество пунктов назначения с использованием
какого-либо алгоритма кластеризации разделяется на совокупность кластеров
E1  {i11, i12 , ..., i1n1 } , E2  {i21, i22 , ..., i2n2 } , …, Em  {im1 , im2 , ..., imnm } . Для
каждого кластера отыскиваются координаты центров тяжести, определяющие
в совокупности набор точек M 1  ( X ц1 , Yц1 ) , M 2  ( X ц 2 , Yц 2 ) , …,
M m  ( X цm , Yцm ) .
На втором этапе для точек M 1 , M 2 , ..., M m с использованием
генетического алгоритма строится кратчайший маршрут их обхода
{M j1 , M j2 , ..., M jm } .
На следующем этапе для каждой пары «соседних» кластеров
отыскивается пункт выхода из предыдущего кластера и пункт входа в
последующий. Пусть, например, номер предыдущего кластера – k 1 , а номер
следующего за ним в порядке обхода – k 2 . Тогда пара «номер пункта lk(вых )
1
выхода их кластера k 1 и номер пункта
l k( вх )
2
входа в кластер k 2 » определяется
из соотношения
(l k(вых ) , l k(вх ) )  arg min {R(ik1s1 , ik2 s2 )} ,
1
2
s1M k1
s2 M k 2
168
где R(ik1s1 , ik2s2 ) – расстояние между s1 -м пунктом из кластера k 1 и s 2 -м
пунктом из кластера k 2 .
Наконец, на последнем, четвертом этапе решается последовательность
задач коммивояжера для каждого из кластеров E1 , E2 , ..., Em с учетом
полученных на предыдущем этапе начального и конечного пунктов. В
результате будет получена последовательность маршрутов
)
)
)
, …, {i (jвх,1) , i jm ,2 , ..., i (jвых
,
{i (jвх,1) , i j1,1 , ..., i (jвых
} , {i (jвх,1) , i j2 ,2 , ..., i (jвых
l
l }
l }
1
11
2
22
m
mm
образующих искомый замкнутый маршрут. Эффективность этого
приближенного алгоритма поразительно высока. Общая продолжительность
его работы определяется выражением
~
T (n)  T (m) 
m
T (n ) .
k
k 1
Оценку  порядка выигрыша в продолжительности работы, получаемого
при использовании приближенного алгоритма, можно определить, если
положить, что n пунктов назначения разбиты на
~
пунктов в каждом. Тогда T (n)  ( n  1)T ( n ) .
n кластеров по
n
T ( n)
n 3.0.25
( n ) 3.025
При этом   ~


n.
T (n) ( n  1)( n ) 3.025
( n  1)
Выводы. Таким образом, для решения задачи коммивояжера высокой
размерности
предложена
многоэтапная
процедура,
использующая
предварительную кластеризацию множества пунктов назначения. Проведена
оценка выигрыша в продолжительности решения задачи. Показано, что
разработанная технология может быть эффективно использована при решении
реальных задач коммивояжера.
Список литературы: 1. Берж К. Теория графов и ее применение. – М.: ИИЛ, 1962. – 319 с.
2. Корбут А.А., Финкельштейн Ю.Ю. Дискретное программирование. – М.: Наука, 1969. – 392 с.
3. Ковалев М.М. Дискретная оптимизация. – Минск: Изд. Бел. ун., 1977. – 238 с. 4. Гомори Р.Е.
Бомоль У. Дж. Целочисленное программирование и оценки. – Новосибирск: СО АН СССР, 1962. –
198 с. 5. Литтл Дж., Мурти К., Суинни Д., Кэрел К. Алгоритм для решения задачи о
коммивояжере // Экономика и математические методы. – 1965. – Т. 1. – № 1. – С. 34 – 48.
6. Корбут А.А., Сигал И.Х., Финкельштейн Ю.Ю. Метод ветвей и границ // Math. Operat. аnd
Statist. Set. Optim. – 1977. – Т. 8. – № 2. – С. 283 – 290. 7. Михалевич В.С., Трубин В.А., Шор Н.З.
Оптимизационные задачи производственно-транспортного планирования. – М.: Наука, 1986. –
259 с. 8. Holland J.H. Adaptation in Natural and Artificial Syrtems. – University of Michigan Press,
1975. – 98 p. 9. Лысенко Ю.Г., Иванов Н.Н., Минц А.Ю. Нейронные сети и генетические
алгоритмы. – Донецк: ООО «Юго-Восток», 2003. – 265 с. 10. Koza J.R. Genetic Programming. – MIT
Press, 1994. – 134 p.
Поступила в редакцию 3.04.2006
169
УДК 61.007
А.И. ПОВОРОЗНЮК, канд. техн. наук, НТУ "ХПИ",
А.В. ДАШКИНА
ИССЛЕДОВАНИЕ ВЛИЯНИЯ ШАГА КВАНТОВАНИЯ
ПРОСТРАНСТВА ПРИЗНАКОВ НА КАЧЕСТВО СТРУКТУРНОЙ
ИДЕНТИФИКАЦИИ КВАЗИПЕРИОДИЧЕСКИХ СИГНАЛОВ
У статті розглянуто аналіз значень шагу квантування і його вплив в методі некрапкового
перетворення Хока для структурної ідентифікації фізіологічних квазіперіодичних сигналів з
метою підвищення швидкості обчислень і покращення якості комп’ютерного діагнозу. Розроблено
процедуру, яка реалізує структурну ідентифікацію за допомогою перетворення Хоку і дозволяє
проводити аналіз впливу шагу квантування на швидкість і якість структурної ідентифікації.
The article includes the analysis of values of a step of quantization and its influence in a method of not
dot Hough transformation for structural identification physiological quasiperiodical signals with the
purpose of increase of speed of calculations and improvement of quality of the computer diagnosis.
Procedure, which realizes structural identification with the help of Hough transformation is developed
and allows to spend the analysis of influence of a step of quantization for speed and quality of structural
identification.
Постановка проблемы. В традиционной схеме структурная
идентификация ФКС осуществляется с использованием эвристических
алгоритмов и метода временной адаптивной маски. Еще одним подходом к
решению задачи структурной идентификации биомедицинских сигналов
является применение преобразования Хока. Временные затраты при
реализации преобразования Хока напрямую зависят от шага квантования. В
данном методе работа ведется в квантованном пространстве параметров,
однако остается не исследованным влияние точности квантования на качество
распознавания. В связи с этим, актуальной является задача исследования
значения размера шага, с которым квантуется пространство параметров.
Анализ литературы. В задаче структурной идентификации
квазипериодических физиологических сигналов основным недостатком
эвристических методов является то, что анализируются амплитудные
характеристики сигнала, которые малоинформативны и подвержены влиянию
шумов [1, 2], поэтому приходится использовать другие характеристики
(производные, спектр и др.) в качестве дополнительных (а иногда и основных)
критериев при построении решающих правил структурной идентификации.
В [3] разработан формализованный метод структурной идентификации
физиологических квазипериодических сигналов различной природы [4, 5] с
помощью преобразования Хока.
Цель статьи. Исследование влияния шага квантования в методе
неточечного преобразования Хока (преобразование к пространству
параметров)
для
структурной
идентификации
физиологических
170
квазипериодических сигналов на вероятность распознавания и трудоемкость
алгоритма.
Применение преобразования Хока к структурной идентификации
физиологических сигналов. В [3] рассмотрена процедура структурной
идентификации биомедицинских сигналов, суть которой заключается в
следующем.
Исходный сигнал ФКС после ввода, квантования по времени и цифровой
фильтрации представляется множеством отсчетов X(ti). Каждый период
сигнала состоит из последовательности непересекающихся интервалов S1,
S2, …, Sn , причем каждый интервал Sk соответствует k-му типу структурного
элемента, k  1, n . Задачей структурной идентификации является выделение
всех участков Sk на всей реализации сигнала (разметка сигнала), после чего
уточняются границы интервалов и рассчитываются диагностические
показатели путем анализа исходного сигнала X(ti) в локальной области. Для
каждого k-го типа структурного элемента выбирается эталон путем задания
точек начала и конца интервала Sk наиболее характерного "базового" периода
и выполняется автоматическое описание эталона (аппроксимация эталона
набором аналитических кривых). Параметры аппроксимирующих кривых
являются координатами нового пространства параметров Y(P), т.е.
выполняется переход из пространства X(ti) в Y(P). В пространстве параметров
Y(P) эталон представляется точкой ωэ с координатами Pэ. Далее производится
сканирование сигнала с целью поиска структурных элементов данного типа,
при этом на каждом этапе сканирования вычисляется множество {Pс}
анализируемого участка сигнала.
Для определения расстояний между объектами в пространстве Y(P)
вводится метрика и вычисляется мера близости параметров эталона и
анализируемого участка сигнала D(Pэ, Pс), которая возвращается во временную
область в виде нормированной функции дифференциации расстояния,
изменяющейся в диапазоне от 0 до 1 [4] и сравнивается с порогом T. При
выполнении условия D(Pэ, Pс) < T считается, что интервал S ki содержит
структурный элемент k-го типа.
Результаты исследований. Для проведения исследований берутся
экспериментальные данные от 12 отведений электрокардиографа (10-ти
минутная выборка с частотой квантования 100 Гц). Разработана программа,
позволяющая провести анализ исходных данных.
В
качестве
эталона
выбирается
комплекс
QRS,
который
аппроксимируется кривыми первого порядка. Пространство признаков
является двумерным, в котором левый склон комплекса QRS описывается
координатами (а1, b1), правый склон – (а2 , b2). Диапазон изменения значений
координат лежит в диапазоне [ – 500, 500]. Результаты вычислений приведены
в табл. 1 и табл. 2., где приняты следующие обозначения: p1 – процент
171
правильно
идентифицированных
зубцов;
p2
–
процент
ложно
идентифицированных зубцов (распознанными являются не комплексы QRS);
 – математическое ожидание.
Таблица 1
Процентный показатель количества распознанных комплексов QRS при разных шагах
квантования пространства признаков (расчет расстояния производится при значении
Т = 0.4)
№
отведения
1
2
3
4
5
6
7
8
9
10
11
12

1
p1
75
30
76
45
100
50
100
25
25
80
95
25
60.5
Шаг квантования
50
100
p1
p2
p1
p2
85
0
100
0
85
0
92
0
90
0
90
0
75
0
100
0
100
0
95
0
90
0
100
0
100
0
100
0
80
0
100
0
75
0
100
0
93
0
75
0
100
0
100
0
55
0
55
0
0
85.7 0 92.3
10
р2
0
0
0
0
0
0
0
0
0
0
0
0
0
p1
75
55
50
84
50
50
100
50
65
65
95
50
65.8
p2
0
0
0
0
0
0
0
0
0
0
0
0
0
200
p1
p2
80
80
100
0
100
0
100
0
100
0
100 100*
100
70
100
75
100
85
100
90
100
0
100
0
98.3 83.3**
250
p1
p2
100 100*
100 100*
100 100*
100 100*
10
0
100 100*
100 100*
35
0
35
0
20
0
15
0
100 100*
67.9 100**
* – процент ложного обнаружения комплекса QRS может быть уменьшен
путем коррекции порога Т,
** – расчет математического ожидания ведется только с учетом значений,
отличных от нуля.
Таблица 2
Статистические характеристики временных затрат при проведении распознавания
комплексов QRS с применением разных шагов квантования пространства признаков
Статистическая
характеристика
Математическое ожидание,
t, сек
Среднеквадратическое
отклонение, t
Шаг квантования
50
100
1
10
8.917
2.247
1.438
0.715
0.276
0.179
200
250
1.133
0.866
0.225
0.061
0.126
0.141
Результаты, приведенные в табл. 1, показывают, что при применении
преобразования Хока для структурной идентификации биомедицинских
сигналов целесообразно проводить квантование пространства параметров с
шагом, значение которого лежит в пределах от 50 до 200, так как при этом
вероятность верной идентификации принимает допустимые значения, то есть
172
правильно распознаются более 85% комплексов QRS. Для каждого из 12-ти
отведений, используя функцию function Time: TDateTime среды
программирования Delphi7.0, выполнено вычисление времени выполнения
идентификации комплексов QRS. Для полученных значений временных затрат
подсчитаны статистические характеристики (математическое ожидание t и
среднеквадратическое отклонение t), приведенные в табл. 2, которые
показывают, что увеличение шага квантования позволяет значительно
ускорить
процедуру
структурной
идентификации
физиологических
квазипериодических сигналов.
Выводы. В статье рассмотрены вопросы, связанные с анализом значений
шага квантования в методе неточечного преобразования Хока для
идентификации структурных элементов физиологических сигналов.
Приведенные данные позволяют сделать вывод о том, что увеличение шага
квантования до значений, лежащих в пределах от 50 до 200, не снижает
качество распознавания структурных элементов и увеличивает скорость
процедуры обработки биомедицинских сигналов. В дальнейшем планируется
разработка программной реализации процесса оптимизации шага квантования
в режиме обучения на реальных данных, а также проведение тестирования на
пространстве параметров, квантованном неравномерно.
Список литературы: 1. Поворознюк А.И., Филатова А.Е. Преобразование пространства
признаков при идентификации структурных элементов квазипериодических сигналов
// Компьютерное моделирование. Сборник научных трудов. – Белгород: БелГТАМС,
1998. – С. 33 – 39. 2. Поворознюк А.И., Филатова А.Е. Оптимизация пространства
признаков при структурной идентификации квазипериодических сигналов
// Информационные системы. Сборник научных трудов. – Х.: НАНУ, ПАНИ, ХВУ,
1998. – Вып. 1(9). – С. 112 – 115. 3. Поворознюк А.И. Применение преобразования Хока
для структурной идентификации физиологических сигналов // Моделювання та
інформаційні технології. Збірник наукових праць Інституту проблем моделювання в
енергетиці. – К.: ІПМЕ, 2003. – Вип. 22. – С. 143 – 149. 4. Поворознюк А.И.,
Филатова А.Е. Выбор метрики пространства признаков в задаче структурной
идентификации квазипериодических сигналов // Системний аналіз, управління і
інформаційні технології: Вісник Харківського державного політехнічного університету.
Збірник наукових праць. – Вип. 99. – Х.: ХДПУ, 2000. – С. 138 – 141.
5. Поворознюк А.И., Филатова А.Е. Оценка качества распознавания структурных
элементов квазипериодических сигналов // Інформаційно-керуючі системи на
залізничному транспорті. – 2000. – № 6 (27). – С. 53 – 55. 6. Вайнштейн Г.Г.,
Москвина Е.А., Белов Д.А. Идентификация графических объектов на основе
преобразования к пространству параметров // Машинная диагностика и
информационный поиск в медицине. – М.: Наука, 1986. – С. 98 – 108. 7. Hough P.
Method and means for recognizing complex patterns // US Patent № 3069654, Dec. 18, 1962.
8. Duda R., Hart P. Use of the Hough Transformation to detekt lines and curves in pictures
// Communs. ACM. – 1972. – Vol. 15. – № 1. – P. 11 – 15.
Поступила в редакцию 10.04.2006
173
УДК 61.007
А.І. ПОВОРОЗНЮК, канд. техн. наук, НТУ "ХПІ",
О.В. БЄЛАН, НТУ "ХПІ"
СТРУКТУРНА ІДЕНТИФІКАЦІЯ МЕДИЧНИХ ЗОБРАЖЕНЬ
Запропоновано евристичний метод структурної ідентифікації біологічних об’єктів напівтонових
двомірних медичних зображень, що використовує сегментацію зображення та процедуру
розгортки з метою забезпечення інваріантності від поворотів об’єкту, який ідентифікується.
Розроблена автоматизована система структурної ідентифікації біологічних об’єктів. Реалізовані
процедури опису еталона та розпізнання структурних елементів.
A heuristic method of structural identification of biological objects of gray level images, which uses
image segmentation and scansion procedure with the purpose of providing turning invariance of
identifiable object, is proposed. Computer-aided system of structural identification of biological objects is
developed. Procedures of pattern description and structural elements identification are consummated.
Постановка проблеми. Обробка зображень з метою їхнього
розпізнавання є однією із центральних і практично важливих задач при
створенні систем штучного інтелекту. Проблема носить комплексний
ієрархічний характер і включає ряд основних етапів: сприймання поля зору,
сегментація, нормалізація виділених об'єктів, розпізнавання. Інтерпретація
зображень включається частково в етап сегментації й остаточно враховується
на етапі розпізнавання. При цьому виникає цілий ряд специфічних труднощів і
проблем (зображення пред'являються на складному фоні, зображення еталону
й вхідних зображень відрізняються положенням у полі зору, вхідні зображення
не збігаються з еталонами за рахунок випадкових перешкод, еталони й
зображення можуть відрізняти геометричні перетворення, включаючи такі
складні як афінні й проективні).
Важко знайти іншу сферу інженерної діяльності, успіхи в якій були б
порівняні з досягненнями в області обчислювальної техніки. Проте,
можливості інтелектуального аналізу зображень за допомогою комп'ютерів
залишають бажати більшого. Універсальних методів обробки зображень,
порівнянних по ефективності з інтелектуальними можливостями людини, ще
не знайдено, що стимулює активну діяльність вчених у цьому напрямку.
Виходячи з вищесказаного, до однієї з основних задач в області аналізу
зображень варто віднести розробку підходів до автоматизованої побудови й
вибору процедур розпізнавання, які вирішують конкретне завдання й
задовольняють деякому набору критеріїв (швидкодії, точності розпізнавання
тощо).
Аналіз літератури. В [1] проведено аналіз основних етапів
автоматичного розпізнання зображень. Методи пошуку однорідних областей
та виділення контурних ліній, що викладаються в [2], являються основними
підходами до сегментації в процесі розпізнавання зображень. В [3, 4]
174
розглянуті основи комп'ютерної обробки зображень, дані методи й алгоритми
виділення контурів на зображеннях. Технічні труднощі реалізації процедури
розпізнання зображень на ЕОМ, що пов'язані з великою ємністю математичних
обчислень, розглядаються в [5, 6]. Вплив динамічних перекручувань
зображень об'єктів на якість методів ідентифікації зображень об'єктів заданої
форми досліджено в [7]. Питання розробки методів і алгоритмів для опису,
відтворення й візуалізації зображень висвітлено в [8].
Мета статті – розробка евристичного методу структурної ідентифікації
біологічних об’єктів напівтонових двомірних медичних зображень, що
використовує сегментацію зображення та процедуру розгортки з метою
забезпечення інваріантності від поворотів об’єкту, який ідентифікується.
Схема структурної ідентифікації зображення. Автоматизована система
структурної ідентифікації медичних зображень повинна забезпечувати:
завантаження медичного зображення із графічного файла; сканування та
сегментацію (виділення фрагментів) зображення; розпізнавання виділених
фрагментів; збереження результатів розпізнавання у графічному та текстовому
файлах. Узагальнену схему структурної ідентифікації медичних зображень
наведено на рис. 1.
Завантаження
зображення
Сканування та
сегментація
Розпізнавання
зображення
Збереження
результатів
Рис. 1. Схема структурної ідентифікації зображення
Сегментація зображення. Сегментація звичайно розуміється як процес
пошуку однорідних областей на зображенні. Цей етап досить важкий і в
загальному виді не алгоритмізований до кінця для довільних зображень. Для
спрощення задачі припустимо, що фрагменти зображення оточені фоном з усіх
боків. У якості фону приймаються точки, яскравість яких лежить у діапазоні
[0, ф], де ф = 0,05мах (мах – максимальне значення яскравості у зображенні).
Алгоритм сегментації вхідного зображення, що пропонується, полягає у
наступному:
1) Скануємо вхідне зображення справа наліво та зверху вниз с шагом  до
тих пір, поки не буде знайдено точку з кольором, що відрізняється від кольору
фона. Якщо такої точки не знайдено, то більше сегментів у зображенні немає
(кінець алгоритму).
2) Аналізуємо зображення вниз по прямій лінії від знайденої точки до тих
пір, поки не буде знайдено фонову точку.
3) Зсуваємо цей відрізок прямої вліво до тих пір, поки на цьому відрізку є
точки, що відрізняються від кольору фона. Аналогічно зсуваємо та аналізуємо
цей відрізок прямої вправо.
175
4) Зсуваємо нижню сторону прямокутника, що утворює зсунуті відрізки
прямих, вниз до тих пір, поки на цій стороні є точки, що відрізняються від
кольору фона. Аналогічно зсуваємо верхню сторону прямокутника вверх.
5) Пункти 3 – 4 повторюємо до тих пір, поки цей прямокутник не буде
повністю оточувати фрагмент зображення. Цей прямокутник і є сегментом
зображення, який потребує ідентифікації.
6) Переходимо на пункт 1 і повторюємо сканування вхідного зображення
до наступного сегменту. При цьому треба пропускати сегменти, що вже були
знайдені під час попереднього сканування.
Процедура розгортки. При розпізнаванні структурних елементів
(фрагментів) вхідного зображення застосовується наступна процедура
розгортки (для спрощення задачі припустимо, що фрагмент обмежується
квадратом). Виконується сканування цього квадрату з фрагментом
зображення, починаючи з його центра по спіралі з заданим шагом h, що
називається ходом розгортки і є параметром структурної ідентифікації (рис. 2).
Рис. 2. Приклад застосування процедури розгортки
Потім будуються дві гістограми яскравості. Для побудови першої
гістограми використовується кожна точка розгортки. Друга гістограма
відображує зміну яскравості вздовж розгортки з урахуванням її витків.
Кількість стовпців n у гістограмах також є параметром структурної
ідентифікації.
Аналогічна процедура розгортки застосовується при опису еталона
зображення та побудові його гістограм яскравості.
Процедура розпізнавання. Для розпізнавання фрагмента зображення
необхідно визначити деяку міру близькості ( f , f e ) , де f – зображення
фрагмента, а f e – еталонне зображення. Спочатку визначимо міру близькості
гістограм першого типу:
1 ( f , f e ) 
n
e 2
 (ni  ni )
i 1
n
e 2
 (ni ) ,
i 1
(1)
де N – загальна кількість точок у фрагменті зображення, ni – кількість точок у
i-му стовпчику гістограми фрагмента, nie – кількість точок у i-му стовпчику
176
гістограми еталону. Аналогічно визначимо міру близькості
2 ( f , f e )
гістограм другого типу. Тоді, міра близькості  2 ( f , f e ) має вигляд:
( f , f e )  k112 ( f , f e )  k 2  22 ( f , f e ) .
(2)
Фрагмент зображення вважається ідентифікованим, якщо
( f , f e )   ,
(3)
де  – максимально припустиме значення міри близькості.
У роботі досліджено якість структурної ідентифікації об’єктів
напівтонових двомірних зображень у залежності від параметрів структурної
ідентифікації h, , n і .
Висновки. В результаті виконання роботи розроблено евристичний метод
структурної ідентифікації біологічних об’єктів напівтонових медичних
зображень, що використовує методику порівняння з еталоном. Даний метод
супроводжується застосуванням процедури розгортки з метою забезпечення
інваріантності від поворотів об’єкту, який ідентифікується. Розроблено
інтерфейс користувача із системою, що забезпечує настроювання режиму
досліджень, візуалізацію поточних і усереднених показників. Подальший
розвиток роботи може бути пов'язаний з вибором і уточненням вимірюваних
параметрів та відпрацюванням механізмів проведення пробних експериментів.
Перелік літератури: 1. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. – М.:
Наука, 1974. – С. 34 – 156. 2. Розенфельд А. Распознавание и обработка изображений с помощью
вычислительных машин. – М.: Мир, 1972. – С. 16 – 144. 3. Хуан Т., Шрейбер В., Третьяк О.
Обработка изображений // ТИИЭР. – 1971. – Т. 59. – № 11. – С. 59 – 89. 4. Брайс К.Р.,
Феннема К.Л. Анализ сцены при помощи выделения областей // Интегральные роботы. Вып. 2. –
М.: Мир, 1975. – С. 136 – 159. 5. Техническое зрение роботов / Под ред. Ю.Г. Якушенкова – М.:
Машиностроение, 1990. – 300 с. 6. Путятин Е.П., Аверин С.И. Обработка изображений в
робототехнике. – М: Машиностроение, 1990. – 320 с. 7. Гиренко А.В., Ляшенко В.В.,
Машталир В.П., Путятин Е.П. Методы корреляционного обнаружения объектов. – Харьков: АО
"БизнесИнформ", 1996. – 112 с. 8. Блок А.С., Зюзин О.М., Крупицкий Э.И., Фридман Г.Х.
Гибридные оптико-электронные системы распознавания изображений // Автометрия.
АН СССР СО. – 1974. – № 1. – С. 36 – 46.
Надійшла до редакції 17.04.2006
177
УДК 681.324
П.Е. ПУСТОВОЙТОВ, канд. техн. наук,
ЭЛЬ САЕД АБДЕЛААЛ ЭЛЬ САЕД МОХАМЕД
МИНИМАКСНОЕ УПРАВЛЕНИЕ ДИСЦИПЛИНОЙ
ОБСЛУЖИВАНИЯ В КОМПЬЮТЕРНЫХ СЕТЯХ
Розглянуто задачу управління обслуговуванням сукупності нестаціонарних потоків на вході вузла
комп’ютерної мережі. Введено критерії ефективності управління. Отримано співвідношення, що
задають параметри раціонального управління.
It was considered the task of transient flow aggregation control on network hub entrance. It was
introduced the criteria of control affectivity. Equations that set parameters of rational control were got.
Введение. Анализ литературы. По мере глобального роста и
интенсивности использования Internet и корпоративных объединенных
компьютерных сетей на передний план выходит ряд требований к качеству
функционирования сетей, среди которых одним из самых важных является
эффективная борьба с перегрузкой. При этом для удовлетворения этих новых
требований недостаточно просто увеличить пропускную способность сети.
Необходимы результативные методы управления трафиком и дисциплиной
обслуживания потоков в узлах сети. Дело в том, что при возникновении
перегрузки реальной становится опасность потери пакетов. Эти потерянные
пакеты необходимо передавать повторно, что заметно увеличивает нагрузку на
сеть и является причиной значительных задержек [1]. Более серьезный
негативный феномен, называемый «глобальной синхронизацией» [2], состоит
в следующем. Как правило, эффект переполнения очередей затрагивает
несколько очередей одновременно. При этом в результате принятия мер для
снятия перегрузки суммарный объем трафика резко падает и в течение
определенного времени сеть используется не в полной мере. Это приводит к
увеличению объемов трафика и возникает новый цикл «перегрузканедогрузка».
При анализе возникающих здесь ситуаций для выбора мер
противодействия перегрузкам необходимо иметь в виду, что поток сообщений
для каждого узла сети представляет собой суперпозицию некоторого числа
неоднородных потоков разной интенсивности и содержащих пакеты разной, в
среднем длины. Известные методы борьбы с перегрузкой [3 – 5] учитывают
эти обстоятельства в недостаточной мере.
Перечисленные обстоятельства определяют цель работы: рассмотрение
методов борьбы с перегрузкой, основанных на управлении дисциплиной
обслуживания с учетом различий в интенсивностях потоков, суммарное
воздействие которых формирует перегрузку.
Основные результаты. Понятно, что рассмотрение вопросов управления
дисциплиной обслуживания невозможно без предварительного описания
178
потоков сообщений, поступающих на вход узла. Эти потоки являются
нестационарными. Непосредственный анализ наблюдений за трафиком
позволяет выявить наличие суточных, недельных и сезонных колебаний
интенсивности потоков. При этом, практически в каждом потоке, амплитуда
сезонных колебаний заметно меньше амплитуды недельных и особенно
суточных колебаний, которая является самой высокой. С учетом этого
обстоятельства выберем интервал наблюдений меньшим четверти периода
сезонных колебаний и займемся отысканием амплитуды суточных и
недельных колебаний. Разобьем интервал наблюдений на совокупность
подынтервалов длиной  (например,   12 часа ). Зафиксируем количество
пакетов, поступающих в пределах каждого подынтервала. Обработаем теперь
совместно случайные значения числа пакетов, приходящих в одно и то же
время суток и в одноименные дни недели (например, интервал с 10 30 до 11 00
вторника). Вычислим среднее значение и дисперсию числа пакетов,
поступающих в каждый из подынтервалов. При этом получим совокупность
средних значений m1 , m2 , ..., mn случайного числа пакетов и их дисперсий
12 , 22 , ..., 2n , n  24 * 7  168 . Введем теперь модель,
зависимость интенсивности входящего потока от времени
2
(t )  a0 (a1  a2 cos(224 t )) cos(168
t) .
описывающую
(1)
Параметры a0 , a1 , a2 модели (1) найдем, используя данные о реальных
наблюдениях, по методу наименьших квадратов. Введем функционал
n
J

k 1
n
[mk  (t k )]
2

[ m
k
k 1



 .2
 a0  a1  a2 cos 12
t cos 74
t] .
(2)
Минимизируем (2) методом Нелдера-Мида [6]. При этом получим оценки
â0 , â1 , â2 , подстановка которых в (1) дает прогнозируемые моделью
значения интенсивности входящего потока в любой момент времени t .
Адекватность модели может быть проверена по критерию Фишера [7] с учетом
анализа автокорреляции остатков [8]. Полученные описания динамики
интенсивности потоков могут быть использованы для отыскания управления
обслуживанием потоков на входе узла. В соответствии с принятой в настоящее
время схемой BRFG разделения процессора [2] или какой-либо другой схемой,
ресурс системы обработки в каждом цикле обслуживания распределяется
определенным образом между потоками.
Пусть в систему поступает суперпозиция n разнородных по
интенсивности 1 ,  2 , ...,  n и длине пакетов потоков, а соответствующие
интенсивности обслуживания образуют набор 1 ,  2 , ...,  n . Введем вектор
X  x1 , x2 , ..., xn  , где x j – доля цикла обслуживания, выделяемая для
179
обработки
j -го
потока.
jxj
Тогда
–
эффективная
интенсивность
обслуживания пакетов j -го потока, j  1, 2, ..., n .
Как известно [9, 10], вероятность того, что в одноканальной системе
обслуживания с пуассоновским потоком интенсивности  на входе длина
очереди составляет s заявок, определяется выражением
P1 s  (1  ) s 1 ,

где  
– приведенная интенсивность входящего потока. Тогда с учетом

разделения ресурса процессора, в соответствии с компонентами вектора X ,
вероятность того, что длина очереди j -го потока будет равна s имеет вид
s 1

 j   j 

  (1   j )  sj 1 .
(3)
P1 s, j  1 
  j x j   j x j 



С учетом (3) легко рассчитать вероятность того, что длина очереди будет
не меньше какого-то конкретного критического значения q0 :


P
Pj ( s  q0 ) 
1 s , j
s  q0

 (1  
s 1
j ) j
.
s  q0
При k = s – q0 имеем
Pj ( s  q0 )  (1   )


 kj  q0 1  (1   ) qj0 1
k 0


k
j
  qj0 1 .
k 0
Введем теперь минимаксное управление распределением ресурса
процессора, минимизирующее в каждом цикле распределения максимальную
вероятность того, что длина очереди будет не ниже критической. Ясно, что
реализация такого управления приведет к тому, что вероятности критической
ситуации для всех потоков будут равны между собой:
P1 (s  q 0 )  P2 (s  q 0 )  ...  Pn (s  q 0 )  C
или
( j /  j x j ) q0 1  C , j  1, 2, ..., n .
(4)
Неизвестная константа C в (4) отыскивается из условия нормировки.
В результате получим
j
xj  n
, j  1, 2, ..., n .
(5)

j
j 1
Замечательное свойство полученного управления состоит в том, что оно
не зависит от критической длины q0 . Близкий результат получается, если
180
рациональное распределение ресурса искать с использованием аддитивного
критерия – среднее число очередей, длина которых не ниже критической.
Формальное описание задачи: найти вектор X , минимизирующий
j

F ( x) 
x
j 1  j
и удовлетворяющий ограничениям
n





q0 1
(6)
n
x
j
 1 , x j  0 , j  1, 2, ..., n .
(7)
j 1
Задача (6) – (7) легко решается методом неопределенных множителей
Лагранжа. Функция Лагранжа при этом имеет вид
j

 ( x) 
x
j 1  j
n





q0 1

 


n
x
j
j 1

 1 .


Далее имеем
q0 1
 j (q 0  1)
d ( x)

   0 , j  1, 2, ..., n .
q 2
dx j
x j0
Отсюда
1
1

 q0 1    q0 1 q0 1

q 2



x j  q 1
 
 j 0 , j  1, 2, ..., n .

  0 (q  1 
q

1
 0

0
 j

Подставим (8) в (7):
  

x j  

 q0  1 
j 1
n


1
n
q0  2

(8)
q0 1
 j q0  2  1 .
j 1
Тогда
  


 q 1 
 0


1
q0  2

1
n

q0 1
q0  2
.
(9)
j
j 1
Наконец, подставляя (9) в (8), окончательно имеем
q0 1
xj 
 qj 0  2
n

q0 1
q0  2
, j  1, 2, ..., n .
j
j 1
181
(10)
Ясно, что при практических, достаточно больших, значениях q0
xj 
j
, j  1, 2, ..., n ,
n

(11)
j
j 1
что совпадает с (5).
Таким образом, полученные выражения позволяют определить
рациональное распределение ресурса процессора, минимизирующее
негативные последствия перегрузки. Понятно, что в связи с
нестационарностью входящих потоков нестационарным должно быть и
управление распределением ресурса. Реализовать на практике такое
управление технологически удобно, используя интервальное, кусочнопостоянное управление. При этом цикл обновления управления естественно
выбрать так, чтобы максимальное отклонение интенсивностей входящих
потоков от соответствующих средних, в пределах цикла, значений не
превосходило заданное значение. Соответствующее аналитическое выражение
отображается неравенством
T0


1

max max max   j (t ) 
 j (t )dt    ,
j
T0 0t T0 
T0

0


которому должно удовлетворять искомое значение периода обновления.

Выводы. Введена математическая модель описания нестационарных
входящих потоков и процедура оценивания параметров модели. На их основе
предложена технология рационального распределения ресурса процессора,
обеспечивающая эффективное противодействие перегрузкам в узлах
компьютерных сетей. Получено соотношение для расчета периода обновления
управления распределением ресурса.
Список литературы: 1. Таненбаум Э. Компьютерные сети. – СПб.: Питер, 2003. – 992 с.
2. Столлингс В. Современные компьютерные сети. – СПб.: Питер, 2003. – 783 с. 3. Karr P.,
Partridge C. Improving Roud-Trip Estimates in Reliable Transport Protocols // ACM Trans. On Coup.
Systems. – 1991. – № 3. – P. 88–97. 4. Goyal R. Improving Performance of TCP over the ATM Service
// Proc., ICC. – 1997. – № 6 – P. 34–51. 5. Jacobson V. Congestion Avoidence and Control // Proc.
Comp. Communication Review. – 1995. – № 1. – P. 87–104. 6. Мину М. Математическое
программирование. – М.: Наука, 1990. – 488 с. 7. Крамер Г. Математические методы статистики. –
М.: Мир, 1975. – 563 с. 8. Сигел Э.Ф. Практическая бизнес-статистика. – М.: Вильямс, 2004. –
1051 с. 9. Риордан Дж. Вероятностные системы обслуживания. – М.: Связь, 1996. – 184 с.
10. Гнеденко Б.В., Коваленко И.Н. Введение в теорию массового обслуживания. – М.: Наука, 1987.
– 336 с.
Поступила в редакцию 30.03.2006
182
ОБЗОРНЫЕ ПУБЛИКАЦИИ
по правовой информатике
УДК 519.711.3:343
М.В. ГВОЗДЕНКО,
С.М. ІВАНОВ, канд. техн. наук (м. Харків)
КОМП’ЮТЕРНІ СИСТЕМИ У НОТАРІАЛЬНІЙ ТА СУДОВІЙ
ДІЯЛЬНОСТІ
Стаття присвячена актуальній проблемі комп‘ютерізації судовій діяльності. Основний програмний
продукт, який застосовується в судовій та нотаріальній діяльності – автоматизовані інформаційнодовідкові правові системи. В статті розглядаються вопроси побудови, інформаційного
забезпечення та класифікації автоматизованих інформаційно-довідкових правових систем по
функціональному призначенню. Наведені приклади інформаційно-довідкових правових систем,
які розповсюджені по Україні.
Clause is devoted to a urgent problem of a computerization of judicial activity. Basic programt product
used in judicial and notarial activity - automated -help legal systems. In clause the questions of creation,
information maintenance and classification of the automated information-help legal systems by functional
purpose(assignment) are considered. The examples of information-help legal systems
widespread(distributed) on Ukraine are given.
Постанова проблеми. Одним зі шляхів удосконалення організації
судочинства служить підвищення ступеня інформатизації судів, їхня
комп'ютеризація, розширення застосування комп'ютерних технологій,
створення на цій базі сучасних і надійних систем добору, збереження
інформації, доступу до неї, а також її використання і поширення.
Аналіз літератури. Найбільш поширенними автоматизованими
правовими системами України є інформаційно-пошукова правова система
"Нормативні акти України" (НАУ), системи мережі ділової інформації ЛігаЗакон,
інформаційно-довідкова
система
"Законодавство
України",
інформаційно-довідкова система "Право", програмний комплекс "ЕкспертЮрист" та нотаріальні реєстри. На підставі деяких з них і провадились данні
дослідження [1 – 6].
Мета статті. Дослідження створення, можливості та доцільності
використання комп'ютерних технологій у судовій та нотаріальній діяльності,
їх переваг та ефективністі.
Принципи побудови та можливості сучасних автоматизованих
правовових систем України. Велику роль у комп'ютерізації судової та
нотаріальної діяльності відіграє автоматизація інформаційного забезпечення, і
зокрема, її невід'ємний і першорядний елемент – довідково-правові системи.
Програми цього класу надають не тільки доступ до правової інформації, а і
183
стають зручним інструментом роботи з нею, що дозволяє навіть не фахівцю в
сфері права використовувати нормативні документи у своїй діяльності.
Друга важлива задача, яку дозволяють вирішити правові системи – це
пошук необхідних нормативних документів. Цьому сприяє продумана
організація інформації у середині бази даних програми, а саме – індексування
документів за допомогою ключових слів, пошук у назві й у тексті документа, а
також сортування нормативних документів по тематиці. Крім пошуку, системи
оснащені іншими додатковими засобами керування інформацією –
можливостями створення добірок документів, відстеження зв'язків між
документами. Ефективна робота з текстом документів включає можливість
позначати необхідні місця в тексті закладками, а засоби імпорту можуть
зберегти документ в одному зі зручних форматів (наприклад, у форматі
текстового редактора Word чи у форматі html) [7, 8].
До складу сучасних довідкових правових систем входять не тільки бази
даних по нормативних документах. Багато виробників правових систем
доповнюють свої продукти і іншою вкрай корисною довідковою інформацією.
Ще одним доповненням сучасних довідкових правових систем є тематичні
пакети по різних напрямках діяльності. Вони включають словники, довідники,
електронні підшивки періодичних видань, бланки звітів. Таким чином,
довідкові системи по законодавству є універсальними і різнобічними
електронними помічниками сучасного підприємця.
Розробка програмного забезпечення – це складний комплекс самостійних
розробок, що містить у собі ряд процесів, які є загальними для практично
будь-якого програмного продукту [9, 10].
– Визначення вимог. На даному етапі виявляються потенційні
користувачі програмного продукту і пропоновані ними вимоги до
автоматизованої системи чи програмному комплексу. Подібні роботи
найчастіше містять значний пошуковий елемент і часто зв'язані з необхідністю
попереднього проведення наукових досліджень. Результати роботи на цьому
етапі найчастіше оформляються у виді, так називаного, передпроектного
обстеження. Визначення вимог для створення автоматизованих систем в
області інформаційного забезпечення правозастосувальної діяльності має ряд
особливостей, що визначаються специфікою автоматизуємого об'єкта.
Зазначена задача, незважаючи на достаток технічної термінології, є переважно
правововою по своїй суті і повинна виконуватися юристами, що чітко
представляють змістовну сторону задачі, що розв‘язується. При автоматизації
завжди зважується безліч технічних проблем, але саме на етапі визначення
вимог і на етапі функціонування автоматизованої системи інформаційного
забезпечення вага правових аспектів є граничною.
– Проектування. На даному етапі виконується аналіз задач, для рішення
яких розробляється програмний продукт, створюється проект, що задовольняє
вимогам користувачів, вибираються шляхі рішення поставлених задач,
визначаються форми інформаційного, технічного, математичного, правового,
184
лінгвістичного, програмного й інших видів забезпечення. Цей етап
завершується складанням технічного завдання, робочого документа, на
підставі якого буде виконуватися наступний етап роботи.
Особливість
етапу
проектування
автоматизованої
системи
інформаційного забезпечення правозастосувальної діяльності полягає в тому,
що тут підвищується вага технічних аспектів – визначається мова
програмування, способи технічного захисту інформації, боротьби зі збоями в
енергоживленні й ін.
– Розробка. На даному етапі потрібно написати код, а потім налагодити і
документувати програму, переконавшись, що вона задовольняє вимогам
користувачів. Тут істотно підвищуються роль математичних, програмних і
технічних знань, тому що цей етап зв'язаний, насамперед, з розробкою
програмних комплексів і їхньою реалізацією на обчислювальних машинах.
– Впровадження. Під впровадженням автоматизованої системи розуміють
комплекс робіт, зв'язаних з передачею автоматизованої системи користувачу і
початку її робочої експлуатації. Як правило, цей етап має ряд самостійних
"підетапів" таких як установка програми, її апробування, досвідчена
експлуатація, перевірка її на тестових прикладах і ін.
Кінцевими користувачами інформаційно-правових систем є
не
програмісти і системні адміністратори, а люди найчастіше дуже далекі від
технічних тонкощів функціонування програм для ЕОМ. Рішення цього
питання можливо при діалоговій побудові системи. Свій розвиток діалогова
побудова систем у даний час одержує в розробці так званих об’єктноорієнтованих програм. У таких програмах для активізації тієї чи іншої функції
використовуються об'єкти (картинки, кнопки, списки, іконки і т.п.), що
відображають зміст і характер виконуваної функції, що підвищує швидкість
сприйняття інформації, що представляється, швидкість керування програмою,
поліпшує візуальне представлення програми (її інтерфейс).
Забезпечення функціонування правової системи інформаційного
забезпечення має своєю метою створення комфортних, надійних і
безперебійних умов роботи кінцевих користувачів:
– Застосування системи гіпертекстових посилань – наявність такої
системи дозволяє зв'язати кілька документів один з одним. Часто один
нормативний акт містить посилання на інші нормативні акти. При цьому у
користувача є можливість подивитися це посилання безпосередньо з
первісного документа, а потім повернутися до нього ж.
– Адекватність запитів і відповідей – одна з найважливіших вимог
інформаційного забезпечення зводиться до того, що відповідь системи
повинна адекватно відображати запит користувача. Ступінь точності відповіді,
звичайно, залежить від багатьох параметрів системи. Велике значення має
коректність класифікації інформації, побудови самої системи і т.д. Однак
багато в чому відповідність відповіді запиту визначається саме на етапі
організації функціонування системи.
185
– Орієнтація на мережні системи – мережна версія програми дозволяє
відразу декільком користувачам працювати з однією програмою одночасно.
При досить високій вартості деяких довідково-правових систем це є
безсумнівною перевагою.
– Захист системи від несанкціонованого доступу. При функціонуванні
системи інформаційного забезпечення необхідно вирішувати питання про
ступінь її захищеності від несанкціонованого доступу. У тих випадках, коли
інформаційна система має комерційну цінність, її варто захищати від доступу
осіб, що не придбали права на користування накопиченою інформацією.
Довідково-правові системи входять в групу інформаційного забезпечення
спеціального призначення. У свою чергу її можна розділити по
функціональних задачах, серед яких виділяються наступні:
– рішення задач законотворчості і кодификації законодавства;
– активізація правових знань у правотворчої і правозастосовальній
діяльності, забезпечення достовірною правовою інформацією кожного члена
суспільства;
– підтримка в контрольному стані інформації про нормативні акти в
зв'язку з відновленням і зміною законодавства;
– забезпечення інтеграції знань про чинне законодавство колишнього
СРСР, законодавстві України і країн учасниць СНД;
– підтримка ретроспективного фонду нормативних актів;
– розвиток нових організаційно-технологічних структур.
Висновки. Інформатизація судів припускає прийняття єдиної концепції і
вироблення погодженого із судами підходу до створення базових програмноапаратних комплексів, засобів інформаційного, нормативно-правового,
організаційно-методичного і кадрового забезпечення діяльності судів.
Список літератури: 1. Морозов В.К., Грузинцева С.О., Селезнева Ю.А., Барджис Ю.А. Основные
тенденции в развитии компьютерных систем правовой информации // Правовая информатика,
1996. – Вып. 1. 2. Аглицкий И., Коротич П. Компьютерные справочные правовые системы за
рубежом и в России // "ComputerWeek", № 47. 3. Офіційний сайт Верховної Ради України
http://www.rada.gov.ua. 4. Офіційний сайт АІПС НАУ http://www.nau.kiev.ua/index.php.
5. Офіційний сайт ЛІГА http://liga.net/ 6. Офіційний сайт BVV software http://bvv.kiev.ua/pravo.html.
7. Morris L. Cohen and Kent C. Olson. Legal Research in a nutshell // St. Paul, Minn., West Publishing
Co, 1992. 8. Гегечкори Л.А., Шмелев А.А. Задачи совершенствования поискового аппарата
автоматизированных информационно-поисковых систем по законодательству // Правовая
информатика, 1999. – Вып. 1. 9. Калмыков Б.М., Жирнов А.Н., Емельянов А.В. Автоматизированная
система. Справочно-информационный фонд с текстовыми и графическими данными // Экспертная
практика. МВД РФ, 1994. – № 35. – С. 63 – 64. 10. Комин К.К. Эволюция информатики и проблема
формирования нового комплекса наук об информации // Научно-техническая информация.
Серия 1. Организация и методика информационной работы. – 1995. – № 5. – С. 1 – 7.
Поступила в редакцию 07.04.2006
186
УДК 519.711.3:343.98
Н.И. МАЗНИЧЕНКО, НЮАУ (г. Харьков)
АНАЛИЗ АВТОМАТИЗИРОВАННЫХ ДАКТИЛОСКОПИЧЕСКИХ
ИНФОРМАЦИОННЫХ СИСТЕМ (АДИС)
Розглянуті архітектурні і технічні принципи побудови і математичний апарат сучасних
автоматизованих дактилоскопічних інформаційних систем, які використовуються в
правоохоронних органах. Представлені переваги даних систем в порівнянні з традиційними
методами дактилоскопічного обліку. Досліджені можливість і доцільність їх використовування
для вирішення задач по ідентифікації особи.
Architectural and technical principles of construction and used mathematical vehicle of the modern
automated dactyloscopic informative systems are considered. Advantages of these systems as compared
to the traditional methods of dactyloscopic account are presented. Possibility and expedience of their use
for the decision of tasks on authentication of personality is explored.
Постановка
проблемы.
Автоматизация
судебно-экспертной
деятельности позволяет практически исключить ошибки, которые
наблюдаются при использовании обычных методов [1]. На сегодняшний день
круг экспертных исследований, проводимых с помощью компьютерной
техники и современных информационных технологий, существенно
расширился [2]. Одним из направлений компьютеризации судебно-экспертной
деятельности являются автоматизированные системы анализа изображений:
дактилоскопические,
трассологические,
портретные,
составление
композиционных портретов и другие. В последнее время особую
популярность в правоохранительных органах приобрели автоматизированные
дактилоскопические
оперативно-справочные
системы,
позволяющие
оперативно получать необходимые справочные и проверочные данные о
задержанных
лицах,
неустановленных
преступниках,
осужденных,
разыскиваемых и т.д. [3].
Анализ литературы. Наиболее распространенными АДИС на
сегодняшний день являются японская NEC, французская Sagem Morpho,
американские Cogent и Printrak, российские СОНДА и ПАПИЛОН,
белорусские «Тодес» и «Дакто». На основе некоторых из них, получивших
распространение в Украине, и проводились данные исследования [4 – 6].
Цель статьи. Исследование возможностей и целесообразности
применения АДИС при решении некоторых правовых задач, их преимущества
по сравнению с традиционными методами ведения дактилоскопического
учета.
Принципы построения и математический аппарат современных
АДИС. Алгоритм АДИС позволяет отображать отпечатки пальцев в виде
математической модели, то есть перевести особенности узора в цифры (после
187
этого сопоставить отпечатки становится делом техники) [7].
Автоматизированные дактилоскопические информационные системы
предназначены для автоматического ведения дактилоскопических учетов и
незаменимы для решения следующих задач:
– установления личности непознанных трупов и лиц, скрывающих
анкетные данные;
– установления лиц, оставивших следы, и поставленных на
дактилоскопический учет;
– установления факта: одним лицом или разными лицами оставлены
следы рук на предметах, изъятых с мест различных преступлений;
– идентификация лиц, страдающих амнезией.
Архитектурные и технические свойства АДИС позволяют строить
территориально
распределенные,
легко
масштабируемые,
быстро
развивающиеся комплексы дактилоскопического учета и открывают новую
эру в создании недорогих экспертно-информационных дактилоскопических
систем. Как информационная система, новая по методу описания
дактилоскопических
изображений,
АДИС
опирается
на
богатое
математическое описание папиллярных узоров, созданное командой ученых,
математиков и высококвалифицированных программистов. В математическом
ядре АДИС используется интеллектуальная экспертная система, основанная на
эвристических методах.
АДИС позволяет оперативно проводить высоконадежные проверки лиц и
следов по массивам дактилоскопической информации реального качества.
Высокая скорость поиска АДИС снижает требования к техническим
средствам, на которые устанавливается система. В АДИС работает очень
богатая система признаков. Это не просто идентификационная, а понастоящему экспертная система: процедуры поиска находят и сильно
деформированные, и сильно зашумленные изображения. Поэтому АДИС
обеспечивает работу с традиционными дактилоскопическими учетами на
новом качественном уровне. В современных АДИС в качестве опорных
характеристик используется топология узора, прослеживаемая по линиям, и
морфологическая метрика между частными признаками – модифицированный
вариант межгребневого счета, устойчивый к деформации изображения и
изменению кривизны линий. Широко используя плотность папиллярных
линий и инвариантные признаки, АДИС не зависит от масштаба [8].
АДИС является открытой средой, позволяющей моделям клиент-сервер
или централизованным схемам разделять единый поток вычислений. Системы
были спроектированы так, чтобы отвечать возрастающим потребностям в
расширяемости и производительности. Объектно-ориентированная база
данных обеспечивает как преимущества, так и простоту использования
системы. Современные АДИС могут максимально гибко адаптироваться под
уже имеющиеся технические ресурсы. Богатая система настроек обеспечивает
неоспоримые преимущества. АДИС предоставляет пользователю полный
188
набор функций, которые можно использовать в ходе идентификации личности
и расследования преступлений.
В АДИС используются новейшие математические методы для
автоматического
кодирования
дактилоскопических
карт
и
полуавтоматического кодирования следов. Акцент сделан в области нечеткой
логики, нейронной технологии, дискретной математики, теории графов.
Блок-схема процедуры автоматического кодирования изображений
состоит из двух частей. Первая обработка извлекает интегральные
характеристики узора. На хороших изображениях помощи человека здесь не
требуется. Однако на неполных смазанных узорах лучше проверить
правильность простановки петель, дельт и завитков. Вторая обработка
извлекает частные признаки, крючки, глазки, мостики и фрагменты
изображения. В систему заложены скоростные интеллектуальные алгоритмы.
Скорость – дополнительное преимущество. АДИС почти на каждом этапе
кодирования многократно уточняет результаты измерения. Участие человека
здесь не требуется. Характеристики частных признаков извлекаются без
ошибок.
АДИС предлагает уникальные преимущества высокоточного, полностью
автоматического детектирования типовых узоров, зон ожогов, шрамов. Чтобы
обеспечить качество кодирования около сотни функций порождают более
тысячи признаков для каждого фрагмента изображения. Экспертиза следов
является процедурой полуавтоматического кодирования следов пальцев рук,
опирается на алгоритмы автоматической обработки с предоставлением
человеку возможности вмешаться в работу алгоритма в каждой контрольной
точке. Богатый набор фильтров позволяет подчеркнуть высокие, низкие и
средние частоты изображения, подавить межпапиллярные линии, отделить
линии от шума, разделить на разные узоры два наложенных следа.
Самообучающиеся алгоритмы, построенные на основе теории нейронных
сетей и нечеткой логики, обеспечивают точность кодирования узоров среднего
и низкого качества на 25–40% лучше, чем другие методы. Математическая
модель узора генерируется удивительно быстро по схеме лучшего решения,
выбираемого эвристикой. Схема решения управляется качеством самого
изображения.
Благодаря уникальным алгоритмам снижается объем ручной работы
эксперта. При стандартных, традиционных методах нормальная работа – это
ввод и кодировка 150 карт на одном рабочем месте за 7 рабочих часов [9]. С
помощью АДИС можно отсканировать карту и сформировать ее электронный
образ. Производительность пользователя возрастает до 300 карт в смену!
За счет усиления математического описания узора возросла надежность
поиска. Для обеспечения высокой гибкости и скорости, поиск по запросному
дактилоскопическому образцу производится в три этапа. Поиск может
проводиться как на сервере, так и на клиентских узлах по локальной базе
данных. За счет “многоуровневости” процедуры сопоставления отпечатков
189
достигается высокая скорость поиска. При необходимости отбор по типу узора
или по интегральным признакам можно отключить.
Преимуществом АДИС является возможность эффективного поиска,
независимого от положения центра и ориентации осей отпечатка. За один
проход, используя характеристики частных признаков, производится
сравнение всех возможных ориентаций отпечатка легко и быстро. Это
особенно важно при поиске “след-карта”, когда заказчику предоставляется
возможность за смену обработать большее число частичных следов или следов
низкого качества.
Богатое пространство признаков гарантирует высокую избирательность
системы на массивах в миллионы дактилоскопических карт. Но всегда
существует проблема устойчивости поиска при кодировании лишнего или
пропуске существующего частного признака. В АДИС схема устойчивого
решения достигается за счет применения топологических связей. Гнезда
топологического описания узора значительно перекрываются, что
обеспечивает необходимую избыточность информации.
Выводы. В результате проведенного анализа хотелось бы сделать вывод
о значительном повышении эффективности дактилоскопического учета при
использовании современных АДИС в решении многих правовых задач по
идентификации личности. Вероятнее всего, судебно-экспертная деятельность в
скором времени станет полигоном для широкого внедрения компьютерных
экспертных систем, по поводу которых высказывается довольно много разных
суждений. Чаще всего речь идет не в переоценке того, что могут делать
компьютерные экспертные системы в принципе, а скорее в недооценке их
возможностей.
Список литературы: 1. Белостоцкий А., Бутырин А. Компьютерное обеспечение производства
судебной строительной экспертизы // Строительный эксперт. – 2004. – № 20 (183) – С. 20 – 21.
2. Смирнова С. Судебная экспертиза на рубеже XXI века. Состояние, развитие, проблемы. – СПб.:
Питер, 2004. – 875 с. 3. Информатика и математика для юристов: учебное пособие для вузов / Под
ред. проф. Андриашина Х.А. и проф. Казанцева С.Я. – М.: ЮНИТИ-ДАНА, Закон и право, 2002. –
483 c. 4. Автоматизированная дактилоскопическая идентификационная система "Сонда". Версия 6:
Руководство пользователя. – М.: Миасс, 2001. – 69 с. 5. Автоматизированная дактилоскопическая
идентификационная система "ДАКТО 200". Версия 4.5: Руководство пользователя. – Минск, 2004.
– 47 с. 6. Официальный сайт АДИС «Сонда» http://www.sonda.ru/rus/products.html. 7. Гирман М.Г.
Использование автоматизированных дактилоскопических идентификационных систем в
раскрытии и расследовании преступлений // Матеріали III звітної науково-практичної конференції
професорсько-викладацького та курсантського складу Кримського факультету Національного
університету внутрішніх справ, 2001. – Ч.2. – С. 59 – 64. 8. Хазиев Ш. Из истории отечественной
дактилоскопии // Бюлл. Российского отделения Международной ассоциации по идентификации. –
1996. – №2 – С. 32 – 35. 9. Никишин С. Еще раз о добровольном дактилоскопировании // Закон и
право. – 2001. – № 107. – С. 57 – 62.
Поступила в редакцию 07.04.2006
190
Содержание
Аврунин О.Г. Опыт разработки программного обеспечения для
визуализации томографических данных
3
Балабай Р.М., Черноног О.Ю. Адсорбційні зміни на поверхні стінок пор
поруватого кремнію в процесі високотемпературного старіння:
комп’ютерне моделювання
9
Гемба В.Н., Дацок О.М., Мустецов Н.П. Модель влияния физического
поля на биологический объект
13
Гора Н.Н., Вовк А.В. Вывод системы дифференциальных уравнений,
описывающей процесс обработки многокомпонентной смеси …………..
19
Гусятин В.М.,
Сидоров В.Н.
Описание
и
моделирование
m-компонентных газодинамических объектов в системах визуализации
29
Дмитриенко В.Д., Носков В.И., Хавина И.П. Алгоритмы обучения
дискретных сетей АРТ без адаптации весов связей распределенных
распознающих нейронов
35
Евстрат Д.И., Кушнерук Ю.И., Стародубцев С.А., Ткаченко Н.Д.
Оптимизация плана маршрутизации грузоперевозок и распределения
транспортных средств по маршрутам перевозок
49
Заполовский Н.И., Носков В.И., Мезенцев Н.В., Горбач Н.В. Разработка и
исследование системы управления электроприводом переменного тока с
использованием методов нечеткой логики
53
Заполовский Н.И., Червонный С.И., Грыб Р.М. Моделирование тягового
электропривода дизель-поезда с учетом сцепления колесных пар с
рельсами
61
Замковой А.С., Мустецов Т.Н. Учет лингвистических переменных при
создании систем объективной медицинской диагностики
67
Иванов В.Г.,
Ломоносов Ю.В.
Обобщение
кодирования мультимедийных данных
75
JPEG-формата
для
Калачова В.В., Пудов В.А. Аналіз методик оцінки часу розробки
складових дистанційного навчання
80
Карасюк В.В. Описание концепций предметной области на базе
онтологий для систем обучения
85
Козина О.А., Козин Д.Н., Рыжиков В.Д. Возможность применения
двухэнергетических детекторов для автоматического управления
временем
экспозиции
в
медицинских
рентгенологических
исследованиях
89
Козина О.А. Система оптимизации информационной эффективности
комплексов лабораторной диагностики
96
191
Кулак Э.Н., Каминская М.А., Скворцова О.Б. Анализ тестопригодности
цифровых схем на уровне регистровых передач
102
Курсин А.И., Ющенко А.Г. Возможность метафоризации в сетях
Хопфилда
112
Поштаренко В.М., Варлыгина А.Ю. Разработка класса для работы с
элементами полей GF(2m)
118
Рубан И.В., Смеляков К.С., Осиевский С.В. Выделение малоразмерных
изображений объектов нерегулярного вида
125
Скороделов В.В.,
Крашенинникова В.В.
Создание
виртуальных
измерительных комплексов на основе персональных компьютеров
131
Танянский С.С., Тулупов В.В., Руденко Д.А. Модификация ограничений
на ведение данных для обеспечения целостности крупномасштабных
информационных систем
137
Шапран Е.Н.
Совершенствование
микропроцессорных
систем
управления тепловозов с высоким использованием сил сцепления …….
145
Дьяков А.Г., Даниленко А.Ф. Повышение точности измерений при
исследовании продуктов с небольшим влагосодержанием
155
Филатова А.Е. Синтез решающих правил с различными пороговыми
функциями при структурной идентификации биомедицинских сигналов
160
Серая О.В. Применение процедуры кластеризации при решении задачи
коммивояжера высокой размерности с использованием генетического
алгоритма
164
Поворознюк А.И., Дашкина А.В. Исследование влияния шага
квантования пространства признаков на качество структурной
идентификации квазипериодических сигналов
170
Поворознюк А.І., Бєлан О.В. Структурна ідентифікація медичних
зображень
174
Пустовойтов П.Е., Эль Саед Абделаал Эль Саед Мохаммед
Минимаксное управление дисциплиной обслуживания в компьютерных
сетях
178
Гвозденко М.В., Іванов С.М. Комп’ютерні системи у нотаріальній та
судовій діяльності
183
Мазниченко Н.И. Анализ автоматизированных дактилоскопических
информационных систем (АДИС)
187
192
Скачать