ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2 К.А. МИЛОВА Пензенский государственный педагогический университет им. В.Г. Белинского [email protected] НЕЙРОСЕТЕВОЕ ПРОГНОЗИРОВАНИЕ АНЕМИЧЕСКОГО СИНДРОМА Аннотация Основной задачей, которая выдвигалась в данном исследовании, является прогнозирование состояние больного после хирургической операции. Одним из основных показателей, характеризующих состояние больного после операции, является факт наличия или отсутствия анемического синдрома (малокровия) у больного. Основным признаком наличия анемии у больного, как известно, является низкий уровень гемоглобина, поэтому мы прогнозируем именно уровень гемоглобина у хирургических больных. Задача прогнозирования анемии является на сегодня весьма актуальной, поскольку не существует однозначной системы оценки возможного состояния больного после операции. Прогнозирование риска осложнений в послеоперационном периоде в настоящее время является актуальной задачей, поскольку ее решение, вопервых, позволит снизить длительность пребывания в стационарных и реанимационных условиях, что особенно важно в условиях страховой медицины в связи с высокими затратами на оказание этого вида медицинской помощи; во-вторых, способствует снижению риска тяжелых осложнений, приводящих к инвалидности пациентов, и летальных исходов, возникающих в результате хирургических вмешательств; в-третьих, позволит рационально (т.е. с учетом индивидуальных особенностей и показаний) назначать антибиотиковую терапию. Кроме того, прогнозирование риска осложнений позволяет планировать нагрузку на реанимационное отделение в клинике с высокой хирургической активностью, оптимизируя тем самым его деятельность. В экономически развитых странах доля затрат на оказание этого вида медицинской помощи в сравнении с другими заметно выше (например, в США две трети умерших регистрируется в отделениях реанимации). Возможность прогнозирования риска представляет интерес и для экспертов медицинских страховых компаний, нуждающихся в объективных оценках качества выполненных хирургических операций в целом и выУДК 004.032.26(06) Нейронные сети 67 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2 полнения предоперационных мероприятий в каждом конкретном случае. В более широком смысле знание закономерностей позволяет изучить причины возникновения риска послеоперационных осложнений и разработать меры, направленные на его снижение [1]. Основной задачей, которая выдвигалась в данном проекте, является прогнозирование состояние больного после хирургической операции. Одним из основных показателей, характеризующих состояние больного после операции является факт наличия или отсутствия анемического синдрома (малокровия) у больного. Основным признаком наличия анемии у больного, как известно, является низкий уровень гемоглобина, поэтому мы прогнозируем именно уровень гемоглобина у хирургических больных. Задача прогнозирования анемии является на сегодня весьма актуальной, поскольку не существует однозначной системы оценки возможного состояния больного после операции и врач принимает решение основываясь преимущественно на личном опыте и интуиции [2]. Анемический синдром в послеоперационном периоде может привести к осложнениям, ухудшить заживление оперированных органов и, как следствие, увеличить срок пребывания больного в стационаре. Для нейросетевого анализа в Пензенской областной клинической больнице им. Н.Н. Бурденко были отобраны 84 истории болезни пациентов, которым проводились операции на легких. Затем истории болезней были переведены в электронный вид для последующей работы с ними. В нашей работе мы рассматривали данные пациентов, которым проводилась только одна операция, для того, чтобы четко выделить до- и послеоперационный периоды. На первом этапе для входа нейронной сети эмпирически были отобраны следующие переменные: гемоглобин, количество эритроцитов, цветовой показатель, скорость оседания эритроцитов, длительность операции, возраст, пол, сложность операции, количество перелитых компонентов в литрах, наличие анемии как осложнения. Однако, в дальнейшем пришлось отказаться от использования переменной пол, поскольку для анализа использовались в основном данные пациентов-мужчин. Был выбран ряд показателей, необходимых для решения поставленной задачи. А именно: для обозначения влияния оперативного вмешательства была введена переменная длительность операции, для собственно прогнозирования анемического синдрома были введены несколько переменных – показателей клинического анализа крови: гемоглобин (НВ), количество эритроцитов, цветовой показатель (ЦП), лейкоциты (Л) и скорость оседа- УДК 004.032.26(06) Нейронные сети 68 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2 ния эритроцитов (СОЭ). Кроме того, были введены также переменные возраст и пол. После выбора переменных для входа нейронной сети из данных историй болезни были сформированы обучающая и тестирующая выборки. Далее, данные, вошедшие в выборки, были подвергнуты предпроцессорной обработке. Для каждой переменной были вычислены исходные статистические величины, а именно среднее значение, минимальное и максимальное значения. Данные статистические величины представлены в табл. 1. Таблица 1 Исходные статистические величины переменных HB среднее min max Среднеквадратическое отклонение 111,49 57,90 175,80 19,80 ЦП 0,88 0,79 0,98 0,03 Л 10,69 3,00 31,20 4,58 Длительность операции 142,19 30,00 370,00 91,43 Возраст 48,06 35,00 67,00 8,90 Далее из выборок были удалены выбросы – нетипичные значения, которые слишком далеки от среднего значения. Для выборок была применена гипотеза о нормальном распределении. Согласно этой гипотезе, 95 % данных будут располагаться вокруг среднего значения на расстоянии двух среднеквадратических отклонений. Те значения, которые отклоняются более чем на три среднеквадратических отклонения, удалялись из выборки. Пары элементов с большим значением коэффициента парной корреляции (около 1) являются зависимыми и затем одна из переменных в каждой паре должна быть удалена из входных данных. Рассчитанные коэффициенты парной корреляции приведены в табл. 2. Из табл. 2 видно, что переменные уровень гемоглобина и количество эритроцитов сильно коррелированны. Исходя из этого было принято решение удалить переменную количество эритроцитов в связи с тем, что традиционно для медицинских работников большее значение имеет гемоглобин. УДК 004.032.26(06) Нейронные сети 69 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2 Таблица 2 Коэффициенты парной корреляции Время операции Возраст Время операции 1 Возраст HB Э ЦП Л СОЭ 0,17 1 HB Э -0,17 -0,16 0,07 0,08 1 0,94 1 ЦП Л -0,05 0,15 0,05 -0,13 0,53 -0,18 0,38 -0,17 1 -0,05 1 СОЭ 0,02 -0,18 -0,43 -0,34 -0,32 0,36 1 Все входные данные были приведены к диапазону [-1; 1]. Выбор именно этого диапазона обусловлен тем, что в качестве функции активации использовался гиперболический тангенс, диапазоном чувствительности которого является отрезок [-1; 1]. Приведение выполняется по формуле: pn 2( p pmin ) 1. pmax pmin Восстановление данных, масштабированных к диапазону [-1; 1], выполняется по формуле p 0,5( pn 1)( pmax pmin ) pmin . Для решения поставленной задачи был использован многослойный персептрон. Такую сеть можно легко интерпретировать как модель входвыход, в которой свободными параметрами являются веса и пороговые значения (смещения). Сеть подобной структуры может моделировать функцию практически любой степени сложности, причем число слоев и число элементов в каждом слое определяют сложность функции. Определение числа промежуточных слоев и числа элементов в них является важным вопросом при конструировании многослойного перcептрона. Количество входных и выходных элементов определялось условиями задачи и равняется количеству входных и выходных переменных соответственно. В качестве функция активации использовалась гиперболическая тангенциальная функция. Данная функция и ее производная определяются следующими соотношениями: УДК 004.032.26(06) Нейронные сети 70 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2 tan sig (n) 2 1 ; 1 e 2 n d tan sig (n) 1 tan sig 2 (n) . С помощью экспериментов в пакете Matlab подбиралась оптимальная сеть для прогнозирования. Эксперименты проводились на многослойной сети. Сеть учились прогнозировать средний гемоглобин в послеоперационном периоде по 6 показателям. В результате проведенных экспериментов были выбрана оптимальная для прогнозирования архитектура сети. На первом этапе для поиска наиболее удачной архитектуры сети использовался «быстрый» алгоритм Левенберга-Марквардта. Затем на выбранной архитектуре проводились эксперименты с использованием алгоритма обратного распространения ошибки. Испытания проводились на трехслойной сети (входной, скрытый и выходной). Количество нейронов входного и выходного слоев определялось количеством входных и выходных переменных, и равняется соответственно шести и одному. В ходе экспериментов подбиралось количество нейронов в скрытом слое. Эксперименты были начаты с архитектуры 6-4-1, т.е. шесть нейронов во входном слое, четыре нейрона в скрытом слое и один нейрон в выходном слое. Выбор именно такого количества нейронов в скрытом слое связан с гипотезой о том, что количество нейронов в скрытом слое равно полусумме числа входных и выходных элементов [3]. Для каждого варианта архитектуры рассчитывалась ошибка в процентах. Для каждого варианта архитектуры сети проводилось по 3 эксперимента. Это связано с тем, что при инициализации сети веса и смещения устанавливаются случайным образом, и это может влиять на конечный результат. Ввиду того, что архитектура 6-4-1 оказалась неудачной, стала использоваться другая гипотеза [4] о количестве нейронов в скрытом слое. Согласно гипотезе, количество нейронов в скрытом слое определяется формулой K = 2n + 1, где K – количество нейронов, n – количество входов. Оказалось, что лучшие результаты достигаются на трехслойной нейронной сети с девятнадцатью нейронами в скрытом слое (средняя ошибка равна 13,3 %, а минимальная ошибка равна 6,7 %) и с восемнадцатью нейронами в скрытом слое (средняя ошибка равна 20 %, а минимальная ошибка равна 6,7 %). Во избежание эффекта переобучения нейронной сети мы использовали также алгоритм обучения с использованием тестового множества. УДК 004.032.26(06) Нейронные сети 71 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2 При обучении нейронной сети с использованием тестового множества выяснилось, что наименьшие ошибки дают сеть с пятнадцатью нейронами в скрытом слое (средняя ошибка 17,8 %, минимальная ошибка 6,7 %) и сеть с девятнадцатью нейронами в скрытом слое (средняя ошибка 15,6 %, минимальная ошибка 6,7 %). Очевидно, что по итогам всех экспериментов наименьшую ошибку при прогнозировании среднего уровня гемоглобина в послеоперационном периоде дает сеть с архитектурой 6-19-1, т.е. шесть нейронов во входном слое, девятнадцать в скрытом слое и один в выходном. Список литературы 1. Щетинин В.Г. Применение компьютерных «нейронных сетей» в клинической лабораторной диагностике / В.Г. Щетинин, А.А. Соломаха // Клиническая лабораторная диагностика. 1998. №10. С. 21 – 33. 2. Шевченко Ю.Л., Хубулава Г.Г., Кривцов В.А. и др. Диагностика и лечение ранних кровотечений после операций на открытом сердце // Хирургия. 1999. №8, с.28-36. 3. Нейронные сети.STATISTICA Neural Networks: Пер. с англ. – М.: Горячая линия – Телеком. 2001. – 182 с. – ил. 4. Медведев В. С. Нейронные сети Matlab 6 / В.С. Медведев, В.Г. Потёмкин. – М.: ДИАЛОГ-МИФИ, 2002. – 496 с. УДК 004.032.26(06) Нейронные сети 72