ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 3 В.В. КОСТЕРЕВ, О.А. МИШУЛИНА, А.Г. ТРОФИМОВ Московский инженерно-физический институт (государственный университет) [email protected] НЕЙРОСЕТЕВАЯ МОДЕЛЬ РАДИОБИОЛОГИЧЕСКОГО ДЕЙСТВИЯ ИОНИЗИРУЮЩИХ ИЗЛУЧЕНИЙ В УСЛОВИЯХ ГИПЕРТЕРМИИ1 Аннотация Предложена динамическая нейросетевая модель выживаемости клеток в условиях гипертермии, основанная на представлении сечений функции многих переменных рекуррентной нейросетевой структурой с настраиваемыми параметрами. Обсуждается возможность применения модели для функции выживаемости клеток при совместном действии ионизирующего излучения и гипертермии. Описывается двухэтапная схема обучения нейросетевой структуры и приводится пример моделирования в среде MATLAB, построенный на имеющихся экспериментальных данных. Введение В радиационной онкологии известно, что при небольшом размере опухолевого очага подведённая к опухоли доза ионизирующего излучения приводит к поражению некоторой доли опухолевых клеток [1]. Кривые «доза-эффект» позволяют рассчитать необходимую дозу облучения для достижения требуемой доли поражённых клеток различного происхождения. Однако при лучевой терапии в зоне облучения неизбежно оказываются не только опухоль, но и окружающие её здоровые ткани. Попытки повысить результативность лучевых методов лечения простым увеличением подводимых доз наталкиваются на резкое возрастание частоты и тяжести лучевых осложнений со стороны нормальных тканей. Возможным практическим методом повышения эффективности лучевой терапии является использование радиомодификаторов, изменяющих радиочувствительность опухолевых клеток [1]. Одним из таких радиомодификаторов является температура. Известно, что кратковременный, в пределах одного часа, локальный нагрев отдельных участков тела (локальная гипертермия) до температуры 40 – 43,5 C оказывает радиомодифицирующее действие при ионизирующем облучении [1, 2]. Такой нагрев сам по себе приводит к гибели некоторой части 1 Работа выполнена при частичной финансовой поддержке РФФИ (проект № 05-08-01421). УДК 004.032.26(06) Нейронные сети 188 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 3 клеток, которая увеличивается в условиях пониженного pH, характерного для гипоксических зон злокачественных новообразований. Обычно гипертермию используют в сочетании с лучевой терапией или химиотерапией. В этом случае повышение эффективности лечения онкологических больных определяется как аддитивным действием гипертермии и ионизирующей радиации, так и их синергизмом. Математическое описание зависимости доли поражённых клеток от дозы облучения как в присутствие, так и в отсутствие радиомодифицирующих факторов предлагается различными теориями, основой которых являются принципы «мишени» и «попаданий» [1]. В работе предлагается построить динамическую нейросетевую модель для доли поражённых клеток, основанную на рекуррентной нейронной сети. Особенность предложенной модели состоит в настройке матрицы синаптических коэффициентов сети на заданные условия облучения опухолевых клеток. Такая модель позволяет воспроизвести функцию доли поражённых клеток в сечении по одному из своих аргументов при произвольных заданных других. Архитектура нейросетевой модели и метод её обучения приводятся в настоящей работе для частного случая выживаемости клеток в условии одного радиомодифицирующего фактора – гипертермии. Модель должна воспроизводить функциональную зависимость доли поражённых клеток после воздействия ионизирующего излучения при условии гипертермии продолжительности t при температуре T, проведённой с временным смещением t относительно сеанса ионизирующего облучения. Данная модель может быть использована для прогноза доли поражённых клеток при различных дозах облучения в условиях проведения гипертермии. 1. Постановка задачи Поставим задачу определения доли поражённых клеток во время сеанса гипертермии на основе имеющихся экспериментальных данных. При этом сеанс гипертермии может быть произвольно сдвинут во времени относительно ионизирующего облучения. Пусть клетки получили дозу ионизирующего излучения D, и сеанс гипертермии длится в течение времени t при температуре T. Обозначим через z(D, t, T, t) долю поражённых в результате совместного действия гипертермии и облучения клеток, где t – время между сеансом гипертермии и облучением. Допустим, что в результате эксперимента при некоторых условиях были получены данные о доле поражённых клеток {z(Dp, tp, Tp, tp), p 1, P }, где P – число УДК 004.032.26(06) Нейронные сети 189 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 3 экспериментов, которые могут быть использованы для построения модели. Согласно известным радиобиологическим моделям доля поражённых клеток в отсутствие радиомодификаторов может быть представлена решением некоторой системы дифференциальных уравнений, где независимой переменной является доза облучения D [1]. В связи с тем, что при t = 0 функция z(D, 0, T, t) не зависит от параметров T и t, доля поражённых клеток в отсутствие гипертермии будет являться функцией z(D) только дозы облучения D. Аналогично, действие гипертермии при температуре T в отсутствие ионизирующего излучения будет представлено зависимостью z(t, T) = z(0, t, T, 0). Будем также считать, что сечения функции z(t, T) при фиксированной температуре T являются решениями некоторых дифференциальных уравнений, где независимой переменной является длительность сеанса гипертермии t. Визуальный анализ экспериментальных данных (рис. 1) показывает, что качественные характеристики зависимости z(t, T) от переменной t принципиально отличаются друг от друга при различных температурах T. При этом начальные значения z(0, T) 0, TT, где T – рабочий диапазон изменения температур. Для моделирования динамики z(t, T) при некоторой фиксированной температуре T будем использовать нейросетевую структуру, ядром которой является рекуррентная нейронная сеть (RNN), функционирующая в дискретном времени. Параметры этой структуры (назовём её Controlled RNN – CRNN) предполагаются зависящими от T. Структурная схема сети CRNN представлена на рис. 2. Рекуррентная нейросеть (блок 1 на рис. 2) содержит N нейронов и описывается системой N разностных уравнений, зависящих от матрицы синаптических коэффициентов W и вектора смещений b. Нейросетевая аппроксимация функции z(t, T), обозначенная на рис. 2 как y(t, T), наблюдается на выходном нейроне ON с вектором синаптических коэффициентов U и смещением c (блок 2) и моделируется как суперпозиция выходов s(t, T) рекуррентной сети RNN. Настройкой расширенных матрицы W (b | W ) и вектора U (c | U ) можно управлять формой функциональной зависимости выходных переменных y(t, T), реализуемой нейросетевой структурой. УДК 004.032.26(06) Нейронные сети 190 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 3 Рис. 1. Доля поражённых клеток китайского хомячка линии CHO при разной длительности нагревания в различных температурных режимах [2] Динамика сети CRNN описывается системой уравнений: y (t , T ) ( g (t , T )), t 0, tmax , g (t , T ) U (T ) s (t , T ) c(T ), s (t 1, T ) f (h(t , T )), h(t , T ) W (T ) s (t , T ) b(T ), s (0, T ) 0, где h(t, T) – вектор потенциалов рекуррентных нейронов, s(t, T) – вектор состояний рекуррентных нейронов, g(t, T) – потенциал выходного нейрона, y(t, T) – выход сети. В качестве функции активации рекуррентных нейронов f(h) выбрана сигмоида, принимающая возможные значения в интервале (–1; 1), функция активации (g) выходного нейрона является линейной. Параметры W и U сети RNN и выходного нейрона ON соответственно вычисляются с помощью многослойной нейронной сети MNN (блок 3 на рис. 2), на вход которой подаётся температура T. Обратим внимание на то, что время функционирования сети RNN интерпретируется как продолжительность t сеанса гипертермии. s(t,T) RNN УДК 004.032.26(06) Нейронные сети 1 W(T), b(T) MNN ON y(t,T) 191 2 U(T), c(T) ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 3 Рис. 2. Схема нейросетевой модели 2. Обучение нейросетевой структуры Обучение нейросетевой структуры, приведённой на рис. 2, осуществляется в два этапа. На первом этапе проводится многократное обучение рекуррентной сети RNN и выходного нейрона ON на экспериментальных данных {z(tj, Tk), j 1, nk }, соответствующих фиксированным температурам Tk, k 1, K . Обучение сети CRNN проводится в соответствии с критерием 1 nk I (Tk ) ( y (t j , Tk ) z (t j , Tk )) 2 , 2 j 1 где z(tj, Tk) – экспериментальное значение доли поражённых клеток при продолжительности сеанса гипертермии tj и температуре Tk. В процессе обучения настройке подвергаются элементы матриц синаптических коэффициентов W и U . Для настройки могут быть использованы различные модификации градиентных поисковых процедур, в частности, при использовании простого градиентного метода настройка осуществляется в соответствии со следующими рекуррентными уравнениями: W (Tk , 1) W (Tk , ) I (Tk , ) I (Tk , ) , U (Tk , 1) U (Tk , ) , W U где – параметр скорости обучения, I(Tk, ) – значение критерия I(Tk) на -м такте обучения. Вычисление производных в уравнении обучения осуществляется с помощью модифицированного метода обратного распространения ошибки во времени (BPTT) [3,4] в соответствии с формулами: УДК 004.032.26(06) Нейронные сети 192 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 3 N ti e(t , Tk )ui '( g (t , Tk )) tk1wki f '(hi (t , Tk )), t 1, t max , i 1, N , k 1 tmax 1 i 0, tmax I ti s j (t , Tk ), i 1, N , j 0, N , w t 1 ij tmax I e(t , T ) s (t , T ) '( g (t , T )), j 0, N , k j k k u j t 1 где e(t , Tk ) y (t j , Tk ) z (t j , Tk ) ошибка сети, s0 (t , Tk ) 1 , ti – переменная, двойственная к потенциалу i-ого рекуррентного нейрона на такте t функционирования сети, hi(t, Tk) – потенциалы рекуррентных нейронов, g(t, Tk) – потенциал выходного нейрона. В результате первого этапа обучения получим K матриц параметров сети CRNN, которые будут использованы на втором этапе обучения. Пусть в результате первого обучения сети CRNN при температуре T1 (T1 < T2 < … <TK) из некоторой начальной точки (W0 ,U 0 ) получены матрицы синаптических коэффициентов (W * (T1 ),U * (T1 )) , минимизирующие критерий I(T1). Считая, что малым изменениям температуры T соответствуют малые изменения параметров сети CRNN, вновь начинаем её обучение на данных, соответствующих температуре T2, стартуя из начальной точки (W * (T1 ),U * (T1 )) . Аналогичным образом проводим обучение при температурах Tk, каждый раз стартуя из начальных точек, определяемых рекуррентными соотношениями: W0 (Tk ) W * (Tk 1 ), k 2, K , U 0 (Tk ) U * (Tk 1 ), k 2, K , W0 (T1 ) W0 , U 0 (T1 ) U 0 . Таким образом, в результате многократного обучения сети CRNN получаем K наборов матриц (W * (Tk ),U * (Tk )), k 1, K . На втором этапе обучения используем полученные наборы матриц синаптических коэффициентов сети CRNN в качестве желаемых выходов многослойной сети MNN. Входом сети MNN является значение температуры гипертермии T. Обучение сети MNN осуществляется в соответствии с критерием УДК 004.032.26(06) Нейронные сети 193 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 3 J 1 K MW * 1 K MU ( wm (Tk ) wm (Tk ))2 (um* (Tk ) um (Tk )) 2 , 2 k 1 m 1 2 k 1 m 1 где wm* (Tk ) и um* (Tk ) – линейно упорядоченные элементы матриц W * (Tk ) и U * (Tk ) соответственно, wm (Tk ) и um (Tk ) – выходы многослойной сети, MW и MU – число элементов матриц W * (Tk ) и U * (Tk ) . Обучение сети MNN осуществлялось с помощью метода обратного распространения ошибки (BP, [3]). 3. Результаты моделирования Рассмотрим в качестве примера построение нейросетевой модели на данных выживаемости клеток китайского хомячка линии CHO [2] при гипертермии в отсутствие ионизирующего облучения (рис. 1). Для данного типа клеток повышение температуры на 1–3 C по сравнению с нормальной не сказывается на их жизнеспособности даже при длительной инкубации. Гибель клеток начинается после их часового пребывания при 41,5 C [1,2]. В интервале T = [41,5; 45,5] C гибель клеток значительно увеличивается при каждом повышении температуры на 0,5 C, причём чем выше температура, тем более выражен эффект гипертермии. Для моделирования динамики доли поражённых клеток была использована сеть CRNN с N = 4 рекуррентными нейронами. Результаты функционирования обученной сети на некоторых экспериментальных кривых показаны на рис. 3. На рис. 4 показана абсолютная ошибка моделирования на примере кривой выживаемости при T = 42,5 C. Как видно из графика, величина относительной ошибки не превышает 7 %. По результатам обучения сети CRNN на девяти температурных режимах (K = 9) была сформирована обучающая выборка для сети MNN с архитектурой 1-5-5-25, на вход которой подавались масштабированные значения температуры TT. На рис. 5 показана динамика доли поражённых клеток z(t, T) в зависимости от продолжительности сеанса гипертермии при температуре T = 42,7 C, не вошедшей в обучающую выборку. Для обучения предложенной нейросетевой структуры и проведения исследований в среде MATLAB была применена программная система NFONTO [5], предоставляющая широкие возможности для анализа и визуализации исходных данных, моделирования нейросетевых структур и анализа точности их работы. УДК 004.032.26(06) Нейронные сети 194 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 3 Рис. 3. Результаты функционирования обученной сети CRNN. По вертикальной оси отложены доли повреждённых клеток при температурах 42.0 и 44.0 C. Сплошной линией показаны результаты моделирования, пунктирной – экспериментальные данные Рис. 4. График зависимости абсолютной ошибки моделирования сети CRNN от продолжительности сеанса гипертермии при T = 42.5 C Рис. 5. Результаты функционирования сети CRNN с параметрами, соответствующими температурам гипертермии T = 42.5 C, 42.7 C, 43.0 C Заключение Анализ результатов нейросетевого моделирования функции z(t, T) с использованием предложенной в работе нейросетевой структуры показывает, что построенная модель позволяет с удовлетворительной точностью прогнозировать долю поражённых клеток при произвольных значениях температуры и длительности гипертермии. Полученный результат позвоУДК 004.032.26(06) Нейронные сети 195 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 3 ляет сделать вывод, что предлагаемая нейросетевая структура перспективна для построения модели в условиях совместного действия ионизирующего излучения и гипертермии. Список литературы 1. Ярмоненко С. П., Вайнсон А. А. Радиобиология человека и животных: Учеб. пособие. – М.: Высшая школа, 2004. 2. Eric J. Hall. Radiobiology for the Radiologist. Lippincott Williams & Wilkins. Philadelphia, 2000. 3. Осовский С. Нейронные сети для обработки информации. – М.: Финансы и статистика, 2002. 4. Mishulina O. A., Kharitonov V. S. et al. Two neural network models for nuclear engineering applications. Optical Memory&Neural Networks, 4, 2005. 5. Мишулина О.А., Трофимов А.Г., Ускова А.А., Харитонов В.С., Шумский Б.Е., Щербинина М.В. Пакет прикладных программ N-FONTO для построения нейросетевых моделей в ядерной энергетике // Сб. науч. трудов «Нейроинформатика-2005», Ч.2, С.182-190. УДК 004.032.26(06) Нейронные сети 196