МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ РАДИОТЕХНИКИ, ЭЛЕКТРОНИКИ И АВТОМАТИКИ (ТУ) Факультет: Кибернетики Кафедра: Биомедицинская Электроника КУРСОВАЯ РАБОТА “Моделирование развития карциномы Герена” Дисциплина: “Моделирование в медицине” Работу выполнил студент группы КМ-1-хх: ФИО _______________________ Проверила преподаватель: Бабушкина Нина Александровна ______________________ МОСКВА 200х 2 Содержание Титульный лист…………………………………………………………….…………1 Содержание………………………………………………………………….…….......2 Введение…………………………………………………………………….…………3 1. Описание опухоли…………………………………………………………….…….3 2. Аппроксимация исходных данных………………………………………….……..3 2.1. Выбор функции…………………………………………………………....3 2.2. Аппроксимация в MathCAD………………………………………….…..3 2.3. Выбор оптимальной функции…………………………………………....4 2.4. Метод наименьших квадратов……………………………………………5 2.5. Расчёт коэффициентов с помощью МНК…………………………….....7 2.6. Итерационный метод наискорейшего спуска…………………………...7 2.7. Программа расчёта коэффициентов методом наискорейшего спуска…8 2.8. Расчёт коэффициентов методом наискорейшего спуска…………..……9 2.9. Результаты……………………………………………………………..….10 3. Расчёт биологических параметров………………………………………………...11 3.1. Время жизни организма без лечения и запас жизненных сил…….…...11 3.2. Дозовая зависимость…………………………………………………..….11 3.3. Расчёт времени жизни организма после курса лечения……………......12 Заключение…………………………………………………………………………….16 Список литературы………………………………………………………………..…..17 3 ВВЕДЕНИЕ Задание: смоделировать развитие карциномы Герена после перевивки различных объёмов 50%-ной взвеси опухолевых клеток. Рассчитать время жизни при введении химиотерапии в дозе D = 0.5 МПД. Количество введений – 8 раз с интервалом t 5 суток Исходные данные: N(t) – объём опухоли, t – дни измерения размера опухоли. t, суток 11 13 14 15 16 17 18 20 21 22 23 24 N(t), у.е. 0,2 0,7 1 1,5 2 3 4,5 6 7,5 9,5 12 15 1. Описание опухоли Герена карцинома (M.E. Guérin, р. 1897 Г., франц. онколог; син. опухоль T-8) — штамм перевиваемого малодифференцированного рака крыс, полученный из спонтанной аденокарциномы матки крыс.[4] 2. Аппроксимация исходных данных 2.1. Выбор функции Визуальный анализ кинетики роста опухоли позволяет предположить, что экспериментальные данные можно аппроксимировать экспоненциальной или степенной функцией. t Экспоненциальная функция: N ( t ) N 0e Степенная функция: N( t ) t (2.1) (2.2) 2.2. Аппроксимация в MathCAD Подбор коэффициентов производился в пакете Mathcad 11 Pro с помощью функции minimize(), реализующая минимизацию суммы квадратов отклонений (СКО) численным итерационным методом градиентного спуска. Экспоненциальная: N 0 0.052 0.237 N ( t ) 0.052e (2.3) 0.237 t Степенная функция: 3.610 6 4.788 N( t ) 3.610 6 t .4.788 (2.4) 4 Рис. 2.1. Аппроксимация исходных данных экспоненциальной и степенной функциями 2.3. Выбор оптимальной функции Чтобы выбрать функцию, наиболее точно аппроксимирующую исходные данные, необходимо просчитать сумму квадратов отклонений (СКО) между эспериментальными точками и расчётными значениями, аппроксимированными аналитической функцией для каждой точки ti момента измерения роста опухоли. n СКО [ N( t i ) N( t i ,,)]2 (2.5) i 1 Экспонциальная функция: n СКО1 [ N( t i ) N 0 e t i )] 2 i 1 (2.6) СКО1 1.532 N 0 0.052 при 0.237 Степенная функция: n СКО2 [ N( t i ) t i )]2 i 1 СКО2 0.918 при 3.6106 4.788 (2.7) 5 Т.к. СКО2 < СКО1, степенная функция лучше аппроксимирует исходные данные. Итак, функция N( t ) 3.610 6 t .4.788 обеспечивает наилучшую аппроксимацию исходных данных. 2.4. Метод наименьших квадратов Рассмотрим задачу оценки коэффициентов парной линейной регрессии. Предположим, что связь между х и у линейна: у = +х. Здесь имеется в виду связь между всеми возможными значениями величин х и у, то есть для генеральной совокупности. Наличие случайных отклонений, вызванных воздействием на переменную у множества других, неучтенных в нашем уравнении факторов и ошибок измерения, приведет к тому, что связь наблюдаемых величин x i и yi приобретет вид уi=+хi+єi,. Здесь єi. - случайные ошибки (отклонения, возмущения). Задача состоит в следующем: по имеющимся данным наблюдений {xi}, {уi} оценить значения n 2 параметров и , обеспечивающие минимум величины СКО [ y i y] . Если бы i 1 были известны точные значения отклонений єi, то можно было бы (в случае правильности предполагаемой линейной формулы) рассчитать значения параметров и . Однако значения случайных отклонений в выборке неизвестны, и по наблюдениям xi и уi можно получить оценки параметров a и b, которые сами являются случайными величинами, поскольку соответствуют случайной выборке. Пусть а - оценка параметра , b - оценка параметра . Тогда оцененное уравнение регрессии будет иметь вид: yi=а+bxi+еi, (2.8) где еi - наблюдаемые значения ошибок єi. Для оценки параметров и воспользуемся МНК, который минимизирует СКО фактических значений уi от расчетных. Минимум ищется по переменным а и b. Для того, чтобы полученные МНК оценки а и b обладали желательными свойствами, сделаем следующие предпосылки об отклонениях єi: 1. 2. 3. 4. величина єi является случайной переменной; математическое ожидание єi равно нулю: М (єi) = 0; дисперсия є постоянна: D(єi) = D(єi) = 2 для всех i, j; значения єi независимы между собой. Откуда вытекает, в частности, что 0 при i j , cov( i j ) 2 при i j . (2.9) Известно, что, если условия (1 - 4) выполняются, то оценки, сделанные с помощью МНК, обладают следующими свойствами: 1. Оценки являются несмещенными, т.е. математическое ожидание оценки каждого параметра равно его истинному значению: М(а) =; М(b)=. Это вытекает из того, что М(єi) = 0, и говорит об отсутствии систематической ошибки в определении положения линии регрессии. 6 2. Оценки состоятельны, так как дисперсия оценок параметров при возрастании числа наблюдений стремится к нулю: lim D( a ) 0 ; n lim D( b ) 0 . Иначе говоря, если п достаточно велико, то практически n наверняка а близко к , а b близко к : надежность оценки при увеличении выборки растет. 3. Оценки эффективны, они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра, линейными относительно величин уi . [1] Перечисленные свойства не зависят от конкретного вида распределения величин єi, тем не менее обычно предполагается, что они распределены нормально N(0;y2). Эта предпосылка необходима для проверки статистической значимости сделанных оценок и определения для них доверительных интервалов. При ее выполнении оценки МНК имеют наименьшую дисперсию не только среди линейных, но среди всех несмещенных оценок. Если предположения (3 - 4) нарушены, то есть дисперсия возмущений непостоянна и/или значения є. связаны друг с другом, то свойства несмещенности и состоятельности сохраняются, но свойство эффективности - нет. Рассмотрим теперь процедуру оценивания параметров парной линейной регрессии а и b. Для того, чтобы функция СКО (2.5) достигала минимума, необходимо равенство нулю ее частных производных: n СКО 2 ( y i a bx i ) 0 a i 1 СКО n 2( y i a bx i ) x i 0 b i 1 n n y na b x i 0 i i 1 i 1 n n n y i x i a x i bx i 2 0 i 1 i 1 i 1 (2.10) (2.11) Откуда n y i x i x i y i b n x i2 (x i ) 2 2 a y bx y i x i x i x i y i n x i2 (x i ) 2 (2.12) 2.5 Расчёт коэффициентов МНК Степенную функцию, нелинейную по параметрам, нужно привести к линейному виду: N( t ) t Логарифмируем: ln( N( t )) ln( ) ln( t ) Линеаризуем исходные данные: (2.15) 7 11 ti 13 14 15 16 17 2,398 2,565 2,639 2,708 2,773 2,833 ln(ti) Ni 0,2 0,7 1 yi -1,61 -0,36 0 1,5 2 3 18 2,89 4,5 20 21 22 23 24 2,996 3,045 3,091 3,135 3,178 6 7,5 9,5 12 15 0,405 0,693 1,099 1,504 1,792 2,015 2,251 2,485 2,708 n СКО [ N i t i )] 2 i 1 y i ln( N i ) 12 ( y i ln ln( t i )) СКО 2 0 i 1 СКО 12 2( y i ln ln( t i )) ln( t i ) 0 i 1 12 12 y 12 ln ln( t i ) i i 1 i 1 12 12 12 y i ln( t i ) ln ln( t i ) (ln( t i )) 2 i 1 i 1 i 1 (2.13) (2.14) Из 2.13 и 2.14 находим : 12 12 12 12 ln( t ) y ln( t ) yi i i i i 1 i 1 i 1 12 12 12(ln( t i )) 2 (ln( t i )) 2 i 1 i 1 12 12 ln( t i ) y i i 1 exp( i 1 ) 12 n 12 число экспериментальных точек ln( t ) 34.25 (ln( t )) 98.4 y 12.99 ln( t ) y 40.56 i 2 i i i i 1240.56 34.2512.99 38.144 4.78 1298.4 34.25 2 7.98 12.99 4.7834.25 ) exp( 12.56) 3.5910 6 exp( 12 Следовательно, аппроксимирующая функция будет иметь вид: N( t ) 3.5910 6 t .4.78 2.6. Итерационный метод наискорейшего спуска. Рассмотрим метод наискорейшего спуска с шагом, длина которого зависит от свойств минимизируемой функции, или метод Ньютона. Он основан на квадратической аппроксимации минимизируемой функции в окрестности точки x (k), где (k) – номер итерации Минимум квадратической функции легко найти, приравнивая ее градиент 8 нулю. Можно сразу же вычислить положение экстремума и выбрать его в качестве следующего приближения к точке минимума. Новая итерация вычисляется по формуле: x ( k 1) x ( k ) x ( k ) (2.16) Пусть f(x) - минимизируемая фукнция с векторным аргументом a [ x 1 ,x 2 ,...,x n ]T . Алгоритм наискорейшего спуска реализует итерационную процедуру движения к минимуму из произвольно выбранной точки начального приближения в направлении наиболее сильного уменьшения функции, определенном в окрестности текущего значения аргумента минимизируемой функции. Такое направление противоположно направлению, задаваемому вектором градиента f ( x ) минимизируемой функции f(x): f ( x ) [ f f f T , ,..., ] x 1 x 2 x n (2.17) Вычисляя точку нового приближения по формуле (2.16) и разлагая f(x(k+1)) в ряд Тейлора, получим формулу квадратической аппроксимации fкв(x(k+1)): f ( x ( k 1) ) f ( x ( k ) x ( k ) ) f кв ( x ( k 1) ) , где 1 f кв ( x ( k 1) ) f ( x ( k ) )[f ( x ( k ) )] T x ( k ) [x ( k ) ] T 2 f ( x ( k ) )x ( k ) 2! (2.18) 2 f ( x ( k ) ) - матрица вторых производных: 2f 2f x 12 x 1x 2 2f 2f 2 f ( x ( k ) ) x x x 22 2 1 2 f 2f x n x 1 x n x 2 2f x 1x n 2f x 2 x n 2f x 2n (2.19) Условие минимума fкв(x(k+1)) по x ( k ) : f кв ( x ( k 1) ) 0 . Вычислим градиент f кв ( x ( k 1) ) из (2.18): f кв ( x ( k 1) ) f кв ( x ( k ) ) 2 f кв ( x ( k ) )x ( k ) 0 (2.20) Для учета фактических особенностей минимизируемой функции будем использовать в (2.20) значения градиента и матрицы вторых производных, вычисленных не по аппроксимирующей fкв(x), а непосредственно по минимизируемой функции f(x). Заменяя fкв(x) в (2.20), найдем длину шага x ( k ) : x ( k ) [ 2 f ( x ( k ) )] 1 f ( x ( k ) ) (2.21) Итак, последовательность вычислений для реализации алгоритма метода Ньютона: 1. Произвольно задать точку начального приближения x(0) 2. В цикле по номеру итерации k=0,1… вычислить: a. Значение вектора градиента f ( x ( k ) ) по формуле (2.17) b. Значение матрицы вторых производных 2 f ( x ( k ) ) по формуле (2.19) 9 c. Значение матрицы, обратной матрице вторых производных d. Значение шага x ( k ) по формуле (2.21) e. Новое значение приближения x(0) по формуле (2.16) 3. Закончить итерационный процесс при достижении нужного приближения.[2] 2.7. Программа расчёта коэффициентов методом наискорейшего спуска За минимизируемую функцию возьмём сумму квадратов отклонениий (СКО) между исходными точками и аппроксимированными аналитической функцией: n n i 1 i 1 СКО [ N( t i ) N( t i ,,)] 2 [ N( t i )t i )] 2 (2.22) 2.8. Результаты расчёта коэффициентов методом наискорейшего спуска За начальные приближения выберем: 410 6 5 Для случая со степенной функцией формулы (2.17) и (2.19) имеют следующий вид: СКО [ 10 СКО СКО T , ] 2 СКО 2 СКО 2 2 СКО 2 СКО 2 СКО 2 Итерации: 1. Первая итерация. ( 0) 410 6 ( 0) 5 8 СКО 7.03610 3 8 . 764 10 14 9 СКО 3.32110 9 6.32510 4 6 . 325 10 7 . 882 10 9 1.80810 0.111 (1) 4.00210 6 (1) 4.889 2. Вторая итерация. (1) 4.00210 6 (1) 4.889 8 СКО 2.23810 3 2 . 787 10 14 9 СКО 1.66410 9 2.76810 4 2 . 768 10 3 . 450 10 6 0.2110 0.081 ( 2) 3.8110 6 ( 2) 4.808 3. Третяя итерация. ( 2) 3.8110 6 ( 2) 4.808 7 СКО 3.83210 452.983 14 9 СКО 1.00510 9 1.30710 4 1 . 307 10 1 . 346 10 6 0.2110 0.020 (3) 3.610 6 (3) 4.788 Итерационный цикл закончен, т.к. результат вычисления коэффициентов совпал с рассчитанными на ПК (п.2.2). 3.610 6 4.788 11 6 N( t ) 3.5910 t .4.78 2.9. Результаты Коэффициенты аппроксимирующей степенной функции были рассчитаны тремя способами: на ПК, безытерационным методом наименьших квадратов (метод нормальных уравнений) и методом наискорейшего спуска (метод Ньютона). Все они дали одинаковые результаты с точностью 0.01. 3. Расчёт биологических параметров. 3.1. Время жизни организма без лечения и запас жизненных сил. Время жизни организма без лечения (Tж(до)) рассчитывается как последний день в исходных данных плюс трое суток. Tж(до) = 24+3 = 27 суток Запас жизненных сил определяют как площадь под аналитической кривой от начала заболевания до летального исхода. Т ж ( до) Z p ( до) 0 27 N( t )dt 3.610 6 t 4.788dt 120,872 (3.1) 0 Рис. 3.1. Иллюстрация по запасу жизненных сил. 3.2. Дозовая зависимость. 12 Рис. 3.2. График дозовой зависимости Задержку роста опухоли определяют по данным дозовой зависимости. Вводимая доза: D=0.5 МПД Режим введения доз: 8 раз через t 5 суток Задержка роста опухоли: (D) D tg () D MAX 0.52 1 сутки 1 МПД (3.2) 3.3. Расчёт времени жизни организма после курса лечения. Величина запаса жизненных сил не меняется со временем и является величиной постоянной. На основании этого факта можно произвести расчёт времени жизни организма после курса лечения. Поскольку при введении дозы препарата происходит задержка роста опухоли, представим этот процесс в виде аналитической кусочнопрерывной функции из 9 интервалов: первый – до первого введения дозы, остальные после соответствующего введения дозы с задержкой в 5 суток (Рис.3.3). Время жизни организма рассчитывается как: it Zi N (t )dt i ( i 1)t (3.3) 13 5 N1 ( t ) N( t ) 3.610 6 t 4.788 для t (0;5) Z1 N1 ( t ) 0.007 0 N 2 ( t ) N( t (D)) 3.610 6 ( t 1) 4.788 10 для t (5;10) Z 2 N 2 ( t ) 0.207 5 N 3 ( t ) N( t 2(D)) 3.610 6 ( t 2) 4.788 15 для t (10;15) Z 3 N 3 ( t ) 1.652 10 N 4 ( t ) N( t 3(D)) 3.610 6 ( t 3) 4.788 20 для t (15;20) Z 4 N 4 ( t ) 7.2 15 N 5 ( t ) N( t 4(D)) 3.610 6 ( t 4) 4.788 25 для t (20;25) Z 5 N 5 ( t ) 22.374 20 N 6 ( t ) N( t 5(D)) 3.610 6 ( t 5) 4.788 30 для t (25;30) Z 6 N 6 ( t ) 56.144 25 35 6 N 7 ( t ) N( t 6(D)) 3.610 ( t 6) 4.788 для t (30;35) Z 7 N 7 ( t ) 121.661 30 40 6 4.788 6 4.788 N 8 ( t ) N( t 7(D)) 3.610 ( t 7) для t (35;40) Z 8 N 8 ( t ) 236.959 35 N 9 ( t ) N( t 8(D)) 3.610 ( t 8) для t 40 Необходимо проверить, после какого введения дозы закончится запас жизненных сил: 2 it N (t )dt 0.214 Z p до 120.872 i i 1 ( i 1)t 3 it N (t )dt 1.867 i i 1 ( i 1)t 4 it i 1 ( i 1)t 5 it Z p до 120.872 N (t )dt 9.067 Z p до 120.872 i N (t )dt 31.441 i i 1 ( i 1)t 6 it i 1 ( i 1)t 7 it i 1 ( i 1)t N (t )dt 87.585 i Z p до 120.872 - организм выдержит 6 доз. N (t )dt 209.246 i Z pдо 120.872 Z p до 120.872 - организм умрёт до введения 7-ой дозы 14 Рис. 3.3. Пунктирная линия: график роста опухоли до лечения. Жирная линия: график роста опухоли после лечения. Т.к. запас жизненных сил величина постоянная и не зависит от производимой терапии, расчёт времени жизни после лечения будет производиться по следующей формуле: 6 it i 1 ( i 1)t Z p ( после) Z p ( до) Т ж ( по сл е) N i ( t )dt N 6 t 7 ( t )dt (3.4) 15 Т ж ( посл е) 6 N 7 (t )dt Z p( до) 6 t it N (t )dt i 1 ( i 1)t i 6.2210 7 (Т ж ( после) 6) 5.788 60.59 120.872 87.585 (Т ж ( после) 6) 5.788 1.510 8 5.788ln( Т ж ( после) 6) ln( 1.510 8 ) ln( Т ж ( после) 6) 3.254 Т ж (после) e3.254 631.89431.9 суток 16 Заключение Развитие опухоли лучше всего аппроксимирует степенная функция. Организм не выдержит полный цикл лечения из 8 введений доз уровня 0.5 МПД. Организм умрёт в промежутке между 6 и 7 дозой через 31.9 суток после начала лечения, что на 4.9 суток больше, чем без лечения. Рис. 4.1. Смоделированный график развития опухоли до летального исхода. Пунктиром отмечен график развития опухоли до лечения. 17 СПИСОК ЛИТЕРАТУРЫ 1. Пыльнов Ю.В. Регрессионный анализ полиномиальных моделей. – М.: МИРЭА, 1994, 56 с. 2. Ван дер Варден Б.Л. Математическая статистика. – М: Эдиториал УРСС, 2006, 435 c. 3. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная регрессия. Изд.2, перераб. и доп. –М.: Диалектика, 2007, 912 с. 4. http://www.medslv.ru/ - Медицинский словарь – Герена карцинома