ИДЕНТИФИКАЦИЯ СОСТОЯНИЯ БОЛЬНЫХ ЛЕПТОСПИРОЗОМ ПОСРЕДСТВОМ ФАКТОРНОГО И ДИСКРИМИНАНТНОГО АНАЛИЗОВ Л.Н. Елисеева (д.м.н., зав. кафедрой факультетской терапии Кубанской государственной медицинской академии), А.А. Халафян (к.т.н., доц. кафедры прикладной математики Кубанского государственного университета), Фищенко Д.В. студент факультета прикладной математики Кубанского государственного университета, С.Г. Сафонова (аспирант кафедры факультетской терапии Кубанской государственной медицинской академии), 2006 г. Современные Российские стандарты диагностики тяжести хронической сердечной недостаточности (ХСН) предполагают использование классификации, предложенной в 2001 году обществом специалистов по сердечной недостаточности (ОССН), основанной на использовании клинических признаков, которые могут быть неоднозначно интерпретированы врачами. Альтернативным способом градации ХСН может служить 6-минутный тест ходьбы [1–3], позволяющий по дальности расстояния (табл.1, столбец 2), пройденного пациентом за 6 минут установить функциональный класс (ФК) ХСН (столбец 1). Таблица 1 ФК ХСН IV III II I 0 расстояние тест. (м) 0 – 150 151 – 300 301 – 425 426 – 550 более 551 расстояние расч. (м) 0 – 200 201 – 300 301 – 400 401 – 500 более 500 Используемый 6-минутный тест приближен к повседневной физической активности пациентов, прост в исполнении, не требует специального оборудования, безопасен и хорошо воспроизводим. С его помощью можно судить не только о физической активности, толерантности пациентов с ХСН к физическим нагрузкам, но и контролировать эффективность проводимой терапии. Несмотря на простоту и доступность этого метода, результаты тестирования не могут в полном объеме оценить функциональное состояние больных, имеющих заболевания суставов, дефекты статики, когнитивные нарушения. Кроме того, при проведении 6-минут- 1 ного теста ходьбы не учитываются индивидуальные психологические особенности личности больных, их волевые качества, а также нозологическая принадлежность заболевания сердечно-сосудистой системы, приведшая к ХСН. Указанные факты снижают эффективность и адекватность данного метода и приводят к неизбежным погрешностям при тестировании и, как следствие, к ошибкам в определение тяжести ХСН больных. В работе впервые предложен альтернативный 6-минутному тесту статистический подход к определению ФК ХСН. Показано, что по основным признакам болезненного состояния при помощи классификационного анализа можно определить ФК ХСН больного с приемлемой для практики достоверностью. На базе имеющихся эмпирических данных больных страдающих ХСН и пакета Statistica 6.1 создан программный комплекс для определения ФК ХСН. В исследованиях участвовали 119 пациентов в возрасте от 39 до 75 лет с признаками ХСН, имевших конечный диастолический (КДР) и систолический (КСР) размеры левого желудочка (ЛЖ) соответственно более 5,0 см и 2,4 см, размер левого предсердия (ЛП) более 3,5 см, диастолическое артериальное давление (АДД) более 50 mm Hg. В исследование не были включены пациенты с прогрессирующей стенокардией, сахарным диабетом 1 и 2 типов, с артериальной гипертонией III степени, инсультом, поражением суставов нижних конечностей. При обследовании осуществляли: оценку клинических проявлений ХСН – слабости, одышки; измерение артериального давления, показателей центральной гемодинамики, конечного диастолического, конечного систолического размеров левого желудочка и левого предсердия. Измерения проводились при помощи аппарата “Sequoia” (фирма “Acuson”, США). Каждый больной прошел 6-минутный тест. В качестве инструментария статистического моделирования и обработки результатов исследований была использована лицензионная версия программы Statistica 6.1. С точки зрения математической статистики показатели слабость, одышка являются порядковыми переменными, принимающими значения – нет, слабая, умеренная, выраженная, сильно выраженная. Остальные показатели – КДР, ЛП, АДД, КСР – переменные, измеренные минимум в интервальной шкале. Поэтому, при статистической обработке полученных данных были использованы параметрические и непараметрические методы математической статистики [4]. 2 Исследования показали, что между анализируемыми показателями и результатами 6-минутного теста существует статистически значимая взаимосвязь. В табл.2 приведены тау ( )דкорреляции Кендалла, которые измеряют величину зависимости между показателями и результатами 6-минутного теста. Из результатов корреляционного анализа следует, что все корреляции значимы (верна гипотеза о неравенстве 0 при уровне значимости 0,05), и для всех показателей, кроме АДД, корреляция умеренная. Для показателя АДД корреляция слабая. Таблица 2 Тау корреляции Кендалла Все корреляции значимы на уровне p <,05000 Перем. сл од КСР КДР ЛП АДД 6-мин.тест -0,677631 -0,738461 -0,489169 -0,536194 -0,466446 -0,216617 Наличие взаимосвязи означает, что, по-видимому, по значениям данных показателей, минуя 6-минутный тест, методами классификационного анализа (дискриминантный, кластерный) можно определить к какому ФК ХСН принадлежит тот или иной больной. Дискриминантный анализ позволяет классифицировать объект, т.е. отнести к одной из нескольких заданных групп на основе измерения его различных признаков (показателей). В дискриминантном анализе, в отличие от кластерного, принадлежность объектов к группам задается переменной, которая называется группирующей. Остальные переменные называются зависимыми. В нашем случае группирующей переменной является ФК ХСН, которая принимает значения, соответствующие номерам классов – 0, I, II, III, IV. Зависимыми являются слабость (сл), одышка (од), КСР, КДР, ЛП, АДД. Одним из условий применения дискриминантного анализа является требование о соответствии законов распределения зависимых переменных нормальному. По мнению разработчиков программы Statistica, невыполнение этого условия не является “фатальным”, но требует бόльшей осторожности при интерпретации результатов [5]. Это замечание делает возможным, в некоторых случаях, использование в дискриминантном анализе порядковых зависимых переменных. При правильно выбранных диапазонах расстояний (табл.1, столбец 2), по которым определяется исходный ФК для каждого больного, расхождение между классификацией, предложенной программой и исходным ФК будет минимальным. О соответствии ре3 зультатов исходной и программной классификации свидетельствовуют показатели “качества” проведенного дискриминантного анализа – параметр λ – лямбда Уилкса; процент правильно классифицированных наблюдений (больных); квадраты расстояний Махолонобиса между центрами групп классификации; апостериорные вероятности принадлежности наблюдений к группам; диаграмма рассеяния канонических корней. Параметр λ Є интервалу (0, 1); значения λ, лежащие около 0, свидетельствуют о хорошей дискриминации, значения λ, лежащие около 1 свидетельствуют о плохой дискриминации. Проведенный дискриминантный анализ показал следующее. Параметр λ = 0,111, т.е. значительно отличается от 0. В табл. 2 приведены квадраты расстояний Махалонобиса между центрами групп. Видно, что расстояния между ФК 0 и I, I и III, II и III незначительны. При этом, квадрат расстояния между ФК 0 и I статистически незначим, т.е. при уровне значимости p = 0,05, верна гипотеза о равенстве нулю расстояния между этими классами. Общий процент правильно классифицированных объектов составил 83%. На диаграмме рассеяния канонических корней геометрические фигурки, соответствующие разным ФК ХСН, расположены в одних и тех же областях плоскости (перемешаны). Таблица 3 Квадраты расстояний Махаланобиса ФК ХСН 0 I II III IV 0 0,00000 6,6564714,8563741,7192263,81587 I 6,65647 0,00000 4,8570923,7456242,78910 II 14,85637 4,85709 0,00000 8,6562922,46887 III 41,7192223,74562 8,65629 0,00000 4,42751 IV 63,8158742,7891022,46887 4,42751 0,00000 Таким образом, результаты показывают недостаточное соответствие программной классификации с исходной классификацией. Следовательно, можно попытаться скорректировать существующие стандартные диагностические критерии – диапазоны расстояний, по которым определяется ФК ХСН. Для этой цели был применен кластерный анализ. При помощи кластерного анализа можно выбрать оптимальное число кластеров (ФК) и подобрать наилучшим образом диагностические критерии. В отличие от дискриминантного анализа, в кластерном анализе не задается группирующая переменная, а задаются наблюдения и переменные. В нашем случае – это соответственно больные и показатели сл., од., КСР, КДР, АДД, ЛП, по которым и осуществляется разбиение объектов на кластеры. Чис- 4 ло кластеров задает исследователь, но по результатам кластеризации можно определить оптимальное число кластеров. К показателям “качества” кластеризации относятся расстояния между центрами кластеров, различия между средними переменных в кластерах, внутригрупповые и межгрупповые дисперсии. Результаты кластерного анализа показали, что есть некоторые отличия “качества” кластеризации при числе кластеров равном 5, 4, 3. Наилучшее качество соответствует числу кластеров – 4, так как более различны средние показателей в кластерах, больше евклидовы расстояния между центрами кластеров, межгрупповые дисперсии превосходят соответствующие внутригрупповые дисперсии. Но, так как традиционная классификация, принятая в кардиологии, состоит из 5 классов, в дальнейших исследованиях использовали число кластеров, равное 5. Посредством частотного анализа результатов кластеризации для каждого из пяти кластеров определили “оптимальные” расчетные расстояния, которые приведены в табл. 1 (столбец 3). В соответствии с приведенной таблицей больные по результатам 6-минутного теста были вновь распределены по ФК ХСН. Повторно проведенный дискриминантный анализ показал высокое соответствие программной классификации с распределением по новым ФК ХСН. Так параметр λ уменьшился почти вдвое и составил 0,066, процент верно классифицированных программой наблюдений возрос с 83 до 88% (неверно классифицированы 14 больных) (табл.4), квадраты расстояний Махолонобиса значительно возросли (табл.5), “улучшилась” диаграмма рассеяния канонических корней – геометрические фигурки, соответствующие различным ФК локализованы в различных областях плоскости. Как было замечено ранее, результат 6-минутного теста зависит от совместных усилий больного и сопровождающего его врача. Больной может «запаниковать», «закапризничать» и пройти меньше, чем мог пройти. С другой стороны, больной, ободряемый врачом, может превзойти себя и пройти больше, чем ему позволяют физические возможности. Были проанализированы результаты тестирования 14 больных, для которых результаты программной классификации не совпали с результатами 6минутного теста по новым диапазонам. Анализ показал, что практически для 5 всех 14 больных результаты теста находятся в близи границ диапазонов, т.е. речь идет о несоответствии в несколько метров. Таблица 4 ФК 0 I II III iV Всего Матрица классификации Строки: наблюдаемые классы Столбцы: предсказанные классы Процент 0 I II III IV правиль. p=,10924 p=,41176 p=,20168 p=,12605 p=,15126 13 0 0 0 0 95,9184 1 47 1 0 0 66,6667 0 7 16 1 0 93,3333 0 0 0 14 1 83,3333 0 0 0 3 15 88,2353 14 54 17 18 16 Таблица 5 Квадраты расст. Махаланобиса ФК нов. 0 I II III IV 0 I II III IV 0,0000 6,34106 23,17831 58,78017 106,2502 6,34106 0,00000 5,89597 26,92906 61,4805 23,1783 5,89597 0,00000 9,70862 32,8873 58,7802 26,92906 9,70862 0,00000 8,2801 106,2502 61,48050 32,88734 8,28014 0,0000 Программа распределила 11 больных в ФК, соответствующие более высокой тяжести ХСН Так, 1, 7, 3 больных из ФК 1, 2, 4 распределены соответственно в ФК 0, 1, 3. Это означает, что больные во время теста прошли на несколько метров меньше, чем могли пройти по своим физическим возможностям. Программа распределила 3-х больных в ФК, соответствующие более низкой тяжести ХСН. Так, по одному больному распределены из ФК 1, 2, 3 в ФК 2, 3, 4. Это означает, что больные прошли на несколько метров больше, чем могли пройти по своим физическим данным. После корректировки принадлежности к ФК 11-ти больных и повторном дискриминантном анализе процент правильных ответов возрос до 98,5%. При этом уменьшилось значение λ (0,048) и возросли расстояния между центрами групп. Таким образом, удалось создать базу данных больных, соответствующей «качественному», с точки зрения математической статистики, распределению больных по функциональным классам. Важным достоинством модуля дискриминантный анализ является то, что он является обучающейся программой. При наличии базы данных, допускающей успешную дискри6 минацию, можно вводить данные по новым объектам (в нашем случае это больные, для которых ФК ХСН еще не определены), и программа определит группу принадлежности (ФК ХСН). По мере добавления в базу новых объектов база расширяется и «качество» дискриминации будет возрастать. Для того, чтобы максимально упростить процедуру работы медицинского персонала с программой Statistica был создан Analysis Macros – макрос модуля дискриминантный анализ. Основное назначение макросов – автоматизация работы с модулем, что ведет к значительной экономии времени и делает возможным общение неспециалистов с программой Statistica как с «черным ящиком» – достаточно ввести на вход «черного ящика» данные и получить на выходе результат. На основе базы данных больных, макроса и написанного на языке Visual Basic интерфейса был создан программный комплекс для определения функционального класса хронической сердечно-сосудистой недостаточности больных. Интерфейс программного комплекса прост и не требует специального обучения для работы с ним. Представляет собой окно (рис.1), которое открывается при помощи нажатия кнопки на рабочем столе пользователя. Рис. 1 Схема работы ПК предельно проста и состоит из следующих шагов: 1. Нажать на панели инструментов программы Statistica, предварительно созданную кнопку (рис.2) «Новый пациент». Рис.2 7 2. Ввести в поля открывшегося окна (рис. 3) фамилию и инициалы нового больного и определенные при помощи клинических исследований параметры: слабость (нет, слабая, умеренная, выраженная, сильно выраженная), отдышка (нет, слабая, умеренная, выраженная, сильно выраженная), значения КСР, КДР, ЛР, АДД. 3. Нажать на кнопку ОК, после чего откроется окно с результатами дискриминантного анализа – вероятностями принадлежности боль ных к каждому из функциональных классов. Больного следует отнести к тому ФК ХСН, которому соответствует бόльшее значение вероятности. Если значения вероятностей принадлежности больного к ФК ХСН близки, то из этого следует, что больной находится в переходном состоянии из одного класса в другой. Это означает ухудшение, или улучшение состояния здоровья больного, в зависимости от предистории болезни. 4. После нажатия в окне результатов на ОК, все данные нового больного будут автоматически введены в базу данных, т.е. произойдет ее расширение. Пример 1. Больная Д. при поступлении предъявляла жалобы на слабость (слабая), на давящие боли при физической нагрузке при прохождении больной более 250 м, на одышку (сильно выраженая). Объективно: Границы относительной сердечной тупости расширены влево до левой среднеключичной линии. Тоны сердца ритмичные. На аорте выслушивается систолический шум. II тон на аорте усилен. АД 160/100 mm.Hg., ЧСС 75 ударов в минуту. В легких везикулярное дыхание, хрипов нет. Живот мягкий, безболезненный. Печень не пальпируется. Отеки голеней. Данные инструментальных исследований: ЭХО-КС КДР 5,7см, КСР 3,2 см, ЛП 4,1 см, IVRT 105 мсек:, митральная регургитация 1.После проведения комплексного обследования показатели больной были введены в программное окно ввода данных (рис.3) и после нажатия на ОК ПК определил наиболее вероятный ФК ХСН (рис.4). 8 Рис.3 Рис.4 Полученный результат проведенного анализа показывает, что наибольшая вероятность, равная 1 соответствует ФК ХСН III и значению 6-минутного теста в пределах от 201 до 300. То есть, больного следует отнести к ФК ХСН III. Пример 2. Больной К. предъявлял жалобы на одышку (умеренная), слабость (слабая), периодические подъемы АД до 240/120 mm.Hg, давящими болями в области сердца при физической нагрузке. Объективно: Границы относительной сердечной тупости расширены влево до левой среднеключичной линии. Тоны сердца ритмичные, несколько приглушены. На аорте и верхушке выслушивается систолический шум. Акцент II тона на аорте. АД 190/100 mm.Hg., ЧСС 71 ударов в минуту. В легких везикулярное дыхание, хрипов нет. Живот мягкий, безболезненный. Печень не пальпируется. Отеков нет. Данные инструментальных исследований: ЭХО-КС: КДО 151 мл, КСО 75 мл, КДР 5,8см, КСР 3,7см, ЛП 4,3 см, IVRT 96 мсек, митральная регургитация 1,5. После проведения комплексного обследования показатели больного вводятся в программное окно ввода данных (рис.5) и после нажатия на ОК, ПК определил наиболее вероятный ФК ХСН (рис.6). 9 Рис.5 Рис.6 Полученный результат проведенного анализа показывает, что наибольшая вероятность, равная 0,71 соответствует II ФК ХСН и значению 6-минутного теста в пределах от 301 до 400. То есть, больного следует отнести к ФК ХСН II. Так как вероятность принадлежности больного к ФК ХСН III равна 0,29, то это означает, что при неблагоприятном течении болезни больной может оказаться в ФК ХСН III, что соответствует более тяжелому болезненному состоянию. В данном случае тактика лечения больного может состоять в стабилизации его состояния в ФК ХСН II с последующим переходом в ФК ХСН I. Медико-социальный эффект: Предлагаемая программа оценки тяжести сердечной недостаточности при использовании позволяет: • стандартизировать определение степени тяжести хронической сердечной недостаточности у больных ишемической болезнью сердца, что имеет большое значение при определении трудоспособности больных; • повысить качество диагностической процедуры ранних стадий сердечной недостаточности; • снизить частоту ошибок при верификации степени тяжести хронической сердечной недостаточности; • позволяет ускорить процесс определения тяжести ХСН в повседневной врачебной практике; 10 • объективно оценить динамику течения болезни (качество проводимой терапии), по изменяющимся значениям вероятностей принадлежности больного к функциональным классам ХСН; • выработать оптимальные для каждого больного стратегию и тактику лечения болезни. Литература 1. Ю.Н. Беленков, В.Ю. Агеев, В.Ю. Мареев. Знакомьтесь: диастолическая сердечная недостаточность. // Сердечная недостаточность. 2000. т.1. .№2, с.106. 2. Клинланд Ж.Ф. Лекция по сердечной недостаточности. Эпидемиология к патофизиологии сердечной недостаточности. Вступительное слово. Научно-исследовательский центр Julius. Академическая книга. 2000. с.236. 3. HCAAC // European Heart Journal. 2001. vol.17. р.115. 4. О.Ю. Реброва. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. М.: Медиа Сфера, 2003. с.312. 5. StatSoft.Inc.(2001). Электронный учебник по статистике. Москва. StatSoft.WEB: http://www. StatSoft.ru/home/textbook/default.htm. Известия высших учебных заведений. Северокавказский регион. Естественные науки. 2008. №1. 11 12