Общие проблемы применения статистики в биомедицине Леонов В.П. E-mail: [email protected] http://www.biometrica.tomsk.ru/ Не будет преувеличением утверждение, что основные проблемы применения статистики в биомедицине аналогичны проблемам и других методов получения знания, используемым в биологии и медицине. Например, каковы проблемы применения томографов в онкологии? Или каковы проблемы использования радионуклидов в кардиологии? Классифицируя их, можно выделить следующие уровни: 1) материальный - наличие необходимого томографа, компьютера, радионуклида и т.п.; 2) информационный - наличие необходимых знаний опыта, руководств, программ и т.д.; 3) организационный - наличие требуемых организационных структур, специалистов, заинтересованности руководителей или В дальнейшем нашем анализе мы будем ориентироваться на 2-й уровень информационный, исходя из того, что задачи 1-го и 3-го уровней решены в большей степени, нежели задачи 2-го уровня. При этом как в данной статье, так и в последующих наших статьях, уровень изложения того или иного материала будет ориентирован на профессионала медика или биолога, обладающего достаточными знаниями в своей предметной области. Итак, какая же основная проблема стоит перед профессионалом, работающим в области биомедицины, когда он решается использовать биостатистику в своей научной деятельности? Эту проблему аллегорически можно свести к выбору из двух альтернатив: ДДПП и ДППД (что не имеет отношения к ЗППП). Эти аббревиатуры, которые автор услышал примерно 20 лет назад в Зеленограде в НИИ молекулярной электроники, расшифровываются следующим образом: "Давай, Давай, - Потом Подумаем!" и "Давай Подумаем, Потом - Давай!". Не сомневаюсь, что большинство читателей уже сделало выбор в пользу второй альтернативы - ДППД, а некоторых из них возможно даже и обидело наше предложение о таком выборе. И, тем не менее, берусь утверждать, что более половины исследователей в медицине и биологии следуют принципу ДДПП: вначале собирают экспериментальные данные, а затем пытаются формулировать задачи их статистического анализа. Тогда как принцип ДППД требует исходя из целей и задач исследования выбрать необходимые методы статистического анализа, а уж затем начинать сбор экспериментальных данных. "Таково уж свойство человеческого ума, что как только удовлетворены все насущные житейские потребности, человек стремится постигнуть смысл окружающих явлений, подметить законы, по которым они совершаются. Он делает наблюдения, собирает факты, выводит заключения; но чем глубже проблема, тем слабее, ничтожнее кажутся фактические знания, которыми обладает человечество, и страстная потребность ума найти решение волнующих его вопросов удовлетворяется иным путем - тем полетом мысли, который называют воображением. Однако одни Факты еще не составляют науки. Грубый эмпиризм не может удовлетворить запросов ума. Работа ученого не может состоять лишь из собирания фактов. Для него необходимо возвышаться над фактами, осматривать их с высоты птичьего полета, стремиться уловить внутреннюю связь явлений, восполняя пробелы воображением, намечая пути новых исследований. Если рассматривать вблизи какую-нибудь картину, то мы увидим лишь мазки кисти и грубые очертания. Чтобы уловить идею картины, чтобы постичь ее красоту, нужно отойти на некоторое расстояние. Факты есть строительный материал, теория - план будущего здания. Подобно тому, как известный исследователь стресса Г.Селье в своей книге "От мечты к открытию" http://www.biometrica.tomsk.ru/selye_0.htm классифицировал типы ученых ("Собиратель фактов", "Книжный червь", "Аналитик", "Синтезатор", "Высушенная лабораторная дама", "Агрессивный спорщик", "Первостатейная акула”...) попытаемся и мы классифицировать исследователей в области биомедицины по мотивам использования статистики. В первую группу входят исследователи действительно осознающие необходимость использования статистики, как одного из инструментов экспериментального исследования. Представители этой группы выполняют анализ полученных данных самостоятельно либо с помощью статистиков. Представители следующей подгруппы берут пример со своих руководителей и думают примерно так: "Они применяют t-критерий Стьюдента, вот и я сделаю также. Что я, хуже их". Представители третьей подгруппы осознанно мимикрируют, не претендуя на использование более сложных методов анализа, чем те, которые применяют их руководители. Они понимают, что это требует усилий, как на освоение самих методов, так и на то, чтобы результаты их использования были поняты их коллегами и руководителями. В противном случае возможны конфликты: "Ты что, самый умный, мы все применяем M±m и Стьюдента, а ты тут какой-то кластерный анализ использовал". Хочу обратить внимание читателей на желательность именно записать сформулированные цели и задачи, поскольку в процессе написания, особенно если первая их редакция не является и последней, формулировки становятся более конкретными и понятными как самому автору, так и его коллегам. Автор этих строк всегда как минимум 3-4 раза редактирует сформулированные задачи анализа данных, памятуя при этом известные слова А.П. Чехова - "Искусство писать, это искусство вычеркивать". Однако в силу того, что наши объекты исследования как внутри отдельных групп, так и между группами сравнения, имеют достаточно большую вариабельность (изменчивость) мы должны помнить о том, что любые наши выводы, полученные по данной группе, не имеют абсолютной надежности. В то же время, исследователь желает соотнести эти выводы со всей исследуемой генеральной совокупностью, из которой взяты исследуемые объекты. (В общей теории статистики и статистической практике при проведении выборочного наблюдения под генеральной совокупностью понимается вся совокупность реально существующих объектов, из которых тем или иным способом извлекается совокупность выборочная.) В данном контексте под характеристиками мы будем понимать не только среднее, дисперсию или ошибку среднего отдельных признаков и т.д. но и более сложную и ценную информацию о различных формах и видах взаимозависимостей существующих между признаками исследуемых объектов. Эту информацию можно считать наиболее ценной, поскольку именно она позволяет исследователю решать задачу прогноза. "Знать, чтобы предвидеть, предвидеть чтобы управлять" - эти слова Огюста Куно как нельзя лучше иллюстрируют ценность информации о зависимостях признаков. Напомним нашим читателям, что кроме простых последовательных структур причинно-следственных связей типа A->B->C... и т.д. существуют и более сложные структуры, например, параллельно-последовательные, древовидные, матричные, с обратной связью и т.д. Поэтому, исследуя взаимосвязи между признаками, не следует забывать и об этих альтернативах. Знание новых зависимостей позволяет генерировать новые гипотезы о механизмах исследуемых факторов воздействия на изучаемые объекты - методов лечения, препаратов и т.д. Очевидно, что количество формулируемых задач исследования, которые предполагается далее решить с помощью биостатистики, будет определяться уровнем статистической грамотности самого исследователя, его возможностями решить эти задачи самостоятельно или же профинансировать их решение квалифицированным биостатистиком. Наш многолетний опыт общения с медиками и биологами показывает, что на этом этапе главным препятствием для последующего результативного статистического анализа собранных экспериментальных данных является их идейная (в смысле идей статистики) неподготовленность. Однако вернемся к этапу декомпозиции целей исследования в конкретные задачи, решение которых и должно обеспечить исследователю достижения поставленной цели. Часть сформулированных задач для их решения требуют статистического аппарата. Ниже мы попытаемся проиллюстрировать этот этап, используя вполне конкретный пример из нашей практики. Отметим, что данный этап декомпозиции целей исследования в задачи, требующие последующего статистического анализа данных, лучше всего выполнять совместно с квалифицированным биостатистиком. Второй подход характерен для исследований большего объема - НИОКР, кандидатские и докторские диссертации и т.д. Необходимым условием реализации такого подхода является наличие истинного профессионализма у руководителя исследования. Такой профессионал только осознает ограниченность собственных знаний, но и не стыдится этой ограниченности. К сожалению, такое осознание приходит с годами и не свойственно молодым начинающим исследователям. Подобный профессионализм приводит к пониманию того, что только участие такого же профессионала в области анализа данных позволит максимально полно использовать имеющиеся наблюдения и получить адекватные результаты. Попытаемся на реальном примере привести небольшой перечень задач, решение которых методами биостатистики представляет интерес для достижения цели исследования. Массив данных, о котором ниже пойдет речь, представляет собой результаты наблюдения за детьми, у которых наблюдалось заболевание щитовидной железы. Целью исследования являлось исследование особенностей заболевания щитовидной железы и изучение взаимосвязей разнообразных характеристики этого заболевания с характеристиками эритроцитов крови. Выборка наблюдений включала порядка 150 обследованных пациентов. Основные признаки, описывающие состояние пациентов до и после лечения, содержали следующие 2 блока: А - количественные признаки: общий анализ крови (ОАК) - 10 количественных признаков; биохимия крови (БК) - 10 количественных признаков; содержание липопротеиновых комплексов (ЛПК) - 2 количественных признака; показатели обратимой агрегации эритроцитов (ОАЭ) - 12 количественных признаков; содержание гормоны (Г) - 4 количественных признака; показатели УЗИ щитовидной железы - 15 количественных признаков; параметры эритроцитов (ПЭ) - 12 количественных признаков. Итого - 55 количественных переменных. В - дискретные качественные признаки: группа пациентов - больные до лечения, больные после лечения, здоровые (контроль) - 1 качественный признак; вид заболевания (З) - 1 качественный признак; жалобы пациентов (Ж) - 12 качественных признаков; наследственность (Н) - 3 качественных признака; анамнез заболевания (АЗ) - 12 качественных признаков; показатели пункции щитовидной железы (ПЩЖ) - 8 качественных признаков. Итого - 37 качественных признаков. Исходя из цели исследования, имеет смысл решить следующие задачи. Исследование взаимосвязи между всеми парами образованными 55 количественными признаками. Число таких пар составляет (55*54/2=1485) отдельно в каждой из подгрупп образованных по отдельным градациям качественных признаков. Например, исследуются взаимосвязи между 1485 парами количественных признаков отдельно в группе больных до и после лечения и у здоровых. Аналогичным образом проводится исследование парных зависимостей и для подгрупп по остальным качественным признакам. В частности, одним из часто встречающихся в среде медиков и биологов заблуждений является акцентирование внимания только на одной характеристике совокупности: среднем арифметическом значении признака, чаще всего обозначаемом в публикациях как М (от английского Means - среднее). Между тем, отличия патологических объектов (экспериментальных) от здоровых (контрольных) могут проявляться не только в изменении (сдвиге по числовой оси) среднего значения. Принадлежность объектов к экспериментальной группе может сопровождаться также и другими, возможно более важными и существенными изменениями. Не меньший интерес представляет и исследование взаимосвязей между отдельным качественным признаком, например, наследственностью и одним из количественных признаков, например, величиной гормона ТТГ или Т3. В этом случае общее количество таких связей подлежащих изучению также оказывается немалым. Аналогичный же анализ имеет смысл произвести и по выяснению совокупного влияния комбинации двух или трех качественных признаков на отдельный количественный признак. При таком изучении оцениваются средние значения средних каждого количественного признака в каждой отдельной группе, а также проводится проверка гипотез о равенстве групповых средних между собой. Представляет несомненный интерес исследование зависимости между одним качественным признаком, например анамнезом заболевания, и многими количественными признаками вместе. Если эта связь сильна, то в этом случае по набору количественных признаков можно сконструировать решающее правило и достаточно надежно произвести классификацию для каждого больного в ту или иную группу по наследственности или по анамнезу, или по жалобам. Следующая, не менее важная задача, состоит в том, чтобы исследовать связи между всеми возможными парами качественных признаков. В нашем случае будет изучена взаимосвязь у (37*36)/2=666 пар качественных признаков. Например, наблюдается ли статистически значимая связь между наследственностью и жалобами, или между анамнезом заболевания и показателями пункции щитовидной железы. В каждом случае для статистически значимых связей можно будет оценить, в каких именно сочетаниях отдельных градаций признаков концентрируется данная связь, что под силу только квалифицированному биостатистику. Следующий класс задач, это оценка регрессионных уравнений связи между одной количественной переменной и несколькими количественными признаками. В этом виде анализа можно будет оценить наличие зависимости наиболее важных количественных показателей, например, содержания того или иного гормона от нескольких других показателей, например показателей биохимии, параметров эритроцитов, ЛПК и т.д. В исходных данных подлежащих исследованию имеется ряд качественных признаков, которые разделяют субъективно или объективно всех пациентов на ряд подгрупп. Это могут быть подгруппы по анамнезу, жалобам, наследственности и т.д. Однако не менее актуальна и постановка такой задачи: оценить наличие объективно существующих группировок пациентов, используя для этой цели только подмножества количественных признаков. Например, сколько имеется локальных групп пациентов, если для их группировки использовать только показатели параметров эритроцитов, или только показатели гормонов, ЛПК, биохимии и т.д. либо все эти количественные показатели вместе. Очевидно, что важность и новизну информации, полученной в результате статистического анализа, может осознать и оценить только исследователь, обладающий в данной предметной области достаточным уровнем знаний. Мало получить тот или иной результат с помощью простых или самых изощренных методов биостатистики. Дальнейшая судьба этих результатов заключается в том, чтобы исследователь мог аргументированно их интерпретировать. Для успешного прохождения этого этапа исследования требуется как глубокое понимание особенностей исследуемого объекта (его структуры, функционирования тех или иных подсистем и т.д.), так и хорошее понимание алгоритмов использованных методов статистич. анализа. Выше мы привели далеко не полный перечень задач, который был решен нами при исследовании данного массива данных и мог бы рекомендоваться для применения в биомедицинских исследованиях. Если попытаться классифицировать как перечисленные выше, так и многие другие методы статистики, применяемые в биомедицине, то можно предложить классификацию, опирающуюся на представление об исследуемых обьектах как система. Первая группа включает методы, с помощью которых производится оценка основных параметров совокупности, таких как меры положения и разброса (среднее, мода, медиана, квартили, размах, дисперсия и т.п.) Итак, если подвести итог обсуждения основных проблем, то их можно сформулировать следующим образом: - Мотивы принятия решения о необходимости использования статистики в исследовании. - Время принятия этого решения - до начала исследования или к моменту окончания сбора экспериментальных наблюдений. - Время декомпозиции целей исследования в конкретные задачи статистического анализа матрицы экспериментальных данных и его адекватность. - Качество решения сформулированных статистических задач, определяемое уровнем статистической подготовки исполнителя и уровнем используемого программного обеспечения. - Адекватность интерпретации результатов статистического анализа экспериментальных данных. - Подготовленность исследователя к восприятию идейной стороны используемых статистических методов. - Наличие организационной структуры в биомедицинских НИИ и вузах, обеспечивающих современный уровень статистического анализа экспериментальных исследований (стандарты, редакционные требования, лаборатории биостатистики и т.д.) Литература: Леонов В.П., Ижевский П.В. Об использовании прикладной статистики при подготовке диссертационных работ по медицинским и биологическим специальностям // Бюллетень ВАК РФ, 1997, № 5, с.56-61. Леонов В.П., Ижевский П.В. Применение статистики в медицине и биологии: анализ публикаций 1990-1997гг.// Сибирский медицинский журнал, 1997, № 3-4, с. 64-74.