ЭЛЕМЕНТЫ ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ И УПРАВЛЕНИЕ ИССЛЕДОВАНИЯМИ (системный анализ и обработка медико-биологической информации в комплексном изучении человека) Москва 2011 1 УДК 311.1/2.001.2+311.1/2.001.5 ББК Максимов И.Б., Столяр В.П., Богомолов А.В., Зубов Н.Н. ЭЛЕМЕНТЫ ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ И УПРАВЛЕНИЕ ИССЛЕДОВАНИЯМИ (системный анализ и обработка медико-биологической информации в комплексном изучении человека) /Под редакцией проф. В.П. Столяра.- М.: ГВКГ им. Н.Н. Бурденко, 2011. 200с. 2 5 ВВЕДЕНИЕ 1 СИСТЕМЫ В КОМПЛЕКСНОМ МЕДИКО-БИОЛОГИЧСКОМ 10 И СОЦИАЛЬНОМ ИЗУЧЕНИИ ЧЕЛОВЕКА 2 ПРИМЕНЕНИЕ СИСТЕМНОГО АНАЛИЗА И СИСТЕМНОГО 26 ПОДХОДА ДЛЯ ИССЛЕДОВАНИЯ ЧЕЛОВЕКА, ОБЪЕКТОВ ЗДРАВООХРАНЕНИЯ И МЕДИЦИНЫ 2.1 Применение системного подхода, методов анализа и синтеза при 39 оценке состояния изучаемого явления 3 УПРАВЛЕНИЕ ИССЛЕДОВАНИЯМИ, УПРАВЛЕНИЕ ЗДРАВООХРАНЕНИИ, МЕДИЦИНЕ И БИОЛОГИИ 3.1 Циклы управления в системах здравоохранения, медицины и 47 биологии 3.2 Планирование и управление научными исследованиями 52 4 МЕДИЦИНСКИЕ И МЕДИКО-БИОЛОГИЧЕСКИЕ ПРОЦЕССЫ 59 5 СБОР ПЕРВИЧНОЙ МЕДИКО-БИОЛОГИЧЕСКОЙ ИССЛЕДОВАТЕЛЬСКОЙ ИНФОРМАЦИИ 74 6 БАЗА ИССЛЕДОВАТЕЛЬСКИХ ДАННЫХ 82 7 ИНФОРМАЦИОННОЕ ПРОСТРАНСТВО ИССЛЕДОВАНИЯ 87 8 МОДЕЛИ И МОДЕЛИРОВАНИЕ 90 8.1 Модели и методы в медико-биологических исследованиях 92 8.2 Моделирование как метод системного анализа 112 9 ВЗАИМОДЕЙСТВИЕ МЕДИКО-БИОЛОГИЧЕСКИХ СИСТЕМ 116 И ПОДСИСТЕМ 9.1 Обработка медико-биологической информации 117 9.2 Случайные события и величины в системном анализе 124 9.3 Факторный анализ медико-биологических данных 126 9.3.1 Сущность факторного анализа и интерпретация главных факторов 127 9.3.2 Метод главных компонент 133 9.3.3 Вращение (ротация) главных компонент 135 В 43 3 9.3.4 Построение линейных моделей для признаков 136 9.3.5 Классификация объектов по главным факторам 137 9.4 Дискриминантный анализ 138 9.5 Кластерный анализ 139 9.5.1 Сущность кластерного анализа и его основные этапы 140 9.5.1.1 Этапы кластерного анализа 142 9.5.1.2 Коэффициент корреляции как мера сходства объектов 144 9.5.1.3 Коэффициенты подобия как мера сходства объектов 145 9.5.2 Функции расстояния для непрерывно варьирующих признаков 9.5.2.1 Понятие функции расстояния (метрики) и требования к ним 9.5.2.2 Некоторые признаков виды метрик для непрерывно 145 145 варьирующих 146 9.5.3 Функции расстояния для качественных признаков 150 9.6 Дисперсионный анализ в исследовании медико-биологических проблем 153 Сущность и задачи дисперсионного анализа. Полный факторный эксперимент 9.6.2 Определение степени влияния факторов на выходной параметр и оценка её значимости. Критерий значимости Фишера F – критерий 9.6.2.1 Анализ однофакторных комплексов 9.6.2.2 Анализ двухфакторных комплексов 10 ПРОГНОЗИРОВАНИЕ В НАУЧНЫХ ИССЛЕДОВАНИЯХ 9.6.1 СПИСОК ЛИТЕРАТУРЫ 155 160 160 165 170 176 4 ВВЕДЕНИЕ Важнейшей задачей научного познания окружающего нас мира является исследование природы, общества и человека. Решение этой задачи – сложный и длительный процесс, главной целью которого является более полное понимание сути явлений и процессов, происходящих в изучаемых объектах их зависимость от влияния и воздействия различных факторов и условий. Результатом научной деятельности может быть описание реальности, объяснение предсказания явлений и процессов, происходящих в организме человека, в том числе и причин возникновения в нем патологических изменений и состояний. Идеалом научного поиска считается открытие законов, т.е. теоретическое объяснение действительности. Наука как человеческая деятельность, прежде всего, характеризуется методом. Задача медицинской науки - выявление закономерностей процессов, происходящих в организме человека, в том числе и причин возникновения в нем патологических изменений и состояний, а также изыскание наиболее эффективных способов и средств для их предупреждения и устранения. Сложность научных и практических задач, стоящих перед исследователями врачами, биологами, социологами и другими специалистами, постоянно растет, и это настоятельно требует расширения их кругозора, поиска, выбора и применения адекватных методов решения. Методы, применяемые для решения задач научного познания, должны давать новые знания, обеспечивать исследование и изучение объективной реальности. При этом решающим условием достижения успеха исследования является методичность и системность, а также применение процедур обобщения и логических переходов от общего к частному. Кроме того, важным условием установления научной истины является адекватное описание исследуемых объектов и систем. Поэтому в процессе решения научных задач исследователи должны стремиться к наиболее полному и объективному описанию выделенной для изучения предметной области и ее внутренней структуры, 5 объяснению причинно-следственных законов функционирования системы или подсистем. Медико-социальные биофизические системы “человек–машина–среда (общество)” могут изучаться экспериментах, так и как в лабораторных или модельных в условиях повседневной деятельности врачей, биологов, социологов и других специалистов. Повсеместное распространение, достаточная доступность компьютеров и современных пакетов программ, таких как STATGRAPHICS, Excel, SPSS, STATISTICA и др. расширяют возможности исследователей по решению многих прикладных задач. Их использование в практической деятельности не исключает необходимости понимания и правильного применения положений общей теории статистики, медицинской статистики, биометрии, биометрики, методов моделирования и доказательной медицины для обработки информационных массивов в медико-биологической практике. То есть, определенная статистическая подготовка врачей и биологов, является обязательной. Задачей настоящей книги является методическое обеспечение самостоятельного выбора, рассмотрение возможностей и условий применения методов математической статистики к проблемам медико-биологических и социальных исследований. Вместе с тем, авторы не ставили перед собой цель исчерпывающе изложить положения математической статистики. Следует отметить, что при проведении современных многоплановых медико-биологических или социальных научно-исследовательских работ, на исследователей их выполняющих действуют следующие новые обстоятельства: - переход от пассивного наблюдения и пассивного сбора информации о характеристиках системы “человек–машина–среда (общество)” к активному экспериментированию в реальных условиях на больших выборках с целью выявления особенностей системы и общих закономерностей ее функционирования; 6 широкое - участие в исследованиях (и привлечение к их выполнению) врачей, биологов, социологов и других специалистов практиков; использование для медико-социальных исследований сложных - тестов и техники съема экспериментальных данных, включая системы, контролирующие одновременно несколько показателей; внедрение методов математического планирования, позволяющих вычленять и независимо оценивать влияние факторов, строить многофакторные модели явлений, что качественно изменяет структуру натурных и экспериментальных исследований. Экспериментальные (лабораторные или модельные) медико-социальные исследования здоровья населения, условий жизни и работы должны обеспечить получение полезной информации в искусственно созданных условиях с целью нахождения оптимальных параметров изучаемых биофизических или медико-социальных комплексов. При этом следует учитывать и обращать внимание на отличительные особенности реальных систем и их исследовательских прототипов. Необходимо помнить, что исследования человека и на человеке предъявляет особые требования к планированию экспериментов и их проведению. Поэтому для получения полезной информации важно планировать пробные шаги варьирования по управляемым факторам, выделять зависимость изучаемого отклика (или их множества) от воздействующих переменных, учитывать стохастичность систем и выявлять направления поиска оптимальных условий в факторном пространстве на основе регрессионных моделей. В реальных натурных исследованиях присутствует гораздо большее, чем при модельных испытаниях, количество неуправляемых и неконтролируемых факторов, которые могут оказывать воздействие на изучаемый отклик. В сочетании с малыми интервалами варьирования управляемых воздействий и значительной биологической вариабельностью это требует увеличения числа 7 параллельных опытов в каждой точке плана для повышения достоверности проверок статистических гипотез. Для познания, изучения и исследования, достижения определенных результатов и практического преобразования действительности существует множество методов (приемов, подходов, операций, способов) и их совокупностей. Методология системного анализа занимает среди них особое место в связи с тем, что изучение сложных медико-биологических социальных проблем сопровождается взаимосвязанности изучаемых необходимостью и исследования факторов, их изменчивости во времени, зависимости от значительного числа случайных процессов и явлений. Практический опыт показывает, что понимание и представление многих исследователей из числа врачей, биологов, социологов и других специалистов о возможностях применения методов системного анализа, а также теорий управления и информации, методов анализа и обработки информации, при планировании и проведении научно-исследовательских работ, а также в повседневной деятельности является далеко не полным. Учитывая это обстоятельство и стремясь более точно показать процедуры применения названных методов для логики и методологии науки, теории и практики обоснования и принятия решений, мы в настоящей работе хотели привести в порядок некоторые достаточно противоречивые и спутанные понятия в вопросах применения этих методов в медицине и биологии при выполнении научных исследований и практической деятельности врачей, биологов и других специалистов. Парадигма – это общепризнанный эталон, пример научного исследования, включающий закон, теорию, их практическое применение, метод, оборудование и др. Обычно процесс научного исследования строится следующим образом: - выдвижение или формулировка гипотезы (гипотез); - планирование исследования (эксперимента); - проведение исследования (эксперимента); - интерпретация данных; - опровержение или подтверждение гипотезы (гипотез); 8 - в случае опровержения старой – формулирование новой гипотезы (гипотез). На наш взгляд, научное познание и исследование любого явления, объекта или проблемы, как и решение практических задач, должно характеризоваться и осуществляться с системных позиций. Именно системность дает возможность получить более полное и верное представление об изучаемом объекте, находящемся в конкретных взаимосвязях, отношениях и зависимостях. исследовательских Системность и должна практических быть задач присуща при изучения решении человека в здравоохранении, медицине, биологии, социологии и других науках в интересах всего общества, больших или малых когорт, здоровых и (или) больных людей. Системный подход должен применяться при обследовании обратившихся по поводу заболеваний, установления им диагноза, выбора методов лечения, профилактики и др. Исследовательская и практическая деятельность будет более успешной и эффективной, если понятийный аппарат (определения, термины и категории) - предельно ясный, прочный и понятный. В этой связи, нам представляется, что для правильного понимания и адекватного применения методов системного и математико-статистического анализа в научной и практической деятельности врачам всех специальностей, биологам и другим специалистам необходимо определиться и разобраться в сути понятий «система», «системный подход», «системный анализ», «объект», «процесс», «управление», «метод», «модель», «моделирование», «прогнозирование» и др. так как без четкого понимания этих категорий нельзя проникнуть в суть объектов и явлений при комплексном, системном медико-социальном изучении человека. 9 1. СИСТЕМЫ В КОМПЛЕКСНОМ МЕДИКО-БИОЛОГИЧЕСКОМ И СОЦИАЛЬНОМ ИЗУЧЕНИИ ЧЕЛОВЕКА Системы, подсистемы и их элементы могут выделяться при проведении комплексных исследований человека с целью решения различных медикобиологических и социальных задач. Существует множество подходов к их выделению и математическому описанию в зависимости от проблем и задач решаемых врачами, социологами или биологами. Наиболее общим является теоретико-множественный подход, при котором система S представляется как отношение S X х Y, где X и Y – входной и выходной объекты выделенной для исследования системы соответственно. Строгого, единого определения для понятия «система» в настоящее время нет. В литературе под системой в общем случае понимается совокупность элементов и связей между ними, обладающая определенной целостностью. Система (system) - 1. Взаимосвязанная совокупность множества элементов (процессов, явлений), находящихся в отношениях, между собой таким образом, что имеется их определенное единство. 2. Объект, представляющий собой совокупность элементов, обладающую свойством целостности при конкретном рассмотрении. 3. Целое, составленное из частей «конечное множество функциональных элементов и отношений между ними, выделенное из среды в соответствии с определённой целью в рамках определённого временного интервала»: S def A, R, Z , SR, T , (1.1) где S – система; A,R – функциональные элементы; Z –цель; SR – среда; ΔT – временной интервал. Системе робастность, присущи следующие структурность, основные свойства: взаимозависимость, целостность, иерархичность, множественность, наличие связей. Понятие «система» играет важную роль в современной медицине, социологии, биологии и других научных дисциплинах и в практическом здравоохранении. Для большинства систем медико10 биологической, да и технической природы характерно наличие в них процессов передачи информации и управления [4,5,14,43,46,56,74]. Сложные системы характеризуются выполняемыми процессами (функциями), структурой и поведением во времени. Предполагается, что выделенное и исследуемое семейство Vр представляет собой множество индексов, и система задается на Vi как некоторое собственное подмножество, все его компоненты являются объектами. Такое определение ориентировано на исследование предельно общих свойств систем независимо от их сущности и лежит в основе общей теории систем [4,46,56]. Системы динамические принято и подразделять статические, на простые физические и сложные, и абстрактные, естественные и искусственные, с управлением и без управления, непрерывные и дискретные, детерминированные и стохастические, открытые и замкнутые. Деление систем на физические и абстрактные позволяет различать реальные системы (объекты, явления, процессы) и системы, являющиеся определенными отображениями (моделями) реальных объектов. Для реальной системы может быть построено множество систем – моделей, различаемых по цели моделирования, по требуемой степени детализации и по другим признакам. Например, реальная медицинская автоматизированная информационная система, с точки зрения системного администратора – совокупность программного, математического, информационного, лингвистического, технического и других видов обеспечения, с точки зрения врача – совокупность информации, необходимой для организации работы медицинского учреждения обследования и лечения пациентов, с точки зрения технического обслуживания – совокупность исправных и неисправных средств. Деление систем на простые и сложные (большие) подчеркивает, что в системном анализе рассматриваются не любые, а именно сложные системы. 11 При решении научных задач выделяют структурную и функциональную (вычислительную) сложность. Общепризнанной границы, разделяющей простые, большие и сложные системы, нет. Однако условно будем считать, что сложные системы характеризуются тремя основными признаками: свойством робастности, наличием неоднородных связей и целостностью. Во-первых, сложные системы обладают свойством робастности – способностью сохранять частичную работоспособность (эффективность) при отказе отдельных элементов или подсистем. Оно объясняется функциональной избыточностью сложной системы и проявляется в изменении степени деградации выполняемых функций, зависящей от глубины возмущающих воздействий. Во-вторых, в составе сложных систем кроме значительного количества элементов присутствуют многочисленные и разные по типу (неоднородные) связи между элементами. Основными типами связей считаются следующие: виды связей: структурные (в том числе иерархические), функциональные, каузальные (причинно-следственные, отношения истинности), информационные, пространственно-временные. По этому признаку сложные системы отличаются от больших систем, представляющих собой совокупность однородных элементов, объединенных связями одного типа. В-третьих, сложные системы обладают свойством, которое отсутствует у любой из составляющих их частей. Это интегративность (целостность), или эмерджентностъ. Другими словами, отдельное рассмотрение каждого элемента сложной системы не дает полного представления о сложной системе в целом. Целостность может достигаться за счет обратных связей, играющих важнейшую роль в функционировании сложной системы. Считается, что структурная сложность выделенной и исследуемой системы должна быть пропорциональна объему информации, необходимой для ее описания (снятия неопределенности). В этом случае общее количество информации о системе S, в которой априорная вероятность появления j-го 12 свойства равна р(уj), определяется известным соотношением для количества информации (энтропии) I(Y) = -р{уj)logр(уj). (1…) Это энтропийный подход к дескриптивной (описательной) сложности системы. Одним из способов описания такой сложности является оценка числа элементов, входящих в систему (переменных, состояний, компонентов), и разнообразия взаимозависимостей между ними. Для оценки сложности функционирования систем применяется алгоритмический подход. Он основан на определении ресурсов, используемых в системе при решении некоторого класса задач. Например, если функция времени вычислений является полиномиальной функцией от входных данных, то мы имеем дело с полиномиальным по времени, или «легким» алгоритмом. В случае экспоненциального по времени алгоритма говорят о его «сложности». Алгоритмическая сложность изучается в теории NP-полных задач. Сложные системы допустимо делить на искусственные и естественные (природные). Искусственные системы, как правило, отличаются от природных наличием определенных целей функционирования (назначением) и наличием управления. Подсистема (subsystem) - система, являющаяся частью более общей системы, выделенной по определенному признаку, обладающая некоторой самостоятельностью и допускающая разложение на элементы в рамках проводимого рассмотрения [4,5,14,21,76,96]. Система может быть разделена на элементы не сразу, а последовательным расчленением на подсистемы или совокупности элементов. Такое расчленение, как правило, производится на основе определения независимой функции, выполняемой рассматриваемой совокупностью элементов совместно для достижения некой частной цели, обеспечивающей достижение общей цели системы. 13 Последовательное разбиение системы в глубину приводит к иерархии подсистем, нижним уровнем которых является элемент. Элемент (element) – 1. Объект, который может быть частью целого и который невозможно или не требуется при конкретном рассмотрении расчленять на составные части. 2. Некоторый объект (материальный, энергетический, информационный), обладающий рядом важных свойств и реализующий в системе определенную функцию (функционирование) FS, внутренняя структура которой не рассматривается [14,21,46,74]. Формальное описание элемента системы совпадает с описанием подмодели а. Однако функционалы g и f заменяются на закон функционирования FS, и в зависимости от целей моделирования входной сигнал x(t) может быть разделен на три подмножества: • неуправляемых входных сигналов xi X, i = 1,..., kx, преобразуемых рассматриваемым элементом; • воздействий внешней среды nv N, v = 1, ..., kn, представляющих собой шум, помехи; • управляющих сигналов (событий) uт U, т = 1, ... , ku, появление которых приводит к переводу элемента из одного со стояния в другое. Иными словами, элемент – это неделимая наименьшая функциональная часть исследуемой системы, включающая что < х, п, u, у, FS > и представляемая как «черный ящик» (рис. 1.1). Функциональную модель элемента можно представить как y(t)= FS(х, п, и, t). Изменение любой из независимых переменных влечет за собой изменение состояния элемента системы. Поэтому в дальнейшем будем обобщенно обозначать эти сигналы как x(t), a функциональную модель элемента – как y(t) = FS(x(t)). Выходной сигнал y(t), в свою очередь, представляют совокупностью характеристик элемента уi Y, j = 1,..., ky, 14 Внешняя среда Система u(t) x(t) n(t) y(t) Элемент Fs Рис. 1.1. Элемент выделенной для исследования системы Среда (environment) – 1. То, что окружает исследуемую систему и оказывает на нее воздействие: 2. Множество объектов S' вне выделенного элемента или системы, которые оказывают влияние на элемент (систему) и сами при этом находятся под воздействием элемента (системы), SS' = . Разграничение системы и среды, практически всегда условно и оно определяется условиями, целью и задачами исследования. Правильное разграничение исследуемого реального объекта и среды является необходимым этапом системного анализа. Часто в системном анализе выделяют понятие «суперсистема» как часть внешней среды, для которой исследуемая система является элементом [4,5,7,62,66,67,92,93]. Формы связи выделенной и исследуемой системы с окружающей ее средой различны. Как минимум система имеет один вход и один выход, но их число может быть любым. В моделях кибернетических систем воздействие среды на систему описывается неуправляемыми (неконтролируемыми) и управляемыми (контролируемыми, учитываемыми) переменными. В здравоохранении, медицине, социологии и биологии могут выделяться и исследоваться как системы следующие группы объектов: объекты здравоохранения по уровням – федерация, федеральный округ, субъект федерации, город, район, больница, отделение и т.д., а предметом исследования в этих объектах - показатели качества и условия жизни, физического развития, состояния здоровья и заболеваемости, оказание 15 медицинской помощи, организация работы медицинских учреждений, деятельность медицинских кадров, вопросы экономики и др.; объекты медицины и социологии – группы (когорты) здоровыx и больных людей или отдельный человек, среда его обитания, органы и системы, ткани и клетки, а предметом исследования - классы, группы и формы заболеваний, состояние органов и систем, состав тканей и его особенности, методы обследования, диагностики, лечения, профилактики и реабилитации, динамика процессов или состояний; биологические объекты – природа, растительный и животный мир, виды, подвиды и их разновидности, род, семейство, класс и подклассы, органы, системы, ткани и клетки человека и животных, а предметом исследования – метаболические, обменные и другие процессы, происходящие в органах, системах, тканях и клетках человека и животных. Изучая основной объект медицины – человека (здорового или больного), необходимо помнить, что медицина в настоящее время определяет, обосновывает и реализует индивидуально-личностный подход к здоровому и больному человеку, поэтому при выполнении исследований необходимо: учитывать воздействие медикаментозных, вмешательств и диагностических физиотерапевтических их сочетаний на мероприятий, средств, хирургических индивидуальные физиологические (биохимические, анатомические и другие) особенности человека; накапливать индивидуальные наблюдения, группировать их и анализировать. Для оформления и понимания количественных значений, учтенных единиц наблюдения и их дальнейшей обработки принято выделять: результативный (у) и факториальный (xi) признаки объекта, или функцию и аргумент. То есть - y = f (x1, x2, x3, …, xi), где, y – результативный признак; f (1.2) - функциональная зависимость, а x1, x2, x3, …, xi - факториальные значения или учтенные единицы наблюдения. 16 В системных исследованиях при изучении здоровья населения результативными признаками будут показатели физического развития (рост, вес, окружность груди и др.) и здоровья (заболеваемость, смертность, рождаемость, инвалидность, и др.), а факториальными признаками демографические, социально-экономические, производственные и др. природно-климатические, В таблице 1 показаны примеры медико- биологических систем и их элементов. 17 Таблица 1 Примеры медико-биологических систем и их элементов Система Государственная здравоохранения Элемент системы система Системы округов Системы здравоохранения Системы федеральных округов федерации здравоохранения федеральных здравоохранения субъектов Системы здравоохранения Учреждения здравоохранения, республик, субъектов федерации краев, областей Структурные подразделения учреждений Учреждения здравоохранения, здравоохранения, республик, краев, республик, краев, областей областей Здоровые и больные люди, медицинские Структурные подразделения кадры, финансы, оснащение, оборудование, учреждений здравоохранения, процессы, методики обследования, лечения, республик, краев, областей профилактики Здоровые и больные люди Показатели здоровья, физического развития, показатели и т.д. заболеваемости, демографические Медицинские кадры Состав, специализация, навыки и др. Организм здорового (больного) Органы и системы человека человека Органы и системы человека Ткани, клетки, микроэлементы и др. Экологическая система Сообщество растений, животных Техническое устройство Элемент, функцию Наука Знания о предмете исследования Нервная система Нервное волокно Природная система Природно-ландшафтный объект Информационная система Блок информации Способ, технология, методика Операция, процедура выполняющий отдельную 18 Характеристика – то, что отражает выделенное (некоторое) свойство элемента системы. Характеристика уj задается кортежем уj = < name, {value} >, где пате – имя j-й характеристики, {value} – область допустимых значений. Область допустимых значений (интервал [а,в]) задается перечислением этих значений или принимается на основе правил вычисления (измерения) и оценки. Характеристики классифицируются на количественные и качественные в зависимости от типа отношений на множестве их значений. Если пространство значений не метрическое, то характеристика называется качественной. Например, такая характеристика, как общее состояние больного, не измеряется и является качественной. Поскольку на общее состояние больного влияют температура тела, артериальное давление, наличие боли, индивидуальные особенности организма и т.д., единственным отношением на шкале комфортности является отношение эквивалентности, позволяющее установить и описать характеристику без установления количественных предпочтений. Количественная характеристика изучаемых объектов называется параметром. Отметим, что достаточно часто в литературе понятия «параметр», «характеристика» и «показатель» отождествляются на том основании, что все их можно измерить. Но в общем случае необходимо разделять параметры, показатели и качественные характеристики, так как не всегда возможно или целесообразно разрабатывать процедуру количественной оценки какого-либо свойства. Характеристики элемента являются зависимыми переменными и отражают свойства элемента. Под свойством понимают сторону объекта, обусловливающую его отличие от других объектов или сходство с ними. Свойства задаются с использованием отношений – одного из основных математических понятий, применяемых при анализе и обработке информации. На языке отношений единым образом можно описать воздействия, свойства объектов и связи между ними, задаваемые различными признаками. 19 Существует несколько форм представления отношений: функциональная (в виде функции, функционала, оператора), матричная, табличная, логическая, графовая, представление сечениями, алгоритмическая (в виде словесного правила соответствия). Свойства классифицируют на внешние, проявляющиеся в форме выходных характеристик уг только при взаимодействии с внешними объектами, и внутренние, проявляющиеся в форме переменных состояния z, при взаимодействии с внутренними элементами рассматриваемой системы и являющиеся причиной внешних свойств. Одна из основных целей системного анализа –выявление внутренних свойств системы, определяющих ее поведение. По структуре свойства делят на простые и сложные (интегральные). Внешние простые свойства доступны непосредственному наблюдению, внутренние свойства конструируются в нашем сознании логически и не доступны наблюдению. Следует помнить о том, что свойства проявляются только при взаимодействии с другими объектами или элементами одного объекта между собой. По степени подробности отражения свойств выделяют горизонтальные (иерархические) уровни анализа медико-биологической системы. По характеру отражаемых свойств выделяют вертикальные уровни анализа –аспекты. Этот механизм лежит в основе утверждения о том, что для одной реальной системы можно построить множество абстрактных систем. При проведении системного анализа на результаты влияет фактор времени. Для своевременного окончания работы необходимо правильно определить уровни и аспекты проводимого исследования. При этом производится выделение существенных для проводимого исследования свойств путем абстрагирования от несущественных по отношению к цели анализа подробностей. Формально свойства могут быть представлены также и в виде закона функционирования элемента. 20 Законом функционирования Fs, описывающим процесс функционирования элемента системы во времени, называется зависимость y(t) = &( х, п, и, t). Существует возможность преобразования независимых переменных в зависимые с отражением поведения элемента (системы) во времени – процесс изменения состояния элемента (системы), оцениваемый по степени достижения цели его функционирования. Понятие поведения принято относить только к целенаправленным системам и оценивать их по показателям. Показатель (index figure, activity indicator )– 1. Характеристика, отражающая качество j-к системы или целевую направленность процесса, реализуемого системой. 2. Выраженная числом характеристика какого-либо свойства медико-биологического объекта или процесса [2,4,7,11,49,60,91]. Например, yi –WJ{n, х, и). Показатели делятся на частные показатели исследуемой функции (качества или эффективности) системы, которые отражают i-e существенное свойство j-й системы, и обобщенный показатель функционирования (качества или эффективности) сиcтемы YJ' – вектор, содержащий совокупность свойств медико-биологической системы в целом. Различие между показателями качества и эффективности состоит в том, что показатель эффективности характеризует процесс (алгоритм) и эффект от функционирования системы, а показатели качества – пригодность выделенной системы для достижения цели и решения задач исследования. Вид отношений между элементами, который проявляется как некоторый обмен (взаимодействие), называется связью. Как правило, в медикобиологических исследованиях выделяются внутренние и внешние связи. Внешние связи системы – это ее связи со средой. Они проявляются в виде характерных свойств системы. Определение внешних связей позволяет отделить выделенную систему от окружающего мира и является необходимым начальным этапом исследования. 21 В ряде случаев считается достаточным исследование всей системы ограничить установлением ее закона функционирования. При этом систему представляют в виде «черного ящика». Однако в задачах математикостатистического анализа обычно требуется выяснить, какими внутренними связями обусловливаются интересующие исследователя свойства системы. Поэтому основным содержанием системного анализа является определение структурных, функциональных, казуальных, информационных и пространственно-временных внутренних связей системы. Структурные связи обычно подразделяют на иерархические, сетевые, древовидные и задают в графовой или матричной форме. Функциональные и пространственно-временные связи задают как функции, функционалы и операторы. Каузальные (причинно-следственные) связи описывают на языке формальной логики. Для описания информационных связей разрабатываются инфологические модели. Выделение связей разных видов наряду с выделением элементов является существенным этапом системного анализа и позволяет судить о сложности рассматриваемой системы. Важным для описания и исследования систем является понятие алгоритм функционирования As, под которым понимается метод получения выходных характеристик y(t) с учетом входных воздействий x(t), управляющих воздействий u(t) и воздействий внешней среды n{t). По сути, алгоритм функционирования раскрывает механизм проявления внутренних свойств системы, определяющих ее поведение в соответствии с законом функционирования. Один и тот же закон функционирования элемента системы может быть реализован различными способами, т. е. с помощью множества различных алгоритмов функционирования As. Наличие выбора алгоритмов As приводит к тому, что системы с одним и тем же законом функционирования обладают разным качеством и эффективностью процесса функционирования. 22 Описание закона функционирования системы наряду с аналитическим, графическим, табличным и другими способами в ряде случаев может быть получено через состояние системы. Состояние системы – это множество значений характеристик системы в конкретный момент времени. Необходимость одновременного и взаимоувязанного рассмотрения состояний системы и среды требует определения понятий «ситуация» и «проблема». Ситуация – совокупность состояний системы и среды в один и тот же момент времени. Проблема – несоответствие между существующим и требуемым (целевым) состоянием системы при рассматриваемом состоянии среды в выделенный момент времени. Система характеризуется составом элементов, структурой и выполняемой функцией. Структура (system structure) – 1. Организация связей и отношений между подсистемами и элементами системы, эти связи отражают пространственное и временное расположение элементов, характер их взаимодействия и причинно-следственные отношения. 2. Совокупность и характер образующих систему элементов и связей между ними. В структуре системы существенную роль играют связи. Так, изменяя связи при сохранении элементов, можно получить другую систему, обладающую новыми свойствами или реализующую другой закон функционирования [7, 20,33,34,46,53,57,65,76]. Анализ взаимодействия, связей и отношений между элементами, в которых ставятся показывает, что и решаются различные различные ситуации, исследовательские возникающие в задачи, реальной действительности, весьма разнообразны и связаны они с воздействием факторов внешней внутренней среды. 23 Анализ применения методов системного анализа, позволил обосновать выбор компонент управления научными исследованиями. Обобщенная структура исследуемой системы при этом может быть представлена в следующем виде: S = <W, {M (a,f,y, (sΔt))}, P,R,L, T (sΔt),I> , где (1.3) S – система; W - интегральное свойство исследуемой системы (объекта), характеризующее ее целостность; {M} - аспекты (a), факторы (f) и условия (y), определяющие различные стороны системы (объекта) и ее изменения (sΔt) в динамике; P - иерархическая сеть подсистем и элементов системы разных уровней; R - изменения исследуемых процессов во времени; L - условия среды; T – измеренные и зафиксированные изменения состояния системы или объекта (sΔt) в динамике; sΔt – подсистема, объект, изменения за период Δt; I - информационный аспект системы (объекта) и его изменения в динамике. То есть изучаемые медицинские или биологические системы должны быть целостными. Это необходимо помнить при планировании исследования и в период его выполнения. Выделенные и описанные аспекты деятельности или функционирования исследуемых систем позволяют разрабатывать и создавать медицинские и биологические исследовательские модели. Схема системы (system structure diagram)- графическое изображение системы с помощью символов, отображающих ее элементы (подсистемы) и структуру. 24 Функция системы (system operation) - это совокупность процессов, рассматриваемых в исследуемом объекте, внешнее проявление свойств системы, определенный способ взаимодействия ее элементов с окружающей средой или с гиперсистемой (надсистемой). У любой изучаемой системы много функций; однако, почти всегда среди этого множества можно выделить одну, самую существенную для нее. Эту функцию называют главной функцией системы. К основным свойствам систем относятся: - целостность, означающая, что комплекс элементов, рассматриваемый в качестве системы, обладает характерными свойствами и поведением, причем свойства системы не являются суммой свойств ее элементов; - делимость, отражающая тот факт, что любой объект можно представить в виде элементов. Это значит, что исследуемый объект можно рассматривать как минимум в трех аспектах: как отдельную систему, как часть более общей системы (надсистемы) и как совокупность более мелких частей (элементов, подсистем). Объект (object) - выделенная по некоторым правилам часть мира, являющаяся предметом познания или практической деятельности. Свойства объекта (object property) – то, в чем рассматриваемый объект сходен с другими, сравниваемыми объектами или отличаются от них. 25 2. ПРИМЕНЕНИЕ СИСТЕМНОГО АНАЛИЗА И СИСТЕМНОГО ПОДХОДА ДЛЯ ИССЛЕДОВАНИЯ ЧЕЛОВЕКА, ОБЪЕКТОВ ЗДРАВООХРАНЕНИЯ И МЕДИЦИНЫ Системный анализ (systems analysis) - совокупность методологических принципов анализа и конструирования объектов как систем, совокупность методов подготовки обоснованных решений, методов и средств исследования сложных, многоуровневых и многокомпонентных систем, объектов или процессов; направление в методологии научного познания, в основе которого лежит рассмотрение объектов как систем; дисциплина, разрабатывающая общие принципы исследования сложных объектов; методология исследования объектов путем их представления в качестве систем и анализа этих систем. Системный анализ ориентирует исследователя на выявление всего многообразия связей в объекте и сведение их в единый пакет (систему) [4,5,14,55,56,81,96]. Принято считать, что системный анализ – это методология исследования и решения проблем, основанная на структуризации систем и количественном сравнении альтернатив. Иначе говоря, системным анализом называется логически связанная совокупность теоретических и эмпирических положений из области математики, естественных наук и опыта исследования сложных систем, обеспечивающая повышение качества изучения и обоснованности решения научной или иной проблемы. В системном анализе используются как математический аппарат общей теории систем, так и другие качественные и количественные методы из области математической логики, теории принятия решений, теории эффективности, теории информации, структурной лингвистики, теории нечетких множеств, методов искусственного интеллекта, методов моделирования. Применение системного анализа при решении научных задач дает возможность выделить перечень и указать целесообразную 26 последовательность выполнения действий, позволяющих не упустить из рассмотрения важные стороны и связи изучаемого объекта. Иногда говорят, что системный анализ – это методика, улучшающая исследовательский процесс проблемных ситуаций. В состав задач системного анализа в процессе решения научных задач входят задачи декомпозиции, анализа и синтеза. Задача декомпозиции означает представление системы в виде подсистем, состоящих из отдельных элементов. Часто задачу декомпозиции рассматривают как составную часть анализа. Задача анализа состоит в нахождении различного рода свойств системы или среды, окружающей систему. Целью анализа может быть определение закона и алгоритмов преобразования информации, задающих поведение системы. В последнем случае речь идет об агрегации (композиции) системы в один-единственный элемент. Задача синтеза системы противоположна задаче анализа. При проведении синтеза по закону преобразования строят систему, фактически выполняющую это преобразование по определенному алгоритму. При этом предварительно определяют элементы, из которых состоит изучаемая система. В рамках решения поставленной научной задачи выполняются частные исследовательские процедуры. Например, задача декомпозиции включает процедуры наблюдения и измерения свойств системы. В задачах анализа и синтеза выделяются процедуры оценки исследуемых свойств, алгоритмов, реализующих исследуемые законы преобразования. Тем самым вводятся различные определения эквивалентности систем, делающие возможными постановку задач исследования. В основе системного анализа как науки лежат определения основных понятий и принципы проведения анализа. Рассмотрим эти понятия. С системных позиций исследование - это решение сложной динамически изменяющейся задачи. Если представить эту задачу как систему, то в ней можно выделить подсистемы организационного (О), кадрового (К), 27 технического (Т), информационного (И), математического (М) и финансового (Ф) обеспечения. Пример применения методов системного анализа при изучении объектов здравоохранения, медицины и биологии показан в виде схемы на рисунке 2.1. В большинстве случаев процедура применения метода системного анализа включает: планирование, постановку или определение задачи исследования (или решения практической задачи), сбор и накопление необходимых исходных данных, построение модели, отображающей взаимосвязи реальной сложной системы, выработку прогнозов, сравнение различных вариантов решений и предложений, проведение экспериментов, проверку гипотез и заключений. Техническая основа применения методов системного анализа – ЭВМ, коммуникации и информационные системы. Понятия «система», «системный подход», «системный анализ» широко используются в ходе решения комплексных проблем. На определенной стадии развития научного знания теория систем оформилась в самостоятельную науку. В 30,-е гг. XX в. возникла теория открытых систем Л. фон Берталанфи, имеющая большое значение для управления социально-экономическими объектами. Важный вклад в становление системных представлений внес в начале XX в. А.А. Богданов, предложивший всеобщую организационную науку - тектологию. Системный анализ, как метод исследования, возник в 50-е годы ХХ века на идеях кибернетики. Он исследует категории, общие для многих дисциплин и относящиеся к так называемым системам. Признавая важность методов системного анализа для биологии и медицины, в 1980 г. в Канаде была проведена первая Международная конференция по его применению в здравоохранении [111]. Значение системного подхода и системного анализа для науки и практики остается достаточно важным до настоящего времени. 28 Предметная область Выделение объекта наблюдения, определение цели и задач исследования, задание критериев для изучения объекта и решения задач исследования Выделение системы, подсистем и элементов, подлежащих исследованию, их структуризация, установление иерархии и организации взаимодействия. Определение единиц наблюдения (счетных единиц) – составных элементов статистической совокупности, подлежащих отдельной регистрации Обеспечивающие подсистемы (О, К, Т, И, М, Ф) Вход И с с л е д о в а н и е Этапы исследования Выход Составление алгоритмов функционирования выделенных подсистем и исследуемой системы в целом Составление математической модели изучаемой системы: выделение параметров, установление зависимостей между выделенными параметрами Разбор модели функционирования изучаемой системы, позволяющей лучше понять, решить поставленные задачи и достичь цели исследования. Исследование выделенной системы ее подсистем и элементов Получение результатов, их интерпретация, достижение цели и решение задач исследования INTERNET Рис. 2.1. Схема применения метода системного анализа для изучения объектов в медицине и биологии 29 Системный анализ при выполнении медико-биологических исследований применяется в тех случаях, когда на начальном этапе отсутствуют достаточные сведения о проблемной ситуации, позволяющие выбрать метод ее формализованного представления, составить математическую модель, применив один из новых или известных подходов к моделированию. Исследователь должен представить изучаемый объект в виде системы, представить процессы его функционирования и построить модель с использованием различных методов. Построение модели, осуществленное путем последовательного выполнения выделенных и упорядоченных этапов, с рекомендованными методами или приемами представляет собой методику системного анализа. Методика системного анализа ориентирована на полноту анализа и формирования модели принятия решения, адекватно отображать рассматриваемый логистический процесс или объект. К основным характеристикам системного анализа относят категории и понятия - вход, выход, связь, структура, сложность, иерархичность, внешняя среда, функционирование, модель, процесс и некоторые другие, так или иначе характеризующие исследуемую систему. Важной характеристикой системного анализа является неопределенность, т.е. неполнота или отсутствие знаний об исследуемом медицинском, биологическом или ином объекте. На практике использование системного анализа означает процедуру принятия решений при которой отправным и основным моментом является анализ сложившейся ситуации или обстановки на момент времени ti. Для анализа сложившейся ситуации ученый или практик определяется с границами исследования и внешней системой (суперсистемой), собирает необходимые исходные сведения – первичные медицинские данные или статистические материалы о состоянии и изменениях медицинской обстановки или ситуации в исследуемом объекте (системе). Этапы применения метода системного анализа при выполнении медико-биологических исследований и их содержание показаны на рисунке 2.2. 30 Применение метода системного анализа в здравоохранении, медицине и биологии позволяет описывать объекты исследования и изучать их как: системы, существующие и функционирующие в статике или динамике за выделенный период. Например, система оказания медицинской помощи или система медицинского обеспечения отдельных групп (когорт) населения, система кровообращения, система выведения, система пищеварения, орган как система, клетка как система и др.; системы, создающиеся и развивающиеся; именно такими, в основном, являются объекты исследования в здравоохранении, медицине, биологии. Например, существующая или принципиально новая система обследования, диагностики и лечения больных; биологический или медицинский процесс как система изучения и исследования, экспертиза как система и др.; 31 1 Этап. Постановка задачи исследования. Исследование практически важных уровней воздействия Получение максимально возможной информации при минимальных затратах Дискриминация предполагаемых моделей явления Определение констант известных моделей Ограниченность пространства и времени. Отсутствие знаний о механизмах сочетанного воздействия. Отсутствие функциональных зависимостей. Особенности экспериментов на людях. Биологическое моделирование. Использование дополнительного фактора в качестве дополнительной нагрузки. Управление фактором. Сведение к задачам типа 2. Использование понятия «биофизический комплекс». Анализ априорной информации. Получение максимально гладкой и монотонной функции. 2 Этап. Планирование экспериментов. Преобразование факторов или выходов (log, a, x, 1/x). Изменение факторов от «0» или нормы к патологии. Изменение направления варьирования факторов. Выбор вида функций и учет Изменение биофизического комплекса во времени. накладываемых ограничений Последовательность факторов. Тропность факторов. Взаимозависимость процессов. Рандомизация во времени. Оптимальное расположение экспериментальных точек в Изучение временных откликов. Измерение через заданные факторном пространстве интервалы времени. Учет эффектов взаимодействия. Большой объем экспериментальных исследований. 3 Этап. Анализ моделей явления. Дорогостоящие эксперименты. Биологическая вариабельность. Неуправляемые факторы. Изменение Определение значимости Минимизация числа опытов факторов (насыщенность). уровней воздействия и появление новых на новой констант модели Ортогональность и композиционность планов. Изучение технике. Выбор и нормирование диапазонов изменения факторов Проверка информативности Проверка адекватности Определение дисперсии предсказанного значения комплекса систем организма. Выбор критериев оптимальности планов экспериментов. Неодинаковое число измерений в точках плана. Наличие качественных признаков. Учет нарушений ортогональности планов. Увеличение числа опытов. Необходимость усложнения вида модели. Выбор уровня приемлемого риска. Определение степени доверия параметрам модели. 4 Этап. Практическое приложение моделей. Наглядность моделирования. Определение порогов патологического действия комбинаций факторов. отклика Выделение значимых факторов. Проблема Дискриминация выбора с учетом различимости предсказанных значений. Вероятность стохастичности полученных моделей характеристик биофизического комплекса. Получение дополнительной информации при использовании Определение вероятности эмпирических моделей. Удобство хранения и неправильной классификации воспроизведения данных. Кусочно – гладкое моделирование. Определение степени различимости Улучшение процедур дефектов. Дискриминация сочетаний факторов с дискриминации определением возможной вероятности неправильной классификации. Методы выделения неклассифицируемых объектов. Минимизация Рис. 2.2 Этапы, принципы и особенности применения метода системного вероятности неправильной классификации. анализа при выполнении медико-биологических исследований Аналитические методы исследования поверхности 32 системы виртуальные, умозрительные; таковых еще нет, но они будут создаваться, если необходимость их создания будет убедительно обоснована. Например, перспективные системы управления, не существующие системы медицинского обеспечения предназначенные для или особого системы периода медицинского или условий, обеспечения, временно не действующие. Системный анализ характеризуют такие категории и понятия как вход, выход, связь, структура, сложность, иерархичность, внешняя среда, функционирование, модель, процесс и некоторые другие, так или иначе характеризующие исследуемую систему. Важной характеристикой системного анализа является неопределенность, т.е. неполнота или отсутствие знаний об исследуемом медицинском, биологическом или ином объекте. На практике использование системного анализа означает процедуру принятия решений при которой отправным и основным является анализ сложившейся ситуации или обстановки на момент времени ti. Применение метода системного анализа в здравоохранении, медицине и биологии позволяет описывать объекты исследования и изучать их как: системы, существующие и функционирующие в статике или динамике за выделенный период. Например, система оказания медицинской помощи или система медицинского обеспечения отдельных групп (когорт) населения, система кровообращения, система выведения, система пищеварения, орган как система, клетка как система и др.; системы, создающиеся и развивающиеся; именно такими, в основном, являются объекты исследования в здравоохранении, медицине, биологии. Например, существующая или принципиально новая система обследования, диагностики и лечения больных; биологический или медицинский экспертиза как система, развивающийся процесс как система изучения и исследования и др. 33 системы виртуальные, умозрительные; таковых еще нет, но они будут создаваться, если необходимость их создания будет убедительно обоснована. Например, перспективные системы управления, не существующие системы медицинского обеспечения предназначенные для или особого системы периода медицинского или условий, обеспечения, временно не действующих. Системный анализ в медицине и биологии – современная методология комплексного изучения и исследования медицинских и биологических объектов посредством их рассмотрения во всем многообразии связей, это способ и средство эффективного решения сложных, обычно нечетко сформулированных проблем и задач. При этом объект изучения и исследования представляется как единое целое, как набор взаимосвязанных подсистем или элементов, их свойств, качеств и т.д. Например, при изучении проблем управления здравоохранением или медициной могут исследоваться объекты в целом или их отдельные стороны, характеризующие изучаемый медицинский процесс или подсистему. Исследуемыми объектами, представляемыми в виде систем, могут быть – организация медицинской помощи населению федерального округа (субъекта федерации, района, города, предприятия или учреждения и другие). В этом случае качестве подсистем могут рассматриваться и исследоваться материальная база здравоохранения, медицинские кадры, состояние здоровья и заболеваемость населения (сотрудников), организация медицинского учета и анализа информации, индексы и показатели здоровья, организация функционирования медицинских учреждений, организация профилактики, медицинского снабжения и др. Вместе с тем отметим, что в здравоохранении главным предметом исследования должна оставаться заболеваемость. Отдельные нозологии, рассматриваемые как случаи заболеваний, дают материал для изучения природы и биологии возбудителя, реакции организма больного, защитных сил организма, клинического течения заболевания, патофизиологических изменений органов и систем человека. 34 В клинической медицине и биологии объект исследования – человек здоровый или больной, его органы и системы. Клинические исследования представляют собой область своеобразных задач выработки и принятия решений в сложных условиях или в ситуациях с неполной информацией. Главная особенность медико-биологических исследований состоит в том, что человек как объект изучения чрезвычайно сложен, а больной человек – еще сложнее. При этом значительная часть информации о больном имеет невербальный характер, ее формализация, структуризация и группировка – важные элементы исследования. Правильное применение процедур классификации, кодирования, формализации, структуризации и группировки информации, используемой исследователями, позволяет врачам лучше проанализировать, понять, усвоить, оценить и решить поставленную научную задачу. Кроме того, облегчится передача полученных (приобретенных) знаний и опыта другим специалистам. Применение метода системного анализа в биологии и медицине, требует рассмотрения исследуемого объекта (выделенной группы лиц, организма, органа, ткани, клетки и др.) как открытой системы. При этом предполагается, что успех исследования возможен только в том случае, если изучение объекта (системы) осуществляется не только внутри, но и вне его, т.е. успех исследования или решения практической задачи связан с тем, насколько удачно была выделена система в целом и ее подсистемы. Очень важным остается умение исследователя или практика распознать и выделить внешние подсистемы изучаемой системы, так как именно они обеспечивают её существование и функционирование. При этом необходимо описать связи, взаимодействия и критерии эффективности всей медицинской или биологической системы, по отношению к которым внутренняя рациональность исследуемого организма, органа, ткани, клетки отходит на второй план. Суть практического применения метода заключается в том, что организм в целом, его отдельные органы и системы функционируют как ответ на различные по своей природе воздействия со стороны внешней для себя среды. Такой подход и мышление обусловливают необходимость и вооружают ученых и практиков 35 способами применения системного подхода для выполнения исследований и организации практической повседневной работы врачей, биологов и других специалистов. Применение метода системного анализа в медицине и биологии позволяет: уточнять сложные объекты и проблемы путем их структуризации в серию элементов, последовательность состояний, подсистем или задач, взаимодействующих и функционирующих; решать с помощью медико-организационных и статистических методов известные, существующие давно или вновь появляющиеся задачи; находить критерии и коэффициенты описания и определения эффективности функционирования организма, органов и систем; детализировать цели исследования или функционирования объектов, систем и подсистем; конструировать перспективные более виртуальные эффективные и реально несуществующие или оптимизированные медицинские (биологические) системы или подсистемы. Следует отметить следующие специфические особенности такого сложного биологического объекта, как организм человека: особенности и свойства организма – результат биологических и физико-химических процессов; сложность измерения и мониторирования показателей, характеризующих состояние изучаемых объектов; недостаточность знаний в звене «объект исследования (клетки, ткани, органы и системы организма) ↔ датчик ↔ измерительная система»; трудно учитываемое влияние психофизиологических состояний человека на исследуемые показатели; невозможность неинвазивных измерений некоторых исследуемых показателей. В паспорте специальности «системный анализ, управление и обработка информации» и в ее формуле, подготовленной специалистами Министерства 36 промышленности, науки и технологий совместно со специалистами Высшей аттестационной комиссии, указано, что эта область исследований, применительно к номенклатуре специальностей научных работников, по которым защищаются диссертации, - «занимается проблемами разработки и применения методов системного анализа для изучения сложных прикладных объектов в медицине (биологии и др.), обработки информации, целенаправленного воздействия человека на объекты исследования, включая вопросы анализа, моделирования, оптимизации, совершенствования управления и принятия решений в медицине (биологии) с целью повышения эффективности и качества исследования». Содержанием функционирования этой научной выбранных объектов специальности являются «теоретические и прикладные исследования системных связей, организации, закономерностей функционирования и развития медицинских, биологических или технических объектов и процессов в них с учетом выделенных особенностей». Основным назначением или целью применения метода системного анализа является повышение эффективности исследования и управления выделенными использования объектами путем современных совершенствования технологий организации, или методов обработки информации. Значение специальности для решения научных и практических проблем здравоохранения, медицины и биологии состоит в разработке новых и совершенствовании существующих методов и средств анализа обработки информации и управления сложными медицинскими или биологическими системами, повышения эффективности надежности и качества функционирования биологических, медицинских и других систем. С развитием новых информационных технологий появилась область информатики, решающая методологические и технологические проблемы изучения, анализа, исследования и моделирования различных систем, в том числе медицинской, биологической и иной природы. 37 Для анализа систем или подсистем наиболее часто используют объектноориентированную и структурную методологию. Объектно-ориентированный подход имеет следующие преимущества: возможность распараллеливания выполнения информационно- аналитических процедур; возможность внесения изменений в алгоритм выполнения работ; возможность повторного использования программных компонентов; естественность описания процессов. Традиционный структурный подход (рис. 1), имеет в свою очередь следующие преимущества: линейность исследования этапов жизненного цикла изучаемой системы; четкое разделение данных, процессов и подпроцессов их обработки; возможность использования процедурных языков программирования; наличие механизма перехода к инфологическому этапу проектирования. К числу недостатков структурного подхода относят: трудоемкость внесения изменений в алгоритм выполнения работ; сложность моделирования и программирования; существенные ограничения возможностей сборки системы из готовых компонентов. Учитывая рассмотренные выше характеристики названных методов, считаем, что для создания модели функционирования систем или подсистем в медицине и биологии структурный подход является наиболее приемлемым. Кроме того, необходимо отметить, что моделирование поведения медицинских, биологических и иных систем становится все более эффективным средством их исследования, позволяющим при минимальных затратах ресурсов и времени получить ответы на вопросы, интересующие исследователей сложных систем, что способствует интенсификации их изучения. Системный подход (systems approach) при исследовании медико- биологических явлений и процессов – комплексное изучение проблем здравоохранения, медицины, биологии и других как единого целого с позиций 38 системного анализа. Системный подход применяют при рассмотрении и исследовании существующих систем, а также при конструировании, создании и моделировании новых (еще не существующих) систем. 2.1 Применение системного подхода, методов анализа и синтеза при изучении систем Основным биологического вопросом объекта и оценки состояния установления истины изучаемого является медиковопрос о правильности рассуждений исследователя при выполнении научной работы. Изучение вопросов функционирования систем, правильность выбора и применения методов или моделей нельзя рассматривать без учета общезначимых, правильных способов рассуждений, которые являются исключительно важными, при выполнении научных работ. Их суть заключается в том, что если истинны посылки, то истинны выводы, рассуждения и расчеты. Именно этим необходимо руководствоваться при разработке алгоритмов и программ исследования, построении логических цепочек рассуждений, развитии и совершенствовании механизмов подготовки данных, вычислений и статистического анализа при подведении итогов и оценки результатов экспериментов и НИР. Известны два типа рассуждений: первый тип - рассуждения достоверные или дедуктивные (выводы, результаты анализа, расчетов, результаты реализации диагностических алгоритмов и программ); второй тип - рассуждения правдоподобные или вероятностные. Выводы и результаты рассуждений или расчетов, полученные с помощью дедуктивного метода – достоверны, в то время как результаты правдоподобного рассуждения являются гипотетическими, верными с некоторой вероятностью. Критерием правильности дедуктивных рассуждений при установлении истины (или причины) служит следующий общий принцип: правильное рассуждение позволит получить истинные выводы и заключения при условии 39 что были истины исходные посылки. То есть правильно и полно были собраны исходные данные. Например, факторы Fi,j влияют на установление диагноза Di определяющим образом, и наоборот факторы Yk,l позволяют исключить диагноз Di . Решая задачи исследования, следует полагать и исходить из того, что логика при установлении истины состоит именно в том, чтобы по возможности наиболее полно и точно описать и исследовать состояние изучаемых систем или объектов. Затем, используя известные последовательности рассуждений - установить истину. Логика исследователя должна опираться на теоретико-познавательное понятие истинности, которое в классической логике, интерпретированной на исследуемую проблему, трактуется следующим образом: результат будет правильным (истинным, полным) тогда, когда он соответствует описываемому состоянию объекта исследования, в противном случае, он будет ложным или ошибочным. В логической семантике понятие истинности находит свое уточнение и существенным образом используется для обоснования правильности определенных способов рассуждений [3,15]. Отметим, что впервые это обстоятельство было использовано и нашло четкое выражение в логике Аристотеля. Он рассматривал в качестве стандартных форм, в которых содержится информация, 4 категории утверждений: “Все S суть P”; “Некоторые S суть P”; “Все S не суть P”; “Некоторые S не суть P”. Интерпретируем сказанное к проблемам установления истины (или выявления причинно-следственной связи) и степени влияния на исследуемый процесс тех или иных F или Y . Установление диагноза (определение информационной характеристики пациента) в процедуре оценивания состояния здоровья является важнейшим 40 этапом, подъитоживающим сбор и анализ первичной медицинской информации. В результате оценивания состояния здоровья и установления диагноза лечащий врач определяет требуемый объем медицинской помощи, необходимость и объем режимно-ограничительных мероприятий, строит различные виды прогноза, готовит экспертное заключение. Исследовательский процесс можно представить как выполнение временных последовательных или параллельных действий исследователя ( eн1 eк1, eн2 - eк2, eнn - eкn,) и нерегулярных процедур. На рисунке 2.3 показаны параллельно и последовательно протекающие исследовательские процессы при выполнении исследования. В целом формула научно-исследовательского процесса (НИП) может быть представлена следующим образом: НИП = (А,Ĕ, <), 41 где А - множество действий исследователя по проверке научной гипотезы; Ĕ – множество нерегулярных событий, < - фактор времени. П a4 a2 Рабочая гипотеза a1 0 eн1 принятие или отвержение гипотезы a3 eн2 eк1 eн3 eн4 eк2 ẽ eк3 eк4 Врем я Рис. 2.3 Схема научно-исследовательского процесса Нами рассмотрено выполнение временных последовательных или параллельных действий исследователя. Они обозначены на рисунке как eн1 eк1, eн2 - eк2, eнn - eкn, в виде отдельных модулей или элементов научно- исследовательского процесса. При выполнении исследований выделяют категории, по которым собирается необходимая информация: данные, собираемые непрерывно (timepersistent); данные, собираемые в конце определенных промежутков времени или после определенных событий (tallies); частоты (frequencies); счетчики (counters); конечные значения (outputs), по аналогии с [Богомолов]. К данным, собираемым непрерывно и данным, собираемым в конце определенных промежутков времени или после определенных событий и размещаемых в базе данных относят следующие сведения: анамнез жизни и заболевания, результаты исследований, диагнозы, результаты лечения, заключения врачебных комиссий и др.. 42 3. УПРАВЛЕНИЕ В ЗДРАВООХРАНЕНИИ, МЕДИЦИНЕ И БИОЛОГИИ Управление в здравоохранении и медицине, как системе, предполагает наличие как минимум двух сторон – управляющей (субъект управления) и управляемой (объект управления). Любая система управления, в том числе и система управления медицинскими (биологическими) объектами, представляет собой замкнутый контур. Связующим элементом контура управления является информационная система, обеспечивающая сбор, накопление и систематизацию необходимой медицинской (биологической) и иной информации. систематизация управления и Сбор информации накопление изучением (information (accumulation) объектов, систем и - collection), главнейшие подсистем ее элементы управления в здравоохранении, медицине, биологии и других областях знаний. Изучение медицинских и других процессов при проведении медикобиологических исследований предполагает изучение ситуационной медицинской обстановки (ситуации учреждении, структурном подразделении, и в оценивание медицинском отделении, подсистеме здравоохранения или любом ином исследуемом медико-биологическом или социальном объекте) на момент времени ti, путем применения современных технологий для съема интересующих исследователя показателей, их учета и регистрации, накопления информации об исследуемом объекте, анализа этой информации и выработки решений. Неразрывной составной частью лечебнопрофилактической (лечебно-диагностической) деятельности является медицинская статистика. Ее данные являются объективной информационной базой для обобщения опыта работы должностных лиц и учреждений здравоохранения в различных условиях, изучения медицинских систем, основы научного анализа и управления ситуацией. Статистическая методология – совокупность специфических приемов и методов исследования, с помощью которых вскрываются статистические закономерности характеристика и достигается объективная цифровая изучаемых явлений и процессов. 43 При осуществлении социально-гигиенических исследований или комплексного изучения человека приходится определять (выбирать) и собирать самую разнообразную информацию, т.е. составные элементы статистической совокупности. Под статистической совокупностью понимают определенное количество объединенных в одно целое однородных признаков, которые обычно варьируют или обладают изменчивым признаком. Многие элементы, объединенные в статистическую совокупность, имеют свою природу и свое конкретное качество. Примерами статистических совокупностей в медико-биологических исследованиях могут быть материалы (числовые значения или характеристики), такие как: антропометрические данные, величина пульса, артериального давления, результаты лечения и экспериментов. показатели крови, Формирование статистических совокупностей – важнейший этап медико-биологического исследования. В статистических совокупностях элементы, наряду с причинноследственными зависимостями, всегда включают компоненты, имеющие случайный характер. То есть, статистическое исследование всегда базируется на диалектической связи закономерности и случайности. Статистические совокупности всегда состоят из отдельных элементов. Основной характеристикой статистической совокупности является ее объем. Обычно, исследуется не вся статистическая совокупность, которая называется генеральной, а только ее часть или выборка, отобранная эмпирически, или из некоторых теоретических предпосылок. Для получения более четкого представления об изучаемой проблеме, определения границ и единиц наблюдения (счетных единиц) собственного исследования проводят анализ литературы отечественных и зарубежных авторов. Нередко возникает необходимость в сборе и обработке информации отчетов о деятельности лечебно-профилактических учреждений и служб здравоохранения. С целью повышения качества и эффективности исследовательского процесса (повышения качества управления этими процессами) – необходимо 44 внедрять и применять современные средства автоматизации и информатизации. Для учета и измерения выбранных показателей, необходимы соответствующие устройства съема показателей, передачи их исследователю, регистрации и включения в базы исследовательских данных (информационное пространство исследования). Примерная схема организации сбора и обработки исследовательской информации показана на рисунке 3.1. Управление (control, management) – выработка и осуществление целенаправленных управляющих воздействий на объект (систему) путем сбора, передачи и обработки необходимой информации, принятия и реализации соответствующих решений. В теории оптимальных процессов управление – совокупность управляющих параметров, переводящих систему из одного фазового состояния в другое, как правило, из менее упорядоченного в более упорядоченное состояние. 45 ПРЕДМЕТНАЯ ОБЛАСТЬ ОБЪЕКТ ИССЛЕДОВАНИЯ (больной или здоровый человек и др. объекты) Гипотеза Показатели, выделенные для съема и изучения Устройство регистрации изучаемых показателей Подтвердить или отвергнуть Наполнение БД Запрос данных База данных ИССЛЕДОВАТЕЛЯ БД других учреждений Выходная информация Обработка информации (статистический анализ) Рис. 3.1 Схема организации съема и регистрации показателей, включения их в базы исследовательских данных (информационное пространство исследования) и передачи исследователю 46 При сборе статистической информации следует особое внимание уделять качеству материала, его достоверности и полноте. Измерение - процесс присвоения чисел характеристикам изучаемых объектов согласно определенному правилу. В процессе подготовки данных измеряется не сам объект, а его характеристики. 3.1 Циклы управления в системах здравоохранения, медицины и биологии Цикл управления (cycle control) в организационных медицинских или биологических системах – промежуток времени, в течение которого последовательно осуществляется сбор информации, необходимой для решения задач управления или исследования, ее анализ, выработка решений и их реализация. Хорошо известно, что высшей формой познания действительности является научная теория, а методология, разработанная на ее основе, предназначена для достижения поставленных целей. История возникновения, становления и развития предмета и научной специальности «системный анализ, управление и обработка информации» подтверждает эту известную истину. Применение методов управления в исследованиях и практическом здравоохранении, медицине и биологии позволяет выделять следующие объекты исследования и системы: системы организационного управления, которые рассматриваются и исследуются как совокупность функционально и иерархически связанных структур (объектов) здравоохранения и медицины, коммуникаций связи, систем и средств автоматизации управления, а также подсистем сбора, накопления, обработки и анализа медицинской и общей информации; система управления «врач-пациент» заслуживает отдельного рассмотрения. В этой системе информационно-аналитическое взаимодействие 47 врача и больного осуществляется следующим образом. Изучая анамнез заболевания, жизни и жалобы, - врач опрашивает пациента, т.е. собирает информацию, накапливает ее, анализирует, принимает решения. Назначая необходимые диагностические и лечебные процедуры, врач воздействует на организм и состояние больного. Сказанное подтверждает, что в системе имеются контуры управления и циклы обследования, диагностики, лечения и др. Изучаться же и исследоваться могут не только названные системы и подсистемы, но и отдельные медицинские или медико-технологические процессы в цикле управления. При таком подходе обследование, диагностика, лечение, врачебная экспертиза и есть сбор информации, ее анализ, принятие решений и их реализация, т.е. управление процессом. На рисунке 3.2 показан алгоритм сбора клинического материала в цикле «врач-пациент» при обследовании и лечении больных мочеполовым трихомониазом. В системе «врач-пациент» существенное значение принадлежит формам регистрации информации. Традиционная форма заполнения историй болезни обеспечивает накопление значительного объема ценных медикобиологических сведений. Эти сведения накапливаются в индивидуальных медицинских картах (историях болезни), но они трудно доступны для обобщения и в исключительно малой степени используются врачами в повседневной деятельности. Хорошо известно, что в развитии заболеваний, патологических, восстановительных и иных процессов отмечается определенная последовательность. Эти процессы, в зависимости от воздействия факторов внешней и внутренней среды, протекают неравномерно, могут ускоряться, замедляться с разными временными интервалами. Кроме того, одно и тоже заболевание по-разному развивается и протекает у представителей различных профессий, лиц, проживающих в различных социально-гигиенических и климатогеографических условиях. Одни и те же методы лечения и реабилитации по-разному воздействуют на течение болезни и восстановление функций организма. Совершенно по-разному развиваются патологические процессы в зависимости от своевременности и правильности установления 48 диагноза и начала лечения, а также в случаях, когда больной строго соблюдает рекомендации врача или не лечится совсем. Считается, что все возможные состояния организма могут быть интерпретированы как точки некоторого векторного пространства, в котором протекание физиологических (патологических и восстановительных) процессов изображается траекторией. Простые математические соображения показывают, что структура отношений в биологической системе должна быть нелинейной. Это обстоятельство имеет глубокий биологический смысл, поскольку в противном случае мы не смогли бы адекватно интерпретировать факт существования состояний или в биологической состояний системе регулярного многих циклического стационарных изменения физиологических параметров. 49 Пациент Процедуры сбора анамнеза, обследования и лечения больных СБОР АНАМНЕЗА - сбор общих сведений: получение информации о возрасте, профессии, специальности, занятости и социальном статусе пациента – блок информации группы А (анамнез жизни); - сбор общих сведений о заболевании: жалобы, характер половой жизни, дата последнего полового контакта, получение информации о возможном источнике заражения и количестве половых партнеров, видах контрацепции, средствах, используемых для профилактики, и защиты от венерических заболеваний– блок информации группы B1 (анамнез болезни); - сбор гинекологического анамнеза у женщин: выясняли гинекологический анамнез (получение сведений о времени наступления и характере месячных, количестве беременностей и их разрешении, гинекологических заболеваниях) – блок информации группы B2 ( гинекологический анамнез); - сбор сведений о ранее перенесенных заболеваниях: получение сведений о ранее перенесенных заболеваниях, продолжительности заболеваний от момента появления первых симптомов до последнего обращения к врачу в настоящее время – блок информации группы B3 (перенесенные заболевания); - сбор сведений о субъективных ощущениях: болезненность, зуд, жжение при мочеиспускании, дизурические явления (частота мочеиспускания и характер позывов), наличие и характер выделений из уретры, влагалища – блок информации группы B4 (субъективные ощущения). ОБЪЕКТИВНОЕ ОБСЛЕДОВАНИЕ - при обследовании мужчин: состояние уретры (гиперемия, отек, болезненность), наличие выделений их количество и характер - блок информации группы С1 (объективный статус); - при обследовании женщин: состояние половых губ, промежности, области заднего прохода, паховых лимфоузлов, состояние слизистой влагалища, шейки матки, зева, заднего свода влагалища, прямой кишки, состояние уретры (чувствительность, плотность, наличие узлов и их плотность), степень гиперемии, наличие выделений, локализация и размер эрозий - блок информации группы С2 (объективный статус). БАКТЕРИОСКОПИЯ И КУЛЬТУРАЛЬНОЕ ИССЛЕДОВАНИЕ - у мужчин: получение патологического материала ложечкой Фолькмана из уретры перед мочеиспусканием, получение секрета предстательной железы путем массажа - блок информации группы D1 (результаты бактериоскопии и культурального исследования); - у женщин: получение патологического материала ложечкой Фолькмана со слизистой оболочки уретры, цервикального канала, влагалища и прямой кишки, материал со слизистой цервикального канала сухим ватным тампоном, соскоб со стенок - блок информации группы D2 (результаты бактериоскопии и культурального исследования). Врач Рис. 3.2 Схема сбора клинического материала в цикле «врач-пациент» при обследовании и лечении больных мочеполовым трихомониазом 50 На рисунке 3.3 показан системный взгляд на развитие процессов в шкале «состояние полного здоровья» → «болезнь» → «исход лечения». Анализ развития здоровья» → процессов «болезнь» на отрезке А → В «состояние полного → «исход лечения», позволил выявить следующие временные интервалы или периоды: Период состояния полного здоровья – на отрезке времени Д1 → Дi. - любое значение дней периода (аi ) для абстрактного человека на этих отрезках равновероятно. Исход лечения Диагностический, лечебный и восстановительный процессы Выздоровление А Состояние полного здоровья Болезнь Б Смерть А Д1 Дi а Д7 б Д10 в Д28 г Дj д В е Рис. 3.3 Развитие процессов в шкале «состояние полного здоровья» → «болезнь» → «исход лечения» Переходный период (или период предболезни) Дi → Д7, когда болезнь развивается бессимптомно (бn). Период проявления болезни, обследования и установления диагноза Д7 → Д10, появление и усиление признаков болезни, обследование и установление диагноза (вg). Период развития болезни и начала лечения Д10 → Д28, а также реабилитации, восстановления функций (или угасания) (гm) и (дt). Причем период Д28 → Дj характеризуется развитием процесса по пути выздоровления 51 и восстановления функций – луч А, либо по пути ухудшения состояния, угасания функций и смерти больного – луч Б. Период восстановления функций (гm) и (дt). Д28 → Дj, в частности развитие процесса по пути выздоровления и восстановления функций (луч А), протекает как колебательный затухающий процесс (с волнами разного порядка, отражающими ритмичность процессов в организме). Поскольку организм – многосистемная совокупность, каждая из систем будет иметь различные временные параметры формирования ответных реакций на воздействие факторов. Один и то же фактор по разному воздействует на ту или иную систему организма. Многим биологическим системам присуща экспоненциальная кривая восстановления. Процесс выздоровления при большинстве заболеваний также подчиняется экспоненциальному закону с постоянной скоростью. (Зуев,1988). 3.2 Планирование и управление выполнением научных исследований Организация исследования выбранной системы ее подсистем, элементов и процессов в медицине (биологии) включает: формулирование и обоснование рабочей гипотезы; выбор и установление показателей или единиц наблюдения, характеризующих функционирование объекта или объектов, подлежащих исследованию; учет показателей или единиц наблюдения, характеризующих исходное состояние объекта и динамику его изменения, и их регистрацию в книге учета или в базе исследовательских данных; мониторинг изменяющегося состояния объекта с заданной периодичностью; накопление и обобщение сведений и их медико-статистический анализ; интерпретация результатов; 52 подготовка выводов и предложений по оптимизации функционирования объекта (системы). До недавнего времени в научных исследованиях медицинских и биологических систем и на практике широко использовался системный подход, при котором требовалось соблюдение жестких рамок создания сетевых графиков, целевых планов, алгоритмов, аналитических целевых моделей и др., что приводило к сложностям применения методов системного, большим неоправданным и непроизводительным затратам. В последние годы наметилась тенденция применения системного информационного подхода (СИП) в научных исследованиях. Суть его заключается в сокращении времени и средств на проведение экспериментальных и научных исследований путем разработки информационных, имитационных и других моделей, позволяющих совершенно иначе организовывать и осуществлять научные исследования. Управление исследовательским процессом при использовании системного информационного подхода заключается в выполнении следующих положений: непрерывный контроль исполнения заданий (выполнения плана исследования), развивающейся или складывающейся ситуационной обстановки на объекте исследования или моделирования, учет всех ее изменений и обеспечение своевременной корректировки действий (мер), обеспечивающих достижение цели и решение задач исследования; поддержание непрерывного взаимодействия должностных лиц и медицинских учреждений, принимающих участие в обеспечении исследовательского процесса; разработка исследовательского предложений процесса, по по оптимизации организации организации работы научно- исследовательских учреждений (творческих коллективов) целью повышения эффективности выполнения исследования. Исследование процедур и процессов требует рассмотрения второго по важности элемента исследования – цикла управления. Цикл управления в 53 научных исследованиях - включает процедуры зарождения информации в объектах исследования, потоки ее по месту назначения и в исследовательскую базу данных, обобщение, анализ и интерпретацию, выработку решения, его реализацию и обсуждение. Цикл управления научными исследованиями времени, в течение которого последовательно - промежуток осуществляются сбор информации, ее анализ, выработка решения и его реализация. Такое понимание позволяет формализовать проводимые мероприятия по сбору необходимой информации, характеризующей различные стороны (аспекты) объектов исследования, анализировать эту информацию и планировать дальнейшие действия, четче выделять моменты, когда следует обратиться к руководителю для получения разъяснений по возникшим сомнениям, а также обмениваться полученной информацией в порядке взаимодействия. Цикл управления (Тцу) научными исследованиями состоит из следующих слагаемых: Тцу = ti + tj + tk + tl + tm , где ti – время получения задачи (3.1) от научного руководителя или самостоятельное осознание наличия научной проблемы или задачи, ее уяснение и выдвижение гипотезы; tj – время получения подтверждающей информации из литературы, базы данных своего учреждения и internet; tk - время сбора (поиска, добывания, получения) информации, необходимой для проверки научной гипотезы; tl – время, необходимое для математико-статистического анализа и оценки ситуации; tm – время для проверки гипотезы и принятия решения. 54 Такое толкование цикла управления, кроме того, позволяет учесть и проследить временные параметры i-го цикла при проведении исследования, выразив их формулой Ti. = T1 + T2 + T3+ T4+ T5+ T6, (3.2) где Ti – время, затрачиваемое на i-й цикл управления исследованием; T1 – время сбора первичной исследовательской информации из изучаемого объекта или системы; T2 – время передачи информации из объекта исследования, ее первичного анализа и приема в базу исследовательских данных (включения в информационное пространство исследования); T3 и T4 – время, затрачиваемое на анализ полученной исследовательской информации и ее оценки; T5 – время на принятие или не принятие гипотезы выработку решения по полученной (или накопленной) исследовательской информации; T6 – время обсуждения и консультации. Управление исследованием будет эффективным, если T(ЦУ) не превысит критического времени - T (кр). Tцу ≤ Tкр. (3.3) Tкр. – временной параметр, при котором результат решения задачи окажется ожидаемым. Планирование исследовательской деятельности (поиск научной задачи или проблемы, обучения и подготовки исследователя) - комплекс этапов и процедур, показанных на рисунке 3.4 и обеспечивающих нахождение решения r после получения информации, характеризующей объект исследования анализа 1 и ее - J. - информационное исследовательское пространство (J), научная информация, содержащаяся в различных источниках и собственно в изучаемом объекте (Jj); 2 55 - сбор и анализ информации по научной проблеме (задаче) – Кm процедуры обработки и оценки имеющейся информации (формальные, эвристические, логические); 3 - выбор альтернативы, выдвижение гипотез – V - поиск целей или реализация одной из конкретных задач исследования. По каждой научной задаче их может быть множество (m); 4 - принятие решения – L – принять или отвергнуть гипотезу, выбор альтернативы на основе установленного (выбранного) критерия из некоторого их числа; 5 - решение (r) - некоторая альтернатива, выбранная из (n) альтернатив; 6 - общее решение R по направлению выполнения исследования, состоящее из (rm) частных решений, каждое из которых результат выбора альтернативы и составление плана исследования - (Р); 7 - разработка модели и моделирование. 56 K1 L1 V1 r1 K2 V2 L2 J r2 Jj L3 K3 r3 V3 P R М rm Km 1 2 Vm 3 Lm 4 5 6 7 Рис. 3.4 Схема сбора, анализа и обработки научной информации в процессе выполнения научного исследования 57 Процесс поиска и принятия исследовательского решения – выдвижение, а затем принятие или отвержение гипотезы – выполнение комплекса этапов и процедур, обеспечивающих нахождение решения после получения информации J, т.е. преобразование: J → K → V → L→r →R→Р→М. План исследования (Р) – это комплекс мероприятий, определяемых содержанием решения (R), проведением моделирования (М) и направленных на достижение определенных или заданных целей. Задача плана исследования – заключается в обеспечении единства, преемственности и согласованности действий, направленных на достижение цели и решение задач исследования. С использованием ЭВМ, других технических средств сбора, обработки, передачи данных, новых технических средств связи и отображения исследовательской информации значительно сокращается общее время цикла управления научными исследованиями повышается оперативность и качество научных исследований в целом. Внедрение средств автоматизации дает возможность расширить объем исходной, анализируемой информации для исследователя, работающего над решением конкретной научной задачи, повысить качество анализа данных по проблеме, а также более аргументировано и качественно оценить полученную информацию. При этом схема цикла управления научным исследованием не претерпевает существенных изменений, его общее время может быть сокращено как за счет ускорения обработки учтенных данных; так и за счет сокращения времени сбора необходимой информации посредством использования современных технологий, коммуникаций и средств связи. Управление научным исследованием является важнейшей составной частью общей стратегии управления наукой. Целями такой стратегии являются: повышение специальных научных и экономических показателей деятельности научных учреждений, повышение качества и производительности труда ученых, реализация результатов исследований в необходимом объеме, достижение заданной степени удовлетворения потребностей исследователей. 58 4. МЕДИЦИНСКИЕ И МЕДИКО-БИОЛОГИЧЕСКИЕ ПРОЦЕССЫ Если системы способны переходить из одного состояния в другое, (например s1 s2 s3 … ), то говорят, что они обладают поведением, т.е. в них происходят процессы. Процессы – это последовательная смена состояний. В случае непрерывной смены состояний, процесс P можно описать функцией времени: P = S(t), А в дискретном случае множеством: P = {St1, St2,…}. В медико-биологических системах выделяют два вида процессов: Внешние процессы – последовательная смена воздействий на систему, т.е. последовательная смена состояний окружающей среды; Внутренние процессы - последовательная смена состояний системы, которая наблюдается как процесс на выходе системы. Дискретный процесс сам может рассматриваться как система, состоящая из совокупности состояний, связанных последовательностью их смены. В зависимости от того, изменяется ли состояние системы со временем, ее можно отнести к классу статических или динамических систем. В вышеизложенном, да и вообще в специальной литературе, посвященной проблемам управления и научно-исследовательских работах в области медицины и здравоохранения слово «процесс» встречается достаточно часто. Считается, что это наиболее употребляемый и наименее определенный термин. Это в полной мере относится и к понятиям «медицинский» и «биологический» процесс. Процесс (process) - 1. Прохождение, продвижение или закономерная, последовательная смена состояний, явлений, стадий изменения системы или иного объекта. 2. Последовательность изменений во времени вещества, энергии, информации в объекте. 3. Совокупность состояний системы z(t0), 2((}), ... , z{tk), упорядоченных по изменению какого-либо параметра t, определяющего свойства системы. 59 Формально процесс функционирования как последовательная смена состояний интерпретируется как координаты точки в n-мерном фазовом пространстве. Причем каждой реализации процесса будет соответствовать некоторая фазовая траектория. Процессы [6,8,20,23,44,46,73] подразделяются на управляемые и неуправляемые, детерминированные и случайные, дискретные и непрерывные. По нашему мнению содержание понятий «биологический» и «медицинский» процесс охватывает последовательность биологических или медицинских событий, происходящих в исследуемой предметной области (объекте или системе) здравоохранения и медицины за определенный промежуток времени1. Изменение за время работы на предприятии, со дня поступления и до увольнения, уровня здоровья здоровых людей (обобщенный показатель), изменение профессиональными уровня вредностями здоровья (личностный лица, работающего показатель), с изменение состояния больных, находящихся на лечении, или изменение состояния здоровья лиц, состоящих под медицинским наблюдением по поводу хронических заболеваний личностные показатели), или по другим причинам (обобщенные и изменение в течение определенного времени характеристик отдельной системы или органа, а также всех других медицинских или биологических объектов – это и есть проявление медицинских или биологических процессов. Проиллюстрировать понятие медико-биологического процесса можно на примере исследования состояния больного на протяжении 30 суток. Сделаем несколько анализов крови, мочи и будем выполнять рентгенодиагностические исследования. Их результаты будут иметь разные значения. Будет ли полученный набор значений характеризовать некоторый процесс? Без дополнительной информации это неизвестно. Если это упорядоченные по В экстремальных условиях все процессы протекают динамичнее и значимые изменения медицинских явлений, процессов или обстановки наступают за более короткие промежутки времени. Информация об их изменении должна собираться и поступать к исследователю, моделирующему соответствующие процессы с большей частотой или путем постоянного мониторирования. Очень динамично со значимыми изменениями клинического статуса больных за малые промежутки времени протекают процессы при острых интенсивно развивающихся заболеваниях. 1 60 времени (параметры процесса) значения, то – да. Если же значения неупорядочены, то соответствующий набор состояний не будет процессом. В общем случае время в модели системы S может рассматриваться на интервале моделирования (Q, Т) как непрерывное, так и дискретное, т.е. квантованное на отрезки, и тогда T = m At, где m – число интервалов дискретизации. Важное значение для анализа медико-биологических процессов имеет изучение тенденции (тренда), т.е. устойчивости и основных закономерностей изменения изучаемого динамического ряда. При проведении анализа процессов выявляют связь между временем и изучаемым явлением (показателем). Для оценки связи рассчитывают парный коэффициент корреляции (обычно линейной корреляции, где изучают связь между временем х и изучаемым явлением у и в зависимости от величины полученного коэффициента оценивают устойчивость тенденции исследуемого процесса [6,13,16,19,70,94]. Тенденция процесса и его выраженность описываются следующим выражением: у = yt +k (4.1), где yt – тенденция эволюции процесса; k – колебания, связанные с со случайными процессами или факторами. То есть при проведении медико-биологических и социальных исследований следует также учитывать возможность случайных процессов и эксцессов. Случайный процесс (random process) - вероятностный, стохастический процесс – случайная функция Х (t) от независимой переменной t, часто интерпретируется как время. То есть это такой процесс, наступление которого может наступить с определенной вероятностью и может быть различным в зависимости от случая. Случайный называется процесс мгновенные значения которого являются случайными величинами. При выполнении исследований случайный процесс следует рассматривать как множество реализаций функций Х (t), либо как 61 последовательность случайных величин Х (ti), заданных в различные моменты времени t i. непрерывными. Случайные процессы могут быть дискретными Положения случайных теории процессов или широко используются в теории массового обслуживания, теории игр и других. Организация изучения выбранных объектов заключается в разработке программы и плана исследования, решении вопросов с организацией сбора и обработки информации. Независимо от типа или группы изучаемых объектов или систем, исследование начинают с описания их начального состояния - x0=x(t0) (4.1) Далее исследователь изучает, описывает и регистрируют состояние изучаемых объектов в динамике в выделенные моменты времени ti - x (ti), с задаваемыми интервалами - x0 = U (ti)( ti ≥ t0) (4.2). Отметим, что все возможные динамические изменения в пространстве состояний объекта или системы описываются несколькими типами кривых (линейная, параболическая, гиперболическая, экспоненциальная, экспоненциально-степенная и логистическая, др.), имеющими динамическую зависимость и соответственно несколькими известными типами уравнений. В зависимости от изучаемого процесса (непрерывного или дискретного) исследуемую систему представляют в виде множества моментов времени Т, а все изменения ее состояния, происходящие в период изучения, описывают выражением Т = < t1, t2, ti, ... tn>, (4.3) где ti - состояние системы (объекта изучения) в i-й момент времени; t1 - tn - общее время наблюдения за системой (объектом изучения). Съем исследователем (или автоматизированный мониторинг) информации о системе или объекте изучения в каждый заданный момент 62 времени ti и накапливание необходимых сведений за период исследования в базах данных, позволяют получить информационное пространство исследования, которое, в свою очередь, дает информационную характеристику системы или объекта изучения. Кроме этого в моделях, как правило, оперируют следующими характеристиками медицинских процессов: N(t0), N(t1), …, N(ti). Величина N(t0) – это условия и показатели деятельности (системы) в момент времени рассматриваемого объекта t0, величина N(t1) – условия деятельности, рассматриваемого объекта (системы) в момент времени t1 и т.д., величина N(ti) – это условия и показатели деятельности, (системы) в момент времени рассматриваемого объекта ti. При этом, как правило, считают, что промежуток времени, между любыми двумя последовательными временами ti-1 и ti всегда один и тот же. В качестве интервала времени при проведении исследований может быть выбран день, неделя, декада, месяц или иной промежуток времени. Информационный процесс – процесс получения, создания, сбора, обработки, накопления, хранения, поиска, передачи, распространения и использования информации, а также обмена сообщениями, сведениями, знаниями. При переносе информации в виде сигнала от источника к потребителю она проходит последовательно фазы, составляющие информационный процесс. Восприятие или сбор определяет качественные и количественные характеристики объекта и создает его образ, который фиксируется на носителе той или иной природы (бумажном, электронном и т.п.) [8,10,35,45,57,64, 72,93]. Биологический процесс - изменение физической величины, обусловленное функционированием физиологических систем организма. При выборе физических величин для оценки текущего состояния следует 63 учитывать степени реактивности этих процессов и их времена реакции. Для регистрации процессов используются датчики, сопряжённые с измерительными преобразователями. Например, типичные времена реакций на начало таких процессов, как теплопередача (включая потоотделение) и ректальная температура, составляют порядка 10 минут, в то время как время реакции средней температуры кожи - порядка 1 минут, потребления кислорода - порядка 30 секунд, кардиосигнала - около 10 секунд [36,58,71, 23, 375, 416, 453]. Для регистрации процессов используются датчики, сопряжённые с измерительными преобразователями. Медицинский процесс на уровне лечебно-диагностического учреждения – комплекс или система взаимосвязанных научно обоснованных, необходимых технологических составляющих, выполнение которых в течении периода времени Δt позволяет наиболее рациональным способом провести обследование и лечение конкретного больного, обеспечить достижение максимального соответствия научно обоснованного идеализированного результата с реальным результатом лечения. Медицинский процесс на уровне органов управления здравоохранением и (или) главных медицинских специалистов – комплекс (система) взаимосвязанных научно обоснованных, необходимых организационно-методических составляющих, выполнение которых в течении периода времени Δtn позволяет наиболее рациональным способом организовать и провести лечение больших групп больных. В современных исследованиях медицинских или биологических процессов важную роль играет состояние информатизации, являющейся необходимым инструментом их изучения и оптимизации. Информатизация медицинских и биологических процессов в конечном итоге повышает эффективность решения задач исследования за счет использования следующих преимуществ: возможности построения открытой или условно открытой системы исследования процессов, обеспечивающей каждому исследователю доступ к информации, необходимой для изучения и совершенствования процессов, 64 определяющих функционирование объекта исследования (качество медицинского обеспечения, состояние объекта на момент времени ti и др.); изменения процедур анализа состояния и динамики медицинских (биологических) процессов и методов их познания, путем применения системного подхода и мышления; создания эффективного информационного и методического сопровождения функционирования медицинских (биологических) систем, объектов и процессов при их изучении; возможности более эффективной организации исследовательской деятельности ученых, а также врачей практиков, биологов и других специалистов; доступа к дополнительным источникам информации по изучаемой проблеме. Системное исследование медицинских и биологических процессов включает следующие аспекты: информационный - получение, сбор, обработку, анализ медицинской (биологической и иной) информации и выработка решений; модельный – разработка и реализация системы моделей оценки, прогнозирования и планирования для различных уровней воздействия, например, клеточный (тканевой, органный, системный, организменный) или оценки, прогнозирования и планирования систем управления здравоохранением или медицинской службой также по уровням; критериальный – выявление и фиксация комплекса целей, приоритетов и критериев; алгоритмический – разработка и формирование перспективных и краткосрочных планов, выработка решений, последовательность выполнения действий для получения аналитических материалов или результатов; стимулирующий – определение системы предпочтений в элементах изучаемых медицинских систем. 65 При проведении исследований систем в необходимо учитывать, накапливать и медицине или биологии, обрабатывать данные, характеризующие состояние этих систем. На рисунке 4.1 показана общая схема исследования медикобиологических процессов в современных условиях. INTERNET Поиск соответствия и взаимодействие Первичные медицинские документы или система мониторинга (военно-медицинский) Объект исследования (медицинская или биологическая система) Сбор исследовательской информации в динамике База исследовательских данных (информационное пространство исследования) Запрос на информацию Предметная область медицины (биологии, социологии) Управление исследованием Результаты медикостатистическо го анализа и преобразован ия информации Исследователь (Врач, биолог и т.д.) Рис. 4.1 Современная схема исследования медико-биологических процессов 66 Изменение в течение жизни или работы уровня здоровья здоровых людей (обобщенный показатель), изменение уровня здоровья отдельного человека (личностный показатель), изменение состояния пораженных или больных, находящихся на лечении или под наблюдением (обобщенные и личностные показатели), изменение в течение определенного времени характеристик всех других медико-биологических объектов – это и есть проявление медико-биологических процессов. Понятие «исследовательский процесс», для включения в исследовательские модели при решении тех или иных научных проблем или управления исследованиями, будет представлять собой группировку переменных, характеризующих состояние исследуемых объектов (или одного объекта) на момент времени ti, например, N = (F, Y, R) , здесь N - набор переменных, характеризующих состояние объектов исследования на конкретный момент времени и в динамике, т.е. отражающих состояние исследуемого процесса. F, Y, R – параметры исследовательского процесса. Эти положения необходимо учитывать при проведении моделирования исследуемых процессов, с целью их анализа в виде набора переменных связанных между собой. Схема, демонстрирующая сбор показателей, характеризующих изменения состояния объектов и процессов в динамике, а также траекторию поступления значимой информации, характеризующей исследуемые процессы и степень изменения состояния изучаемых объектов, показана на рисунке 4.2. 67 Траектория формируется последовательностью событий, и. Последовательность отрезков постоянства отражает последовательность состояний системы, а длительность каждого отрезка отражает время пребывания системы в соответствующем состоянии. Информация об изменении состояния исследуемых объектов Материалы исследования a, b Информация о состоянии изучаемого объекта (системы) т.е. мониторирование состояния изучаемых объектов Информация, характеризующая исследуемые процессы и степень их изменения состояния объектов или систем (Траектория исследовательского процесса) Направление изучения медико-биологических процессов. Последовательность событий и t t t t t t t t 1 2 3 4 5 6 7 8 Условные обозначения: ti 68 Шкала времени На рисунке 4.2 показана траектория поступления значимой информации, характеризующей исследуемые процессы и степень изменения состояния изучаемых объектов или систем. Траектория формируется последовательностью событий и. Под состоянием при этом понимается «физическое» состояние (например, полученные в сообщениях результаты проведенных исследований). Состояния принимают значения из дискретного множества. Таким образом, траектория описывается последовательностью из двух чисел (состояния и времени пребывания в нем). Траектория описывается результатами исследования пространства Rn, которое постоянно изменяется и развивается на основе непрерывных воздействий. Здесь под состоянием понимается «математическое» состояние в том смысле, что оно включает в себя информацию к конкретному моменту времени (кроме внешних воздействий), которая необходима для однозначного определения дальнейшего поведения системы. Математическое определение включает в себя и физическое определение, но не наоборот. Наибольшей результативности и эффективности при выполнении исследования (или управления им) можно достичь, если учитывать данные, характеризующие состояние исследуемых систем или процессов, т.е. все данные, характеризующие изучаемую систему должны быть учтены, зафиксированы. При использовании системного информационного подхода внимание исследователя переносится с элементов исследования отдельно взятой медицинской или биологической системы на микро- и макромерные информационные взаимодействия (отношения и связи) не только между ними, но и с окружающими объектами, системами и подсистемами. Принцип системного информационного подхода заключается в том, что сначала производится анализ и синтез не свойств исследуемых объектов, предметов или их элементов, а отношений (взаимодействия) внутри них и их отношений с внешней средой и внешними (по отношению к ним) объектами. 69 После классификации внутренних отношений свойств и их внешних отношений анализируются, синтезируются и исследуются свойства изучаемого объекта или системы. Исследование взаимодействия подсистем, их отношений, сравнение, анализ и синтез составляют основу системного информационного подхода в изучении всех без исключения медицинских, биологических и других процессов (явлений). Системный информационный подход базируется на исследовании и изучении конкретного объекта с его взаимоотношениями и взаимосвязями с внешними (по отношению к нему) объектами и внутренними средами. Весьма важным для обеспечения результативности и эффективности в исследовании процессов, происходящих в системах здравоохранения, медицины, биологии да и других является организация периодичности учета показателей, подлежащих обработке. Периодичность съема показателей должна обеспечивать учет данных, отражающих состояние указанных систем, а также учет изменений, характеризующих изучаемые процессы, рисунок 4.3. Состояние объекта (системы) на момент времени ti + 1 Объект исследования (медицинская или биологическая система) Устройство опроса и регистрации единиц наблюдения Получение информации о состоянии объекта (системы) на момент времени ti + 1 Заполнение базы исследовательских данных и информационного пространстваИсследовательская исследования БД поток информации состояния Исследователь Рис. 4.3. Общая схема сбора информации о состоянии объектов или систем исследования с заданной периодичностью на выделенные моменты времени 70 После определения перечня признаков, подлежащих изучению и дальнейшей математической формализованного документа, обработке, где наступает каждому этап значению составления признака (или симптому) соответствует определенное кодовое число. Кодирование, - как отмечают Н.М.Амосов и соавт. (1975), - не должно изменять семантическую силу и смысл исходных данных, то есть медицинское содержание информации. Представление информации в квантованной форме обеспечивает фиксацию степени выраженности или состояний качественных признаков и диагностически значимых интервалов количественных признаков. Если имеются два или более класса заболеваний, то численное кодирование нужно выполнить так, чтобы сохранить максимальное отличие между изображениями различных классов. Это связано с тем, что признаки несут некоторый содержательный смысл, что очень важно, так как при кодировании происходит замена реальных объектов числами (векторами). Примером может служить выборка, составленная из реальных объектов, где в один класс попали все объекты, у которых значение одного из признаков не превосходит 4, а в другой - те, у которых значение этого параметра лежит между 5 и 10. При "произволе" в кодировании можно закодировать объекты таким образом, что это очень важное для распознавания свойство, будет утеряно. Для кодирования признаков I группы область изменения каждого признака разбивается на несколько интервалов (градаций) в зависимости от требуемой степени детализации описания признака и поставленной задачи. Признаки, входящие во II группу, подразделяются на градации в соответствии с изменением их выраженности либо в возрастающем, либо в нисходящем ряду значений симптомов. Признакам III группы кодовые значения могут быть присвоены произвольно, в соответствии с принятым порядком перечисления показателей. Таким путем осуществляется построение классификационноквантифицированных шкал признаков, т.е. процедура идентификации и установления физических границ изучаемых параметров. Необходимым условием является монотонность изменения кодов при сохранении 71 максимальных отличий между анализируемыми классами (рядами данных). Находит применение как 4-градационная система, которая соответствует принятой в клинике для оценки степени выраженности (отсутствие патологического признака или норма, слабая степень, средняя степень и сильная степень проявления признаков), так используется и до 7 градаций. Последнее позволяет обеспечить также объединение в одном признаке (в виде отдельных градаций), например, различных изменений со стороны сердца (норма - 0, функциональные изменения при отсутствии шума - 2 и при наличии шума - 4, дисфункция митрального клапана - 5, органический порок сердца - 6). В качестве общего правила можно рассматривать стремление к сокращению числа кодовых чисел за счет внутренних зависимостей или формирования новых признаков. Наиболее целесообразной представляется 7балльная шкала, что позволяет продемонстрировать дискретность проявления качественных признаков. Кроме того, учет именно такого количества градаций соответствует возможностям человека по переработке информации, что сформулировано специалистами в области инженерной психологии (Miller, 1956) в виде известного закона "семь плюс минус два". Код - знак (символ) или совокупность знаков (символов) принятых для обозначения классификационной группировки или объекта классификации (Приказ Минздрава РФ от 31 июля 2000 г. № 301 “О введении в действие отраслевого стандарта “Принципы и порядок построения классификаторов в здравоохранении. Общие положения”). Кодирование - присвоение кода классификационной группировке или объекту классификации (Приказ Минздрава РФ от 31 июля 2000 г. № 301 “О введении в действие отраслевого стандарта “Принципы и порядок построения классификаторов в здравоохранении. Общие положения”). Отметим, что при решении задач исследования медицинских процессов в лечебно-диагностических учреждениях, по-прежнему, важную роль играют первичные медицинские документы, в которые регистрируются результаты функционирования изучаемых объектов или систем. 72 Известно, международные обеспечения что кроме классификации терминологические интегрируемости МКБ-10 стандарты, информационных существуют предназначенные компьютерных для систем различного назначения в общее информационное пространство, о которых исследователи и практические врачи осведомлены значительно меньше. Появление этих международных стандартов обусловлено существующими различиями в содержании и представлении медицинской информации и неоднозначностью интерпретации терминов. В этих стандартах каждому медицинскому термину соответствует буквенно-цифровой код, однозначно идентифицирующий существующими описываемый международными термин. На сегодняшний терминологическими день стандартами являются: SNOMED International (College of American PathoIogists, США); Unified medical language system (National Medical Library, США); RCC 3- Read clinical codes- система клинических кодов Рида (Центр по кодированию и классификации национальной системы здравоохранения, Великобритания). (Емелин И.В.,1997г.; ChuteC.G.,CohnS.P.,CampbellK.E.etal,1996г.; Стародубов В.И., Бреусов А.В., Бреусов Р.А., 2003) 73 5. СБОР ПЕРВИЧНОЙ МЕДИЦИНСКО-БИОЛОГИЧЕСКОЙ ИССЛЕДОВАТЕЛЬСКОЙ ИНФОРМАЦИИ Формирование статистической совокупности, т.е. сбор медикобиологической исследовательской информации, характеризующей изучаемые явления, происходит путем фиксирования собираемой информации в медицинские документы. Понятие документа в документалистике несколько специфично. Под документом понимается любая осмысленная информация, зафиксированная вне памяти человека любым способом, на любом языке и любом носителе с целью обращения (циркуляции) в динамической - изменяющейся со временем - информационной системе, называемой документальной системой [8,15]. Первичный медицинский документ – статистический формуляр, в котором по определенной схеме представлен перечень признаков, подлежащих учету и регистрации (программа наблюдения). Регистрация данных в первичный медицинский документ – начальная стадия медико-статистической и аналитической работы, цель которой - сбор исходной информации для исследования процессов в изучаемых объектах или системах [58]. В каждом документе принято условно выделять две группы учетных признаков: общие или справочные и группировочные. К справочным относят те признаки, которые позволяют установить принадлежность документа (фамилия, имя и отчество пациента, наименование медицинского учреждения, место жительства, регистрационный или порядковый номер медицинского документа и др. Группировочные признаки всесторонне характеризуют объект исследования – больного или здорового человека, подопытное животное, источник водоснабжения, очаг инфекции и т.д. Такими признаками являются пол, возраст, диагноз, величина того или иного биохимического показателя и др. В последние годы первичный медицинский документ все чаще заменяется экранными формами, сопряженными с базами медицинских исследовательских данных, в которые по установленному перечню 74 непосредственно вводятся признаки (параметры), подлежащие регистрации и учету. Собираемые таким образом первичные медицинские данные накапливаются в базах данных, обобщаются, обрабатываются исследователем по принятым алгоритмам. Отметим, что сбор объективной медицинской информации – процедура достаточно сложная, поскольку объекты современного здравоохранения и медицины, как правило, являются сложными системами, в которых непрерывно реализуется множество медицинских процессов. Медицинский процесс на множество уровне лечебно-диагностического подпроцессов, например, учреждения подпроцессы включает обследования, диагностики, лечения, экспертизы, прогноза, реабилитации, информационноаналитический и др. Способы изучения медицинских процессов и подпроцессов в поликлиниках и стационарных лечебно-диагностических учреждениях для получения сведений об изучаемых признаках (параметрах) объектов или систем предусматривают планирование исследования, его организацию, мониторинг объекта или системы (сбор информации), математический и медико-статистический анализ с выявлением особенностей объекта или системы в динамике. Методика сбора информации в медицинских исследованиях - это, как правило, заполнение медицинских документов (специальных карт или баз данных) материалами обследования, диагностики и лечения. В это время исследователь или врач-практик с определенной периодичностью последовательно опрашивает больного, изучает его жалобы, назначает диагностические и лечебные процедуры или мероприятия получает их результаты. Фактически этот период представляет собой процедуру наблюдения за изменениями в состоянии больного, динамикой лечебнодиагностического процесса, функционированием и состоянием органов и систем организма больного на конкретный момент времени ti и в динамике. В идеальном варианте – это автоматизированный мониторинг медицинских объектов или систем с автоматизированной регистрацией первичной медицинской информации (исследуемых параметров). 75 Процедуры сбора первичной медицинской информации необходимы для обеспечения: наблюдения характеризующих (мониторинга), начальное измерения состояние и изучаемого учета показателей, объекта (описание состояния изучаемого объекта); съема показателей и регистрации (желательно автоматизированной) информации, характеризующей изменение состояния больного, его органов и систем, а также результатов лечебно-диагностического процесса в медицинские документы или базы медицинских данных; накопления информации, ее последующего анализа и представления в удобной для восприятия форме на автоматизированные рабочие места врачей лечебно-профилактических учреждений; обработки и анализа для достижения целей и решения задач исследования. Под описанием состояния понимается количественное представление основных характеристик, по которым оно оценивается. Каждый объект исследования в произвольный момент времени может быть охарактеризован совокупностью характеристик, отражающих его состояние. Эта совокупность, являющаяся результатом определения значений характеристик состояния (единичное измерение или реализация), представляет собой вектор, характеризующий текущее состояние t X ( x 1, x 2 , ... , x d ) . Компонентами вектора X являются характеристики состояния, индекс d обозначает количество используемых характеристик, а надстрочная t обозначает операцию транспонирования. Некоторый класс (вид, тип и т.п.) состояния Lj может быть представлен множеством верифицированных реализаций Xj = {Xj1,...,Xjn}, где n - количество реализаций, Xj - матрица размерности dn. Матрица Xj может состоять из реализаций, полученных путем измерения характеристик 76 состояния у разных людей или у одного и того же человека в разные моменты времени. Известно [3, 317], что характеристики, описывающие класс состояния должны отражать тенденцию изменения и вариабельность. В математической статистике в качестве количественных оценок этих характеристик наиболее часто используются две величины: оценка вектора математического ожидания M j ( M j1, ... , M jd t ); оценка матрицы ковариаций S j 1 nj 1 t ( X M j) ( X M j) , X L j где Mj1,...,Mjd – выборочные средние значения характеристик класса состояния Lj; X - вектор реализации. Для случая нормального распределения значений характеристик состояния, Mj и Sj являются исчерпывающими характеристиками в смысле полноты описания состояния. Они определяют положение и конфигурацию области, соответствующей состоянию Lj в d-мерном пространстве характеристик. Вектор Mj отражает центральную тенденцию группировки характеристик, диагональные элементы матрицы ковариаций Sj - разброс их значений, а остальные элементы - взаимосвязи характеристик состояния. Описание класса состояния Lj характеристиками Mj и Sj предполагает соответствие закона распределения значений характеристик состояния нормальному закону, что требует постоянной проверки выполнимости данного предположения. В тех случаях, когда функции распределения отдельных характеристик отличаются от теоретических нормальных, возникает задача преобразования этих распределений к нормальному виду. Один из путей её решения состоит в использовании преобразующих функций вида ln x, x1/2, 1/x и других. Критериями применения трёх указанных функций являются: пропорциональность стандартного отклонения анализируемой характеристики 77 его среднему; пропорциональность дисперсии и среднего; пропорциональность квадрата среднего стандартному отклонению [430]. Опыт показывает, что найти нормализующее преобразование можно практически всегда. Но даже тогда, когда после нормализующего преобразования условие нормальности многомерной плотности распределения характеристик состояния не выполняется, как будет показано ниже, характеристики Mj и Sj оказываются полезными при решении задач диагностики состояния. [429]. Формальное описание состояния задаётся совокупностью его характеристик (параметров, индексов, показателей) – рис. 5.1. Используемые на практике способы описания состояния можно разделить на два типа: описания динамическим рядом характеристик и описания набором характеристик (табл. 5.1). При этом описания состояния медико-биологического объекта динамическими рядами характеристик, используемые в медицине, биологии и физиологии в аспекте выбора математического метода исследования можно разделить на два типа. 1. Описание динамическими рядами параметров – используется при оценивании состояния в определённый момент времени. 2. Описание динамическими рядами показателей или индексов – используется для оценивания динамики изменения состояния в течение длительного времени. Таблица 5.1 Сопоставление типов описания состояния медико-биологического объекта Размерность описания Физиологическая интерпретация характеристик Описания динамическим рядом характеристик до нескольких тысяч характеристик Описания набором характеристик до нескольких десятков характеристик одинаковая различная Показанные типы описания состояния включают все применяющиеся на практике подходы и определяют выбор метода исследования. 78 Сложность проблемы описания состояния медико-биологического объекта, отмечаемая многими авторами, связана с тем, что «реальные биологические процессы представляют собой сложную суперпозицию разнообразных динамических процессов, завуалированных друг другом и случайными возмущениями, имеющими различные законы распределения» [42, 44]. Поэтому задача выбора и применения адекватных методов для описания и оценки состояния организма или уровня здоровья стоит в числе сложнейших проблем современной науки [20, 26, 194]. Среди характеристик состояния могут быть характеристики, измеряемые в количественной, номинальной или порядковой шкалах. В самом простом случае все характеристики состояния измеряются в одной и той же шкале, но на практике для описания состояния может использоваться и несколько типов шкал измерения. Перед применением к исходным данным алгоритмов анализа их структуры всегда возникает необходимость использования предобработки, состоящей в оцифровке, нормировке и выборе метрики. Под оцифровкой подразумевается приведение всех типов характеристик состояния к одной количественной шкале [184]. В самом простом случае дихотомической шкалы, когда характеристика может принимать значения «да» или «нет», нет большой разницы какие числа будут приписаны положительному или отрицательному ответу. В случае порядковых шкал, как правило, порядок следования градаций характеристики отражает степень усиления или ослабления той или иной особенности состояния. Числовые метки характеристике в этом случае присваиваются так, чтобы расстояния между двумя отметками интуитивно соответствовали разнице между градациями. Например, если характеристика состояния измерена в шкале «плохо – никак – хорошо», то градациям характеристики состояния логично приписать метки {1; 0; 1}, а в случае использования шкалы «малый – средний – крупный – сверхкрупный» более уместно использовать логарифмические метки, то есть {0,1; 1; 10; 100}. Выбор «начала отсчёта» шкалы характеристики состояния большого значения не имеет, но психологически удобнее измерять в числовой шкале с отрицательными и положительными числовыми метками качество, меняющееся от 79 противоположности к противоположности (как «плохо – хорошо»), а в шкалах с «абсолютным нулём» измерять постепенное нарастание какого-либо качества (как «отсутствие – частичное присутствие – полное присутствие»). В настоящее время исследований процессов оценки методическое обеспечение многих научных состояния базируется на медико-биологических использовании объектов методов или многомерного статистического анализа (регрессионный, дискриминантный, кластерный и факторный анализ) [14, 38, 44, 59, 103, 118], анализа временных рядов [121, 312, 315], а также теории вероятностей [142, 225, 233]. С момента начала разработки математического обеспечения медико-биологических исследований состояния человека (60-е-70-е годы ХХ века) именно с развитием таких подходов были связаны наибольшие надежды решении задач оценки состояния, но постепенно были выявлены и многие ограничения этих классов формализаций. Сегодня чётко определены место и роль статистических методов, созданы мощные пакеты прикладных программ; - и везде, где это возможно, конечно же, рационально эти средства применять. Но не во всех ситуациях это удается сделать одинаково эффективно. В частности, выявились проблемы, связанные с необходимостью обработки данных в более слабых шкалах (номинальных и порядковых) - тех данных, которые интуитивно относятся к качественным, но без которых трудно представить себе многие области знаний, достижения которых используются при оценивании состояния (медицину, психологию, социологию, экологию и т.д.) [232]. Осознание того факта, что во многих ситуациях человека необходимо рассматривать как своеобразный измерительный прибор, породило ряд новых разделов математики – теорию экспертных оценок, многомерное шкалирование, непараметрический статистический анализ, конфлюэнтный анализ, квалиметрию и др. Получаемые в рамках новых подходов оценки не требуют выполнения довольно жёстких базовых ограничений (например, равенство ковариационных матриц характеристик состояния для различных состояний; соответствие закона распределения множества описаний состояний нормальному закону и т.п.), характерных для классических моделей. 80 Развитие сдерживалось математического ограничениями, обеспечения налагаемыми на оценки объём состояния вычислений, производимых при оценивании состояния и объём физической памяти необходимо было решать дилемму: (оперативность диагностики состояния) (аппаратная сложность диагностики). Названные ограничения, в результате развития информационных технологий, были практически сняты только к середине 90-х годов прошлого века. Это позволило решить ряд сложных задач, относящихся, как и задачам оценки состояния медико-биологических объектов [2, 55, 83, 95, 114, 198, 309, 318, 338, 358, 422, 439, 446]. Однако комплексных системных исследований применимости названных методов к решению задачи оценки состояния человека не проводилось, хотя отдельные результаты успешного решения задач оценки состояния на базе таких методов описаны в литературе [367, 483, 523]. Поэтому совершенствование математического обеспечения оценки состояния человека за счёт использования достижений современной математики и информатики является весьма актуальным. Начальное состояние (initial state) – состояние объекта в момент времени, принятый в качестве начального для изучения рассматриваемого процесса. Конечное состояние (final state) - состояние объекта, соответствующее завершению рассматриваемого процесса. Данные, собираемые в конце времени моделирования: количество обслуженных пациентов, среднее время нахождения пациента в различных подразделениях лечебного учреждения Состояние исследуемого объекта или системы описывается данными Данные (data) – сведения о состоянии объекта, системы или ее элементарной части, представленные в формализованном виде и предназначенные для обработки. Нужно отметить, что современные исследователи все больше отходят от проблем «ручной записи», группировки, сводки, обработки собранных материалов или результатов медико-биологических исследований и оказываются перед задачей выбора методов (или пакетов прикладных программ), которые позволят им вводить исходные данные с минимальными затратами времени и сил, осуществить математико-статистический анализ и получить результат в удобном для подведения итогов виде. 81 Общая исследования схема в получения информации современных условиях о состоянии предполагает объекта выполнение последовательного перехода от регистрации физиологических процессов к показателям состояния (рис.5.2.). Корректное формирование массива исходных данных и выбор адекватного подхода к получению оценки качества выбранного математического обеспечения оценки состояния человека существенно определяют результат исследования. Исходные данные, имеющиеся в распоряжении врача исследователя , представляют собой выборки – наборы описаний состояний с указанием оценки текущего состояния человека (гетероассоциативные выборки) или без указания такой оценки (автоассоциативные выборки). Кроме того, для получения оценки качества выбранного метода оценки состояния человека задается контрольная выборка (отличная от обучающей совокупность наборов описаний состояния). При наличии гетероассоциативной выборки требуется построить такую оценивающую процедуру, которая обеспечивала бы максимальное совпадение рассчитанных оценок состояния с оценками, указанными в контрольной выборке. При наличии автоассоциативной выборки задача построения математического обеспечения диагностики состояния сводится к последовательному решению задач классификации состояний, интерпретации выделенных классов с помощью врачей-экспертов и построения оценивающих процедур. 82 Методы получения информации о состоянии объекта исследования Прямые Косвенные Физиологический процесс Регистрация Сигнал Оцифровка Параметр Функциональное преобразование Индекс Нормирование Показатель Описание состояния объекта исследования FS x1 , ... , xn , FS где – вектор характеристик состояния; n – число используемых характеристик состояния; xi – характеристика (параметр, индекс, показатель). Рис. 5.1. Общая схема получения информации о состоянии объекта исследования 83 Достоверность обеспечивается достаточным числом наблюдений, правильно организованном статистическом анализе, правильной группировке собранных в процессе исследований материалов. Для определения степени достоверности результатов статистического исследования для каждого относительного показателя и для каждой средней величины вычисляют средние ошибки этих величин. Величина средней ошибки показывает в каких пределах может изменяться размер статистического показателя или средней величины в зависимости от влияния учтенных причин. При сборе исходных данных необходимо обеспечивать их однородность, репрезентативность, достаточность и отсутствие аномальных примеров (элементов выборок). Однородность исходных данных обеспечивают выполнением следующих условий: исходные данные должны получаться применительно к объектам исследования и обоснованно объединяться в анализируемые группы; методы получения одинаковых характеристик состояния у разных объектов исследования должны быть идентичны; одинаковые характеристики состояния разных объектов исследования должны быть измерены в одних и тех же единицах. Репрезентативность исходных данных - представительность. Количественно оценить репрезентативность исходных данных в общем случае не представляется возможным, поэтому вопрос её обеспечения целиком лежит на специалисте, формирующем исходные данные. Достаточность исходных данных предполагает обеспечение такого их количества, на основании математической обработки которого можно сделать вывод о наличии общих, для анализируемой группы обследуемых, закономерностей. Вопрос о достаточности исходных данных должен решаться при выборе математического метода диагностики состояния. Например, при использовании распознающих методов статистической классификации требуется, чтобы количество исходных данных (примеров) превосходило 84 произведение числа классов (типов, видов) и числа характеристик состояния [9, 10, 36, 489, 490]. «Классификация- это метод обобщения. Можно с успехом использовать несколько классификаций; клиницист, патологоанатом и юрист, каждый со своей точки зрения, могут с полным основанием классифицировать болезни и причины смерти таким образом, который будет наиболее всего способствовать решению изучаемого вопроса и поможет прийти к общим выводам.» [111]. Классификация - разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами (Приказ Минздрава РФ от 31 июля 2000 г. № 301 “О введении в действие отраслевого стандарта “Принципы и порядок построения классификаторов в здравоохранении. Общие положения”). Классовый интервал - промежуток значений количественной переменной, который образует отдельную группу (класс) значений для построения кривой частотного распределения. Классификатор - официальный нормативный документ, принятый в установленном порядке, представляющий собой систематизированный свод кодов и наименований объектов классификации (Приказ Минздрава РФ от 31 июля 2000 г. № 301 “О введении в действие отраслевого стандарта “Принципы и порядок построения классификаторов в здравоохранении. Общие положения”). В общем случае задача классификации заключается в нахождении такого разбиения объектов на классы, при котором показатель качества классификации принимает экстремальное значение. Формальная постановка задачи имеет вид k Q ( ; d X X C j i) i 2 X jk i где Q – extr , показатель качества классификации; extr – экстремум (минимум или максимум); k– число классов состояний; вектор X – характеристик классифицируемого объекта 85 (описание текущего состояния индивида); XC i – вектор характеристик, определяющих центр i-го класса. d– метрика, определяющая расстояние между точками в пространстве характеристик состояния. Для решения задачи классификации необходимо установить правила отнесения объекта классификации к одному из нескольких классов на основании определения некоторого числа его характеристик и построить описания этих классов. Отнесение объекта к одному из классов с известным описанием называют идентификацией объекта. С помощью методов кластерного анализа однородные группировки выявляются на основе анализа расстояний между объектами. Разработано большое число алгоритмов формирования однородных группировок, поэтому можно рассчитывать на успешность применения этого подхода при решении задачи синтеза математического обеспечения состояния. Решение задачи кластер-анализа предусматривает выполнение следующей последовательности этапов (шагов): 1. выбор меры близости между объектами; 2. выбор подхода к выделению кластеров (стратегии кластеризации); 3. выбор типа алгоритма кластеризации; 4. выбор признака формирования кластера. Первым этапом решения задачи классификации является выбор меры близости между классифицируемыми объектами - метрики. Метрика - это количественная мера различия, удовлетворяющая четырём требованиям: неразличимость идентичных объектов; различимость нетождественных объектов; симметрия; неравенство треугольника [321]. Решение задачи классификации предполагает построение правила отнесения объекта классификации (описания состояния человека) к одной или нескольким группам (классам, категориям, таксонам) и описание выделенных классов. Отнесение объекта к одному из классов с известным описанием называется идентификацией объекта. 86 Для выбора метода выделения классов объектов был проведён анализ существующих подходов к формированию однородных групп (классов) объектов [176, 321], в результате которого выделены 4 группы методов (рис. 5.2). Методы Вероятностностатистические выделения классов Структурные (геометрические) объектов Вариационные (нормативные) Нейросетевые Рис.5.2. Подходы к выделению классов объектов. Вероятностно-статистические методы (методы разделения смесей) предполагают выполнить разделение смеси распределений - по имеющейся выборке объектов, являющихся смесью представителей генеральных совокупностей известного параметрического вида построить статистические оценки для компонентов смеси, их удельных весов (априорных вероятностей) и параметров, их определяющих. Структурные (геометрические) методы предполагают выделение геометрически компактных пространственно разнесённых групп объектов с помощью разбиения пространства объектов на естественные скопления (плеяды). Вариационные (нормативные) методы заключаются в разделении исходного пространства объектов на классы по некоторому правилу, основанному на различии интервалов (диапазонов) изменения значений характеристик классифицируемых объектов в разных классах. Нейросетевые методы заключаются в настройке искусственных нейронных сетей таким образом, чтобы при предъявлении «близких» объектов генерировались «близкие» выходы нейронной сети. При решении задач исследования, исходными данными может быть совокупность объектов, описываемых набором характеристик (в большинстве случаев, показателей или индексов). При этом исследователь для решения задач, поставленных в научной работе, выбирает наиболее приемлемые подходы для выделения однородных групп изучаемых объектов. 87 88 6. БАЗА ИССЛЕДОВАТЕЛЬСКИХ ДАННЫХ Весьма важным элементом в современных исследованиях является база собираемых данных. Анализ литературы и опыт выполнения научных работ показывают, что промежуточные результаты исследований представляются, собираются и содержатся в виде матриц (таблиц) или векторов; сигналов, регистрируемых в автоматизированном режиме в аналоговой или иной форме; графических изображений; дискретных сигналов, поступающих с приборов, аппаратов или устройств; информации, регистрируемой в базы данных (БД) непосредственно в ходе наблюдения или эксперимента. При планировании научной работы задача врача-исследователя заключается не только в подготовке исходных данных, но и правильной организации базы исследовательских данных. Системность подхода при разработке базы исследовательских данных предусматривает учет потребностей в информационном ресурсе всех пользователей и решаемых ими информационных и расчетных задач, моделей на выделенном уровне исследования и системы в целом. Выполнение этого требования достигается выбором такой методологии построения базы данных, которая обеспечивала бы правильный учет информационных потребностей на возможно более раннем этапе ее проектирования. Информационное единство хранящихся в базе данных, предусматривает однозначность их представления и понимания всеми исследователями на всех объектах конкретной системы и взаимодействующих с ней системах. Это требование обеспечивается полной документацией, средствами ведения диалога, наличием словарей, классификаторов и т.п. Исследуемые объекты предметной области должны быть адекватно описаны и отражены в базах исследовательских данных. Адекватность отражения предметной области в базе данных означает, что собранные сведения (реальные свойства и связи объектов) соответствуют исследуемым объектам и предъявляемым к ним требованиям. Адекватность зависит от многих факторов. В первую очередь можно выделить такие как старение и неполнота информации, наличие неверной информации. 89 Реализация базы данных должна удовлетворять требованию оперативности, то есть позволять обслуживать пользователей за время не более допустимого. Выполнить это требование можно, выбрав наиболее подходящую модель данных, спроектировав структуру данных с учетом частоты запросов различного типа и разместив данные в соответствии с частотой обращения к ним. Требование соответствия базы данных уровню предполагаемой подробности означает, что объем и характер хранимых данных на каждом уровне не должен превышать потребностей в них пользователей базы данных. Требование единства источника информации предполагает, что в базы данных различных уровней должна поступать информация из одних и тех же источников. Это обеспечивает ее правдивость, адекватность и достоверность. В базе данных должна быть обеспечена независимость данных от обрабатывающих программ: изменение задач и моделей, их включение или исключение не должно приводить к изменениям в структуре базы данных, которая должна меняться только при изменении предметной области. Минимальная избыточность информации достигается за счет сокращения дублирования данных, которое при неодновременном обновлении данных приводит к их противоречивости и нарушению адекватности отражения предметной области. Однако это требование не может быть абсолютным, так как некоторая избыточность информации может быть полезна для контроля ее достоверности, повышения оперативности алгоритмов и в ряде других случаев. Информационное и программное обеспечение базы данных должно поддерживать целостность и непротиворечивость данных в ней. Физическая целостность базы данных предусматривает защиту информации от физического нарушения, а логическая - от несогласованных и некорректных действий пользователя. Это требование обеспечивается разработкой алгоритмов и программ обмена данными между источниками данных и потребителями, между взаимодействующими базами данных, надежным контролем целостности и непротиворечивости информации на различных этапах обработки информации. 90 Информатизация научных исследований связана, прежде всего, с необходимостью внедрения новых технологий в практику планирования и выполнения работ, поиска, накопления и хранения научной информации, управления исследованиями, обучения и подготовки кадров. Основными элементами новых информационных технологий, применяемых при выполнении научных исследований, являются: локальные сети с базами данных, компьютерные системы передачи и получения электронных сообщений, которые упорядочивают создание документов, регулируют доступ к ним и управляют документооборотом, использование средств мультимедиа, электронной почты, системы электронной доставки документов, видеоконференций и др. [25,32,39,58]. Локальные компьютерные сети, несмотря на возможность их взлома, интенсивно развиваются и внедряются. Их эксплуатация обеспечивает ускоренное проведение вычислительных операций и значительно облегчает исследовательскую деятельность. Широкое применение паролей, шифрование, кодирование и другие средства ограничивают случайное вторжение, несанкционированный доступ, случайную или умышленную порчу данных. К защитным способам относятся и такие, как использование своих линий связи и применение нестандартных протоколов. Число внедренных и успешно эксплуатируемых медицинских информационных систем в учреждениях здравоохранения продолжает расти. Большая их часть разработана и реализована на основе наиболее современной распределенной архитектуры, с использованием локальных сетей персональных компьютеров и отдельных подсистем. Оснащенность научно-исследовательских учреждений средствами современной вычислительной техники постоянно растет. В настоящее время, практически все исследователи, имеют возможность в полной мере использовать все возможности компьютерных технологий при планировании и выполнении исследований. Имеют возможность использовать INTERNET и работать с базами данных учреждения и собственными базами данных, разрабатываемых для выполнения исследования. Вместе с тем, несмотря на 91 широкое внедрение новых информационных технологий и средств автоматизации в исследовательскую практику, регистрация результатов в таблицы (на бумажных носителях или электронные) продолжает оставаться одной из наиболее распространенных форм сбора, накопления и хранения данных. Аналоговая форма регистрации исследовательских данных является наиболее естественным и оптимальным способом представления непрерывных процессов, происходящих в медико-биологических объектах. Обычно, в такой форме регистрируются сигналы, отражающие: состояние, исследуемые характеристики и параметры здорового (больного) человека; динамику изменения состояния объекта исследования; параметры среды; параметры функционирования системы или объекта (процессы деятельности). Для сбора, накопления и количественной оценки регистрируемых сигналов важное значение имеют границы исследования, т.е. длительность отрезка времени (процесса), подлежащего изучению и анализу, а также частота квантования сигнала, частота отбора материала. После завершения процедур обработки информации исследователь должен организовать хранение первичных документов, содержащих ценную информации об обследуемых лицах (объектах). Следует также организовать хранение материалов баз данных, так как собранная информация используется как правило не полностью и может потребоваться проведение новых исследований для проверки, уточнения или продолжения исследований. Собранные в базы данных материалы могут потребоваться для решения других научных задач. Изучение пространственно-временных характеристик исследуемых объектов осуществляют путем применения графических форм регистрации исходной и промежуточной исследовательской информации. К новым формам пространственного анализа относят технологии географических 92 информационных систем (ГИС), которые все шире используются в медикобиологических исследованиях. Компьютерная техника, имеющаяся в распоряжении исследователей, требует грамотного ее применения, максимального использования достижений новых информационных технологий (НИТ) при выполнении исследований, поиска и применения, зарекомендовавшими наряду себя с известными методов методами, информатики, хорошо статистики, математического, информационного, имитационного моделирования. То есть исследовательская деятельность должна совершенствоваться и соответствовать расширяющимся возможностям вычислительной техники. К сожалению, на практике, зачастую, получается как раз наоборот. В этой связи, считаем необходимым отметить, что улучшаться и обновляться должна организация обучения аспирантов и адъюнктов, а в системе подготовки и переподготовки кадров - врачей практиков и биологов, должны присутствовать вопросы методологии системных медико- биологических исследований, вне зависимости от того занимаются обучаемые научно-исследовательской деятельностью в настоящее время или нет. Должны совершенствоваться модели, создаваемые для исследования медико- биологических систем, а алгоритмы и программы, как интеллектуальная составляющая исследований должны использовать достижения НИТ и соответствовать всем современным возможностям вычислительной техники. 93 7. ИНФОРМАЦИОННОЕ ПРОСТРАНСТВО ИССЛЕДОВАНИЯ Вся совокупность информации, характеризующей объект изучения, доступной и используемой ученым для достижения цели и решения задач исследования, представляет собой так называемое информационное пространство исследования (ИПИ). Многомерное пространство (multidimensional) – пространство, имеющее множество измерений. руководящие и обследования, измерения Источниками наполнения нормативно-методические и изучения ИПИ документы; объектов, являются: результаты результаты научных исследований, отчеты, оперативные сводки, донесения, распоряжения; документы первичного учета; результаты решения задач в автоматизированных системах медицинского, биологического или иного назначения; базы данных, базы знаний; нормативно-справочная информация, классификаторы; архивы; документы, поступающие из внешних источников, информация внешних баз данных и др. Информационное пространство (information space) - 1. Множество всех возможных наборов сведений из исследуемой предметной области, потенциально доступных пользователям. 2. Вся совокупность информации, характеризующей объект изучения, доступной и используемой ученым для достижения цели и решения задач исследования. При этом каждый набор сведений является вектором или точкой информационного пространства. Размерность информационного пространства равна числу всех рассматриваемых, изучаемых и учитываемых показателей, характеризующих объекты исследования. Исследования, выполняемые еще несколько лет назад, также опирались на объективно здравоохранения, существовавшее тогда медико-биологических информационное пространство учреждений, отдельных исследователей и конкретных научных исследований, но тогда практически крайне редко собранные для выполнения исследования материалы назвали информационным пространством исследования. Это объясняется тем, что в то время: 94 отсутствовали единые правила и порядок формирования, организации, хранения и использования научно-исследовательских медико-биологических информационных ресурсов; была недостаточно упорядочена информация, циркулирующая в базах данных, информационных системах научных учреждений и системе управления научными исследованиями из-за отсутствия корпоративных сетей и INTRANET; был несовершенным механизм доступа (или его не было вовсе) к информационным ресурсам других научных и практических медикобиологических учреждений через INTERNET; нарушались принципы однократности ввода информации; отсутствовала (или была слабой) информационная совместимость имеющихся и разрабатываемых информационных систем (включая и ИС научных учреждений) медицинского и медико-биологического назначения; полностью отсутствовали автоматизированные информационные системы, предназначенные для исследований в медицинской (медикобиологической) области, для управления научными исследованиями, для работы медицинских научно-исследовательских учреждений, для ученых, решающих те или иные научные задачи. Современное состояние науки и техники позволяет утверждать и с уверенностью говорить о возможности создания (создания и использовании) информационного пространства научных исследований, представляющего собой автоматизированный аналог усовершенствованного и упорядоченного информационного научно-исследовательского пространства, входящего в качестве одной из важнейших составляющих в единое информационное пространство отдельного учреждения здравоохранения России (региона, города и т.д.), обладая при этом определенной самостоятельностью ввиду специфики и особенностей, содержащейся в нем информации. Информационное пространство исследования - это специальным образом организованная (упорядоченная) информация или совокупность всей информации, доступной исследователю и используемой им при выполнении научных работ. В то же время информационное пространство исследования это взаимосвязанные информационные ресурсы (или информационные поля) с 95 общими правилами их формирования, унификации, обобщения информации, ее хранения, распространения и использования. При планировании выполнения научных работ, на основе проведенного анализа выполненных аналогичных медико-биологических исследований и существующих баз данных здравоохранения (баз данных медицинской службы ведомства, учреждения, геоинформационных систем, систем мониторинга и связи), реализующих функции сбора, обработки, анализа и представления информации - определяются соответствующие информационные поля для размещения информации, необходимой для выполнения планируемого исследования, и организации доступа к ней. Информационное структурироваться пространство различными научных способами. исследований Например, по может предметным областям, научным специальностям, учреждениям, ведомствам и др. Реализация исследований передачи, принципа позволит накопления, исследовательских информационного пространства научных унифицировать процессы сбора, обработки, хранения учреждениях и анализа с информации использованием в научно- персональных компьютеров, баз данных научных учреждений, сетевых и канальных ресурсов разрабатываемой и создаваемой корпоративной сети. Внедрение достижений информационных технологий в повседневную деятельность должностных лиц научных учреждений и органов управления наукой существенно повысит качество информационной поддержки всех выполняемых научных исследований и решений повысит эффективность функционирования системы управления выполнением научных исследований. В изученных Концепциях и научных статьях [35,93,99] по проблеме отмечено, что в настоящее время существует множество подходов к интеграции информационных ресурсов научных учреждений, здравоохранения и медицины. Однако для масштабного объединения различных информационных ресурсов (создания единого информационного пространства научноисследовательской информации, результатов исследований и итогов работы практических учреждений здравоохранения) и использования этого объединения при выполнении научных исследований, существуют лишь методологические основы и некоторые практические наработки. 96 8. МОДЕЛИ И МОДЕЛИРОВАНИЕ Какой бы привлекательной ни была выдвинутая гипотеза, она будет отвергнута, если не сможет выдержать количественной проверки на модели. Целью моделирования является математическое описание изучаемых процессов. При этом исходят из того, что всякая реальная система, например здоровый или больной организм, состоит из большого числа взаимосвязанных подсистем. Выделение и рассмотрение систем при решении научных задач более полно и точно можно пояснить на основе понятия модели. Например, А и В– два произвольных множества. Функция f, однозначно ставящая в соответствие каждому элементу а А элемент f(а) В, называется отображением множества А в множество В и обозначается как f:A→B или A B .. f Элемент f(а) = b называется значением элемента; а при отображении f, или образом а; А – область определения, В – область значений отображения f. Если есть элементы bj В, не являющиеся образом никаких элементов аi А, то отображение f называется отображением A «в» В. Если f(A) = В, то отображение f называется отображением A «на» В. Функция f–1(B) – множество элементов из А, образы которых принадлежат В, называется прообразом множества В, т.е. f–1(B)={аА|f{a) В}. В общем случае f–1 может не быть отображением «в» или «на» А, так как функция f–1 может быть неоднозначной. Отображение f называется взаимно однозначным, если каждый элемент множества В является образом не более чем одного элемента из А. Отображение множества А на (в) В называется гомоморфизмом множеств, если выполняется условие {а1, а2,..., ак) (f(a1,), f(a2), ..., f(ak)), где at А, F(аi) В.. Изоморфизм множества А на В является взаимно однозначным гомоморфизмом, т. е. (а1, а2,... ,ак) А (f(a1,), f(a2), ..., f(ak)) B. 97 Введенные понятия позволяют определить модель как изоморфизм А в , где А – множество фиксированных элементов предметной области с исследуемыми связями, отношениями между этими элементами, – абстрактное множество, задаваемое кортежем = <{М}, Р1.,Р2,....,Рn>, где {M} P1, Р2,....., Рn (1.1) – множество элементов модели, соответствующих элементам предметной области, называемое носителем модели; – предикаты, отображающие наличие того или иного отношения между элементами предметной области. Предикат – это логическая n-арная функция, определенная для предметной области и принимающая истинное, либо ложное значение. Предикаты называются сигнатурой модели . Носитель модели определяется содержательной областью предикатов P1, Р2,..., Рп . Выбор носителя и сигнатуры при построении модели определяется предметом исследования. Уточним теперь понятие модели, ориентированное на задачи декомпозиции, анализа и синтеза системы, т.е. на проведение преобразования a → b Рассмотрим еще один важное условие, необходимое для построения моделей систем. Принято считать, что система с управлением, имеющая входной сигнал x(t) и выходной сигнал y(t), может рассматриваться как преобразователь информации, перерабатывающий поток информации (исходные данные) x(t) в поток информации (решение по управлению) y(t). В соответствии с типом значений x(t), y(t), z(t) и t системы делятся на дискретные и непрерывные. Рассмотрение этого условия проводится для выбора математического аппарата моделирования. Изменения состояния этих систем происходят не непрерывно, а в дискретные моменты времени, по принципу «от события к событию». Математические (аналитические) модели заменяются на 98 имитационные, дискретно-событийные: модели массового обслуживания, сети Петри, цепи Маркова и др. 8.1 Модели и методы в медико-биологических системных исследованиях Опыт планирования и выполнения научно-исследовательских работ показывает, что очень часто при их выполнении эксперименты ставят не над интересующими исследователей объектами (предметами) или системами, а над их моделями. Моделирование и статистический анализ многомерных медико-биологических систем, описанных выделенными (выбранными) параметрами, оцениваются количественно по интервальной (или порядковой) шкале в базе данных наблюдений и осуществляются методами корреляционного, регрессионного или факторного анализа. При этом, если выходные параметры оцениваются количественно, а входные - качественно по номинальной шкале, то их моделирование выполняется методом дисперсионного анализа. Отметим также, что ученые и специалисты - практики при выполнении исследований сталкиваются со сложностями разработки моделей и выполнения моделирования, постановки и проведения экспериментов в системе или над системой. Сложности построения моделей биологических систем вынуждают исследователей предъявлять менее жесткие требования, чем, например, в математической физике, и ограничиться описанием (имитацией) лишь некоторых существенных для рассматриваемых процессов в исследуемой системе. Учитывая это обстоятельство, рассмотрим «модель», как исследовательскую категорию, рассмотрим также и такую важнейшую составляющую метода системного анализа, как моделирование. Термин «модель» имеет весьма многочисленные трактовки. Модель (model) - 1. Явление, предмет, установка, знаковое образование или условный образ (описание, схема и т.д.), находящееся в некотором соответствии с изучаемым объектом и способные замещать его в процессе исследования, давая информацию об объекте. 2. Форма представления 99 реальности, аналог предмета, явления, отражающий те или иные их свойства [19,26,30,32,50,52,60,84]. 3. Объект, который имеет сходство в некоторых отношениях с прототипом и служит средством описания и/или объяснения, и/или прогнозирования поведения прототипа. Под математической моделью реальной системы также можно понимать конечное подмножество переменных {x(t), u(t), n(t), h(i)} вместе с математическими связями между ними и характеристиками y(t). Таким образом, модель – важнейший инструмент научного познания, условный образ системы или объекта исследования. Как правило, модель конструируется исследователем так, чтобы отразить свойства, связи, зависимости, взаимодействие, структурные, функциональные параметры и прочие свойства, характеризующие объект исследования. Функциональная модель системы описывает совокупность выполняемых системой функций, характеризует морфологию системы (ее построение) – состав функциональных подсистем, их взаимосвязи. Информационная модель отражает отношения между элементами системы в виде структур данных (состав и взаимосвязи). Поведенческая (событийная) модель описывает информационные процессы (динамику функционирования), в ней фигурируют такие категории, как состояние системы, событие, переход из одного состояния в другое, условия изменения состояния, последовательность событий. Все модели условно делят на три типа: дескриптивные (описательные), оптимизационные и имитационные. Дескриптивная или описательная модель descriptive approach) (descriptive model, применяется для исследования систем управления, процедур принятия решений. Дескриптивная модель разрабатывается на статистических материалах, полученных путем статистических исследований, выполненных ранее. Дескриптивные модели использованы в исследованиях [3,19,23,26,30,51,60,75,96] для прогнозирования величины и структуры санитарных потерь (количества больных). Такие модели применяют для 100 изучения наиболее общих закономерностей событий и их развития, тенденций и изменений медицинских процессов, они отвечают на вопрос «Как будет?», и дают общее представление о медицинской обстановке и медицинской службе, как о системе. Оптимизационные или нормативные модели (normative model) применяются, когда управления в исследуют и решают задачи совершенствования организации здравоохранения. Отличительной чертой оптимизационных моделей является наличие критерия эффективности, предназначенного для оценки решения. С помощью критерия эффективности (или оптимизационного) оценивают и выбирают оптимальный, по заданной целевой функции, вариант решения. Такие модели позволяют ответить на вопрос «Как должно быть?». Описательные и оптимизационные модели предназначены для построения моделей изучаемых систем. Вместе с тем, некоторые авторы определяют модель как систему (мысленно представляемую или материально реализованную), которая, отображая или воспроизводя объект исследования, способна замещать его так, что ее изучение дает новую информацию об изучаемом объекте. Таким образом, модель - это достаточно широкое понятие (от схемы до материально реализованной системы), главная особенность которого - способность представлять информацию об изучаемом объекте. Несмотря на то, что методы моделирования основываются на опосредованном познании предметной области, они позволяют в удобной форме и наглядно рассматривать исследуемые медико-биологические системы в целом и отдельные их элементы. В отечественной и зарубежной медицинской и специальной литературе описаны основные методы моделирования систем, а в ряде работ раскрыты особенности их применения в области медицины, здравоохранения и биологии [1,12,31,46,61,66,83]. Фактор (factor) – 1. Источник воздействия на систему, параметр внешних условий либо особенностей системы, объекта (или модели), 101 влияющий на изменение зависимой переменной. Любые воздействия или состояния, определяющие ту или иную величину результативного признака. 2. Движущая сила совершающихся процессов или условие, влияющее на процессы. Используется для описания экспериментов, а также для создания моделей. Исходя из отношения к человеку, все факторы можно разбить на три крупные группы: – естественные факторы, условно не зависящие от человека и медицинских технологий; – факторы как технологии (человек, выступая в роли создателя технологий, порождает новые факторы); – собственно человеческий фактор как отражение взаимосвязи оператора с техникой, ближайшим человеческим окружением (микроколлектив), обществом в целом, его отношение (доверие) к той технологии, с которой он имеет дело, уровень ориентированности в "риске – выгоде" этой технологии для него и общества в целом и т.д. Отдельные факторы могут быть классифицированы по более специфическим признакам: по видам энергии – механические (вибрация, перегрузки и т.д.), электромагнитные (свет, радиоволны, γ-излучение и т.д.), химические (токсические продукты, гипероксия и т.д.) и по отношению стрессора к организму (гомотропность). Среди гомотропных, т. е. не чуждых организму факторов, можно назвать, в частности, кислород, гравитацию и даже излучения, ионизирующие и электромагнитные. Факторы среды и деятельности можно классифицировать также по их системотропности – влиянию на кроветворение, сердечно-сосудистую систему, ЦНС и т.д. Интересна классификация факторов, приведенная в работе F.М.Rohles (1965). Три основные градации вводит этот автор: 1) физические факторы (электромагнитное химико-токсические, (наследственность, излучение, температура, пространственные возраст, пол, атмосфера, влияния), болезнь, 2) динамические, биологические биоритмы, социально102 эмоциональные воздействия) и 3) реципрокные, обеспечивающие обратную связь организма со средой (одежда, рабочая нагрузка, гипокинезия, различные физиологические, психологические и социальные стимулы). R.Н.Murray и M.McCally (1972) в своей работе приводят видоизмененную классификацию факторов по таким параметрам, как повреждение клеток и тканей (взрывная декомпрессия, температура, ионизирующая радиация, шум, токсические агенты, вибрация), влияние на кровообращение (перегрузки, невесомость, вибрация, двуокись углерода, физическая нагрузка, температура, ситуационный стресс), влияние на дыхание (перегрузки, вибрация, гипоксия, температура, окись углерода, двуокись углерода, физическая нагрузка), влияние на окислительные процессы в клетках (температура, гипоксия, ионизирующая радиация, токсические вещества). По нашему мнению, классификация по такому неопределенному параметру, как "повреждение", не совсем обоснована. Безусловно, факторы окружающей человека среды можно структурировать по видам профессиональной деятельности: авиационный и космический полет, подводное погружение, работа в атомной промышленности и т.д. Хотя организм и функционирует как целостная многоуровневая система, исследователи, как правило, сталкиваются с определенной тропностью, избирательностью действия факторов на те или иные органы или системы. Это обстоятельство и может служить основой классификации факторов. Безусловно, эта схема упрощена до минимума, и в ней не учтены все возможные связи и влияния на системы организма. В зависимости от точки приложения факторов степень выраженности эффектов их воздействия будет различной. Результаты многих исследований показывают, что устойчивость организма к воздействию факторов является самостоятельной характеристикой и не может быть предсказана по устойчивости к отдельным видам воздействий (Карпов и др.,1989; Горецкий и др.,1992; Ушаков,1993). Безусловно, наиболее опасными будут те неблагоприятные факторы, которые затрагивают большое число систем 103 организма. Можно ожидать, что если два фактора действуют на разные системы организма, то конечный биологический эффект их взаимодействия будет менее выраженным, чем в случае действия факторов на одни и те же системы. Так, например, при взаимодействии перегрузок с токсическими (или фармакологическими) веществами, действующими не на сердечно-сосудистую систему, конечный эффект будет менее значительным, чем при действии агентов на кардиореспираторную систему. Доказана неоднозначность воздействия факторов на разные системы организма. Конечный эффект всегда трудно прогнозируем и во многом зависит от преследуемых целей: решение эргономической задачи, сохранение здоровья индивидуума, сохранение здоровья потомства, улучшение показателей здоровья населения и т.п. Высказано мнение, что в основе понимания механизмов, определяющих реакцию организма при воздействии комплекса средовых факторов, лежат рефлекторная теория, принцип гомеостаза и учение об адаптационном синдроме. В связи с этим целесообразно рассматривать проблему ответной реакции в условиях комбинированного действия факторов с позиций включения адаптационных механизмов, а также общности и специфичности влияния этих факторов на организм (Даренская и др.,1981; Григорьев,1982;1984). В реальной жизни встречается бесчисленное множество сочетаний факторов, которое увеличивается как факториал числа факторов. Следует учитывать, что имеют значение и интервалы воздействия между факторами и их последовательность. Это, по-видимому, будет первой помехой к стремлению экспериментально (но не теоретически) проверить как можно большее число факторов в одной комбинации. Отчасти уменьшить экономические затраты при одновременном исследовании большого числа факторов позволяет теория планирования экспериментов. Однако это ничуть не уменьшает сложности в выборе необходимых факторов при изучении их комбинации. При изучении большого количества факторов среды в одной 104 комбинации следует учитывать, что они могут сочетаться между собой самым причудливым образом, а флюктуация силы воздействия фактора подчиняется вероятностным закономерностям. Если действующие факторы выступают как независимые события, то вероятность комбинированного действия факторов будет всегда меньше, чем вероятность появления одного фактора. Ответная реакция организма на стрессор, как правило, подчиняется стохастическим закономерностям. Следовательно, вероятность ответной реакции организма будет всегда меньше, чем вероятность возникновения комбинации факторов. Из приведенных рассуждений вытекает следующий вывод: желателен разумный отбор факторов для исследования их воздействия по биологической значимости и вероятности их появления. В понятие "разумный выбор", видимо, следует включить не только значимость фактора в той или иной исследовательской программе, но и отбор наиболее характерных факторов из однородной группы. Последнее обстоятельство следует иметь в виду, прежде всего при изучении воздействия факторов для построения некой количественной модели их взаимодействия. Всякая реальная физиологическая система (каковой является организм) состоит из большого числа взаимосвязанных подсистем с нелинейными соотношениями и организующей ролью ЦНС. Установив тип взаимодействия между характерными факторами из различных групп, можно с определенной долей вероятности распространить полученные соотношения на группы факторов. Для сравнения эффектов комбинации и отдельных факторов могут быть использованы различные параметрические и непараметрические методы анализа. Все факторы можно подразделить на воздействия, на которые организм отвечает ориентировочной реакцией (например, шум, свет) и не отвечает таковой (например, ионизирующее излучение, электромагнитные поля). И в этом смысле параметр экстенсивности играет определенную роль. Возникновение ориентировочной реакции на стимул (фактор) порождает соответствующие соматические ответы. Экстенсивность этого ответа во многом зависит от "уровня знакомства" биологической системы с 105 рассматриваемым фактором. Чем "крепче" знакомство, тем меньше включается систем организма в ответ, тем, следовательно, величина экстенсивности этого фактора будет меньше. И наоборот. Однако, как мы сказали, ряд факторов воздействует без ориентировочной реакции ввиду отсутствия рецепторов. Для сравнения можно привести шум и радиоизлучение. Таким образом, с точки зрения патогенности, факторы, не вызывающие ориентировочной реакции, более значимы. В условиях воздействия нескольких, например, двух факторов, обладающих и не обладающих таким свойством, второй фактор всегда будет наложен на измененный фон реактивности организма от первого воздействия. При выполнении исследований, необходимо учитывать, что каждый фактор имеет интенсивный, временной и экстенсивный параметры. Параметр (parameter) - относительно постоянный показатель, характеризующий моделируемую систему, объект, состояние или процесс, их количественная характеристика. Параметр характеризуется частотой выделения, которая может определяться свойствами собственно сигнала или процесса (это обычно имеет место для квазипериодических процессов, где частота выделения параметра обычно диктуется периодом процесса) или устанавливаться в соответствии с частотой дискретизации или частотой опроса датчика. Параметр интенсивности может быть охарактеризован как сила воздействия, отражающая, прежде всего его энергетическую сторону. При выполнении исследований следует помнить, что эффект от воздействия фактора (по действию лекарства в установленных дозах, влиянию ионизирующего излучения, действию раздражителя и др.) есть функция его интенсивности. Количественные зависимости ответных реакций организма от силы воздействия достаточно сложны, особенно на молекулярном и клеточном уровнях. Вероятностная зависимость реакции организма от интенсивности (дозы) характерна при действии ионизирующего и неионизирующего излучений, токсических и фармакологических агентов. 106 Однако для большинства природных соединений (незаменимые аминокислоты, макро- и микроэлементы, витамины и др.) и физических факторов (температура, атмосферное давление, ультрафиолетовое облучение, электромагнитные поля, гравитационный фактор и т.д.) существует некий оптимум их действия. Гипо- и гипервоздействие вызывают отрицательный эффект в организме. Зависимость эффекта от силы воздействия, как правило, имеет параболическую зависимость. Таким образом, для большинства природных (эссенциальных) факторов установлена параболическая зависимость "доза–эффект", для антропогенных (неэссенциальных) факторов – S-образная (логистическая) зависимость. Временной параметр - время действия фактора. Естественно, что интенсивность воздействия того или иного фактора (препарата, агента, раздражителя, стрессора и т.п.) зависит от времени его (их) действия. Эта зависимость в некоторых случаях линейная, например для радиационного воздействия. Гораздо сложнее для решения задач исследования работать с факторами, не имеющими дозовой градации. Когда мы рассматриваем временной параметр как ответную реакцию организма на фактор, то временные закономерности формирования стрессответа и его элиминации будут зависеть от того, на каком уровне действует фактор, и от предшествующего функционального состояния организма. Каждая функция (простая или сложная) организма имеет свою временную шкалу (нервные процессы, хемообменные, основной циркадный ритм, поведенческие реакции, продолжительность менструального цикла, гормональные процессы, продолжительность гонадного цикла и др. Таким образом, одним из важных параметров, определяющих конечный эффект действия и изучения действия факторов на организм (или систему) является параметр времени. Параметр экстенсивности отражает, на каком уровне интеграции воздействует фактор и какие системы ответственны за реализацию изучаемого эффекта. Параметр экстенсивности функционально связан с временным параметром, параметром интенсивности и отражает сущность не самого 107 изучаемого фактора (эффекта), а реакцию или биологический ответ на него (них). Его следовало бы также охарактеризовать как реципрокный параметр (по аналогии с реципрокным фактором) (Rohles,1965), поскольку он отражает сущность не самого фактора, а биологический ответ или реакцию на воздействие. Параметр экстенсивности функционально связан с временным параметром и параметром интенсивности. Действительно, чем больше сила воздействия фактора, тем генерализованнее ответ организма и тем больше систем, ответственных за эту реакцию. Подобное наблюдается, когда небольшой по силе раздражитель, действуя длительно, также вызывает генерализованный ответ. Тот же фактор, действуя кратковременно, может вызвать очень ограниченную реакцию – на уровне отдельных систем или даже отдельного органа. Чем больше интенсивность воздействия фактора, тем генерализованнее ответ организма и тем больше систем, ответственных за эту реакцию (задействованных в реакции и подлежащих изучению). Реакция организма как живой системы на стрессор (или изучаемый фактор) и пределы возможных колебаний его экстенсивных, временных и интенсивных параметров, определяется, прежде всего, с такими показателями тела как поверхность, объем, масса и связанными с ними энергетическими потребностями. Анализ моделей, применяемых разными авторами [23,26,32,36,42,52,60,97] в здравоохранении, медицине, биологии и других областях науки, позволяет выделить в них следующие общие свойства: упрощенность по сравнению с реальными системами (их подсистемами, отдельными элементами или звеньями); наличие качеств, позволяющих отражать или воспроизводить отдельные свойства исследуемого объекта, или его элементов; наличие качеств, позволяющих выделять или замещать элементы, подлежащие исследованию; 108 возможность получения новой дополнительной информации, характеризующей объект исследования. Все изученные и проанализированные нами модели, реализованные в исследованиях, учебниках и учебных задачах были разделены, с целью их использования как аналога, на несколько групп: вербальные (словесные) - замыслы исследований, описания, сценарии, лекции, доклады, видеофильмы; графические (изобразительные) - блок-схемы, слайды, чертежи, графики, рабочие карты, в том числе и цифровые; предметные (физические) - модели устройств, приборов, аппаратов, изделий; математические, описывающие элементы системы медицинского обеспечения или функционирование органов или систем с помощью формул; базы медицинских (медико-биологических, медико-социальных) данных – модели ситуационной медицинской обстановки по поступившим на лечение больным и другим параметрам. В последние десятилетия в мире интенсивного развивались методы моделирования с применением ЭВМ. С тех пор, как в 1973 г. Россом (Ross) разработана и введена одна из самых известных методологий анализа и проектирования систем - SADT (Structured Analysis and Design Technique), произошли значительные изменения, но эта методология по-прежнему успешно используется в различных областях для решения широкого спектра научных задач. Методология SADT применяется в медико-биологических исследованиях для проектировании конфигурации компьютерных медикобиологических систем, обучения специалистов, исследования и разработки специальных встроенных программ, обеспечивающих различные медикобиологические системы, управление медицинскими и иными процессами, системами и др. В последние годы эта методология получила дальнейшее развитие, была разработана автоматизированная поддержка решений, что сделало ее более доступной и простой в употреблении [19,26,30,55,84,96,102]. 109 Методы моделирования с применением ЭВМ интенсивно развиваются и все более широко применяются исследователями различных объектов и систем [1,10,12,13,2129,36,38,40,41]. Авторы монографий и статей выделяют в основном следующие этапы математического моделирования: трансляции или перехода от сведений о реальных явлениях или процессах к математической модели, т.е. процедура перевода реального явления в модель; индуктивный, заключающийся в том, что на основе ряда наблюдений определяется общая закономерность; дедуктивный, когда на основе общих правил и принятых допущений приходят к определенным выводам и заключениям. Индукция не основана на точных законах, поэтому индуктивные методы и этап моделирования – позволяют получить общую картину, полученную из ряда наблюдений, частных случаев или опыта. Дедукция (дидактическое рассуждение) строится на строгих правилах вывода. Математическое моделирование основано на теории подобий, и формально математическая модель строится на допущениях. На математической модели можно изучать только те предметы и явления, которые поддаются математическому описанию. Для настройки модели необходимо иметь и получать в динамике определенные сведения о реальных процессах. Математическое моделирование должно быть цикличным и должно подпитываться ранее наблюдавшимися фактами, сведениями о явлениях и процессах, а также новых ситуациях и обстоятельствах. Процесс моделирования и новые исходные данные должны повышать объяснительную и предсказательную способность модели. В различных областях медицинской науки те или иные приемы моделирования применяются достаточно широко. В исследованиях [9,16,23,26,41,44,50,] реализованы и описаны современные математические модели, основанные на новых информационных технологиях. Например, в решении задач организации медицинского обеспечения войск, системах 110 поддержки решений, для вероятностного моделирования реальных процессов и др. Постоянно совершенствуются математические модели и алгоритмы для подтверждения гипотез оценки и развития ситуационной медицинской обстановки в исследуемых системах. Микропроцессорная техника последнего поколения с современным программным обеспечением позволяет существенно изменить процесс планирования эксперимента, моделирования и выполнения исследования в целом. Это связано с реализацией возможностей новых информационных технологий, таких как базы данных исследований. Еще совсем недавно для решения информационных и справочных задач военными специалистами США была разработана и создана компьютерная сеть – internet, сейчас она лавинообразно развивается, имеет многоцелевое организацию назначение и выполнения оказывает научных исследователей. Технологии internet огромное работ и влияние на науку, деятельность самих фундаментально изменяют методы и способы работы с информацией, ее получением, обработкой, анализом и использованием в решении научных задач. Появляется и реализуется множество проектов, еще вчера представлявшихся фантастичными. Одним из самых популярных приложений internet является World Wide Web или WWW "всемирная паутина". Она представляет собой группу серверов, подключенных к internet и предлагающих страницы информации в графическом или текстовом виде. Любой исследователь, как пользователь, может создать свою страницу WWW зарегистрировать ее электронный адрес, по которому его могут найти другие пользователи internet, решающие аналогичные задачи Огромное влияние на планирование и выполнение научных исследований оказывают также открытые телекоммуникационные сети России Runnet, Mednet и Freenet как среда передачи и организации хранения различного рода информации. [4,38,43,45]. В настоящее время имеется доступ по сети к сведениям, характеризующим заболеваемость населения, количественный, качественный 111 состав и структуру госпитальной сети, врачебные кадры по специальностям в различных регионах, субъектах федерации - республиках, краях, областях и больших городах нашей страны. Имеются практически неограниченные возможности получения и других сведений. Эта информация и другие возможности internet уже широко используются различными исследователями - должностными лицами здравоохранения и медицины - при планировании экспериментов и их проведении. То есть, применение технологий распределенного доступа к информации, реализованных в вычислительных сетях различной архитектуры, позволяет более рационально использовать информационный ресурс, а также существенно повысить качество выполнения медико-биологических исследований. Выбор модели в значительной степени зависит от степени исследованности изучаемого объекта, уровня имеющихся о нем знаний. При этом исследовательские модели по мере накопления знаний усложняются и позволяют проводить новые исследования. Что касается применения методов моделирования в интересах выполнения медико-биологических исследований, то следует отметить, что в настоящее время это исключительно объемная предметная область. Среди всех применяемых моделей важное место занимают математические модели. Имеющийся опыт создания и использования математических моделей в медико-биологических исследованиях показал их эффективность. Чаще всего для моделирования процессов в организации здравоохранения используется метод вероятностно-статистического моделирования. В медицинских и биологических исследованиях широко применяются методы корреляционного, дискриминантного, факторного, кластерного и других видов статистического анализа, в соответствующих моделях, в зависимости от существа решаемых научных задач [12,27,28]. Из вероятностных методов широко применяются процедура Байеса и методология марковских цепей. Отметим в этой связи следующее обстоятельство. Во всех случаях построение моделей и применение статистических методов требует наличия доброкачественной статистики - количественного описания множества 112 однородных объектов по выбранному числу признаков. Это накладывает некоторые ограничения на их применение, например, в научных задачах прогнозирования ситуационной медицинской обстановки, когда нет соответствующей статистики и нельзя поставить эксперимент. Указанные ограничения не влияют на применение методологии имитационного моделирования, которая предполагает создание новых возможностей в процессе моделирования систем медицинского обеспечения населения с модификацией комбинаций различных факторов [19]. Эффективность и результативность моделирования с имитационными моделями систем массового обслуживания, существенно зависит от выбора и правильности разработки плана эксперимента. Именно план определяет объем и порядок проведения вычислений на ЭВМ, приемы сбора, накопления и статистической обработки результатов моделирования исследуемой системы. Свойства и характеристики объектов (систем) исследования, а также результаты моделирования применением современных экспериментов, но в математических обобщенном виде или процессов можно описать с методов планирования исследовательский процесс абстрактной системы типа «черного ящика» описывается следующей формулой: Y = (y1, y2, …, yk) = φ (X) = (x1, x2, …, xm), (8.1) где Y = (y1, y2, …, yk) - множество векторов зависимых выходных переменных или реакций; φ – функция реакции; X = (x1, x2, …, xm) – множество векторов входных независимых переменных или факторов. При проведении моделирования и экспериментов с моделью, позволяющей оценить процессы функционирования исследуемой медикобиологической системы, необходимо вывить влияние всех факторов, определяющих функциональные связи и искомые характеристики объекта исследования. Для этого исследователь отбирает факторы xi, влияющие на 113 искомые характеристики и описывает функциональные зависимости. После этого устанавливается диапазон ximin - ximax , а затем факторное пространство { x1, x2, …, xm}, в котором предполагается проводить моделирование и эксперимент. Кроме того, исследователь, обосновывает необходимое число проигрываний (прогонов) модели и их порядок при проведении эксперимента. В результате моделирования и проведенных экспериментов получаются характеристики исследуемой медико-биологической системы. Модель позволяет оценить использования медицинских ресурсов, в том числе информационных. Средства моделирования обеспечивают: - отображение и сбор статистики по выбранной системе показателей (время простоя в очереди, частота и время занятости ресурса, время нахождения сущности в системе, среднее взвешенное по времени количество документов в очереди на обработку и др.); - введение новых показателей для оценки исследуемых систем; - модификацию модели для отображения новых схем функционирования и исполнения информационных процессов, происходящих в подразделениях медицинского учреждения; - интерфейс с пользователями для изменения значений параметров (среднее время между прибытием сущностей, вероятность перехода заявки из одних подразделений медицинского учреждения в другие, количество и свойства ресурсов, свойства сущностей (заявок)); В состав регулируемых параметров модели могут включаться: - характеристики потока информации об объектах и материалах исследования; - вероятности перехода объектов исследования из одного состояния в другое. Проверка пригодности модели для изучения выделенного процесса опирается на предыдущие теоретические или практические результаты, полученные другими исследователями в аналогичных работах. Имитационная модель (simulator) выполненное на некотором формальном - это формальное (то есть языке) описание логики 114 функционирования исследуемой системы и взаимодействия отдельных ее элементов во времени, учитывающее наиболее существенные причинноследственные связи, присущие системе, и обеспечивающее проведение статистических экспериментов, как правило, в процессе компьютерной имитации. Имитационные модели применяют в сложных ситуациях, когда исследуемая система противоречивая, с неясным поведением и однозначного толкования значения нет исходных параметров (или они неизвестны). Как метод научного познания, имитационное моделирование развивается с конца 40-х годов. Одной из первых областей его приложения были военные игры, где структура модели отображала ту или иную стратегию борьбы, а результаты имитации использовались для оценки эффективности избранной стратегии. Имитационное моделирование учитывает структуру и функцию моделируемых систем, а также фактор времени и, в принципе, неограниченное множество других факторов среды – внешних факторов системы. Системный подход и принципы кибернетики являются органичными и необходимыми компонентами имитационного моделирования. А включение в имитационные модели экспертных мнений и результатов статистических данных повышает их качество [11,23]. Методология имитационного моделирования является чрезвычайно гибкой и допускает использование "внутри" модели разнообразных методов из различных предметных областей. Многие авторы утверждают, что нет таких методов, которые нельзя было бы использовать в интересах имитационного моделирования [14,15,37,58]. Основой имитационного моделирования является метод статистических испытаний. Перечисленные стороны методологии имитационного моделирования не означают полного отсутствия проблем при его применении. Непременное условие эффективности имитационного моделирования глубокое и детальное знание содержательной стороны исследуемого процесса, основных факторов, его определяющих. Поэтому первым и главным условием 115 успешности имитационного моделирования является достаточная профессиональная подготовка исследователей. Вторым обязательным условием является требование верификации созданной модели. Так, в случае построения имитационной модели сложной системы, (например, ситуационной медицинской обстановки в субъекте федерации, как объекте исследования), опыте, в обязательном порядке которую нельзя воспроизвести в предполагается создание аналогичных моделей, но принципиально другими методами. Их сравнение, как правило, позволяет провести информационную верификацию мощность, - определить надежность, дееспособность, адекватность объекту, приемлемость, практическую значимость полученных моделей [11,13]. Опыт развития и применения теории и практики имитационного моделирования показывает, что его применение позволяет четко и ясно представлять состав, структуру и процесс функционирования моделируемой системы. Имеющиеся на рынке пакеты имитационного моделирования имеют в своем составе стандартные функции имитационных языков. Например, функции изменения временных параметров, выбора событий, сбора и обработки статистических данных о поведении системы в ходе исследования и др. Используя концептуальную модель и представления о стохастических явлениях в системе управления А.А. Корнеенков [21] построил динамическую модель информационной системы лечебного учреждения и реализовал ее на языке имитационного моделирования SIMAN. С ее помощью автор получил необходимые для решения оптимизационной задачи параметры, исходные значения которых изменяются во времени. Разработанная имитационная модель позволила осуществить также прогноз поведения исследуемой системы в условиях изменяющейся нагрузки, определить значение показателей, характеризующих ее функционирование. Имитационную модель можно считать реализуемой и имеющей практическую ценность только в том случае, если в ней отражены именно те свойства реальной системы, которые позволяют достичь цели и решить задачи исследования. 116 Для метода имитационного моделирования практически отсутствуют ограничения на область его применения (по типу моделируемого объекта или системы), и речь может идти только о целесообразности использования метода имитационного моделирования в выбранной исследователем предметной области и об объеме трудозатрат на его применение. Поскольку основой имитационного моделирования является метод статистических испытаний, наибольший эффект от его применения достигается при исследовании сложных систем, на функционирование которых существенное влияние оказывают случайные факторы. Применение имитационного моделирования целесообразно также в тех случаях когда: не существует законченной постановки задачи на исследование и идет процесс познания объекта моделирования; характер протекающих в системе процессов не позволяет описать эти процессы в аналитической форме; необходимо наблюдать за поведением системы (или отдельных ее компонентов) в течение определенного периода, в том числе с изменением скорости протекания процессов; изучаются новые ситуации в системе, либо оценивается ее функционирования в новых условиях. При имитационном моделировании воспроизводится алгоритм функционирования системы во времени – поведение системы, причем имитируются элементарные явления, составляющие процесс, с сохранением их логической структуры и последовательности протекания, что позволяет по исходным данным получить сведения о состояниях процесса в определенные моменты времени, дающие возможность оценить характеристики системы. Основным преимуществом имитационного моделирования по сравнению с аналитическим является возможность решения более сложных задач. Имитационные модели позволяют достаточно просто учитывать такие факторы, как наличие дискретных и непрерывных элементов, нелинейные характеристики элементов системы, многочисленные случайные воздействия и 117 другие, которые часто создают трудности при аналитических исследованиях. В настоящее время имитационное моделирование – наиболее эффективный метод исследования систем, а часто и единственный практически доступный метод получения информации о поведении системы, особенно на этапе ее проектирования. Если этот прием применяется для машинной имитации в целях исследования характеристик процессов функционирования систем, подверженных случайным воздействиям, то такой метод называется методом статистического моделирования. Метод вариантов имитационного структуры моделирования системы, применяется эффективности различных для оценки алгоритмов управления системой, влияния изменения различных параметров системы. Имитационное моделирование может быть положено в основу структурного, алгоритмического и параметрического синтеза систем, когда требуется создать систему с заданными характеристиками при определенных ограничениях. Имитационные модели могут применяться для решения в принципе любых классов задач, но чаще всего их использование "показано" для моделирования больших систем, состоящих из комплекса подсистем с собственными целями, нередко противоречивыми, поведение которых зависит от множества внешних факторов и отличается значительной степенью неопределенности. Информационная модель (information model) — это совокупность сигналов, несущих информацию об объекте изучения и исследования и внешней среде, организованных по определенным правилам. Более узко имитационным моделированием можно назвать схему потоков информации, обращающихся в процессе решения научных или практических задач. Комбинация сигналов на мониторе врача специалиста по функциональной диагностике, система графиков и формул, характеризующих состояние тяжелого больного на мониторе АРМа заведующего отделением реанимации и интенсивной терапии – все это имитационные модели разных типов, 118 предназначенные для решения различных исследовательских и практических задач. 8.2 Моделирование как метод системного анализа Под моделированием понимается процесс исследования реальной системы, включающий построение модели и изучение ее свойств. Общими функциями моделирования являются описание, объяснение и прогнозирование поведения реальной системы. Приводим одну из наиболее распространенных классификаций методов моделирования. 1. Методы формализованного представления систем: - аналитические методы; - статистические методы; - теоретико-множественные методы; - логические методы; - лингвистические и семиотические методы; - графические методы. 2. Методы, направленные на активизацию использования интуиции и опыта специалистов: - методы типа "мозговой атаки"; - методы типа "сценариев"; - методы структуризации; - методы экспертных оценок; - методы типа "дельфи"; - морфологические методы. 3. Комплексные методы. Типовыми целями моделирования могут быть поиск оптимальных или близких к оптимальным решений, оценка эффективности решений, определение свойств системы (чувствительности к изменению значений характеристик и др.), установление взаимосвязей между характеристиками 119 системы, перенос информации во времени. Классификация видов моделирования показана на рисунке 8.1. Моделирование в здравоохранении, медицине и биологии – исследование медико-биологических объектов, систем (подсистем) на моделях. В настоящее время изменился облик и аппаратная вооруженность труда экспериментатора, стали более совершенными измерительные приборы. Создана качественно новая теоретическая база исследований, появились новые разделы прикладной математики, вооружающие экспериментаторов новыми методами и теориями. Вероятностно-статистические методы проникли во все стадии экспериментальных исследований и качественно изменили практически всю систему экспериментального познания. Сложившаяся ситуация стимулировала общенаучную и философскую деятельность, где в настоящее время осмысливается роль и место современной теории эксперимента и проводимых на ее основе экспериментальных работ. При проведении исследований вообще и применении системного анализа для конкретных проблем в частности, эксперимент в системе или над системой, является одной из задач, которую необходимо разрешить. Предшествующий опыт научно-исследовательской деятельности, подтвержденный многими авторами, показывает необходимость применения математического моделирования при исследовании практически всех медикобиологических систем. То есть, экспериментировать надо не над интересующим нас объектом или системой, а над их моделями. Однако, технологии и процессы, описывающие и объясняющие функционирование исследуемой системы необходимо знать. Необходимо отметить, что при построении математической модели и выполнении моделирования в ряде случаев целесообразнее проводить эксперимент над реальной системой или ее отдельными элементами. 120 Моделирование систем Полное Не полное Приближенное Детерминированно е Стохастическое Статическое Динамическое Дискретное Дискретнонепрерывное Непрерывное Мысленное Наглядное - гипотетическое -аналоговое -макетирование Символическое -языковое -знаковое - Реальное Математическое -аналитическое -имитационное -комбинированное -информационное -структурное -ситуационное Натурное -натурный эксперимент -комплексные испытания -производственный эксперимент Физическое -в реальном времени -в модельном времени - - Рис. 8.1. Классификация видов моделирования 121 При проведении исследований в ряде случаев приходится прибегать к методу “черного ящика”, суть которого заключается в том, что априори предполагается некоторая связь между его входом и выходом. Черный ящик (blackbox) – понятие, с помощью которого изучают сложные системы. Представление системы в виде “черного ящика” означает, что при настоящем уровне знаний мы не можем проникнуть внутрь данной системы и разобраться, каковы внутренние закономерности, преобразующие ее входы в выходы. Однако мы можем изучать зависимость изменений на выходе от изменений на входе. Статистический многократный учет таких изменений позволяет установить закономерные взаимозависимости между поведением входов и выходов и предвидеть поведение исследуемой системы в будущем [9,20,24]. Можно сказать, что кибернетический принцип «черного ящика» благодаря развитию математической теории эксперимента превращается в метод перехода от «черного ящика» к «белому ящику». Широкое проникновение идей математической теории эксперимента во все области знания обусловлено идентичностью статистических подходов к изучению медико-биологических объектов. Ее достоинством и, в частности, достоинством методов планирования экспериментальных исследований, которые являются частью теории экспериментов, можно назвать универсальность, пригодность основных идей в большинстве медикобиологических исследований. Под моделированием в математике понимают фиксацию с помощью языков математических, логических и прочих символов (например, в форме уравнений), качественных выясненных соотношений эмпирическим между путем различными количественных величинами. или Метод моделирования является средством, позволяющим устанавливать все более глубокие взаимосвязи между теорией и опытом. 122 9. ВЗАИМОДЕЙСТВИЕ МЕДИКО-БИОЛОГИЧЕСКИХ СИСТЕМ И ПОДСИСТЕМ В методологии системного анализа важной проблемой является необходимость анализа системы, изучение ее структуры и взаимодействие выделенных подсистем. Анализ взаимодействия параметров в изучаемых системах и подсистемах применяется для решения следующих основных исследовательских медико-биологических задач: оценки функционирования подсистем и системы, в какой степени изменение одних параметров влияет на изменение других; оценки последствий лечебно-диагностических воздействий (реакций систем организма на применение препарата и др.); совершенствования диагностического и лечебного процессов; разработки моделей и моделирования систем; оптимизации функционирования систем здравоохранения и медицинского обеспечения; разработки планов развития и прогнозов функционирования медикобиологических систем. В медико-биологических системах различают следующие типы взаимодействия: информационное, обусловленное передачей параметров, сведений, сигналов и данных, характеризующих взаимодействие систем, подсистем, объектов и т.д.; материальное, характеризующее передачу материальных средств (аппараты, приборы, медикаменты, финансовые средства и др.) или веществ (гормоны, секрет желез, ферментов и др.); медицинское, обусловленное совместным решением диагностических, лечебных, экспертных, прогностических и других задач различными учреждениями здравоохранения; организационное, соподчиненность, правовое регламентирующее обеспечение, иерархическую организацию прямой (распорядительной) и обратной связи; 123 другие типы (виды) взаимодействия. Изучение взаимодействия между подсистемами в медико- биологических системах (подсистемах) при их изучении обычно проводится в следующей последовательности: исследование организации взаимодействия объектов и подсистем; количественный анализ связей объектов и подсистем и их взаимодействия; анализ связей во времени и пространстве; учет и сбор изучаемых сведений, данных, значений, параметров; разработка математической модели исследуемой системы или объекта. Вторая проблема выявления и изучения связей при применении метода системного анализа заключается в том, что число больных всего и число больных определенной нозологии, стоимость лечения и показатели информационных потоков в каналах связи системы имеют стохастическую, вероятностную природу и их значения в конкретный момент времени нельзя предсказать абсолютно надежно. Поэтому при применении метода системного анализа часто приходится иметь дело не с конкретными величинами, а с их оценками по прошлым наблюдениям или по прогнозам на будущее. Количественный анализ взаимодействия изучаемых подсистем предполагает также и статистическую обработку информации. 9.1 Обработка медико-биологической информации При изучении медико-биологических проблем исследователи собирают самую разнообразную информацию (научно-медицинскую, эвристическую, статистическую), которую регистрируют в виде единиц статистического наблюдения, накапливают и обрабатывают. 124 В классике сложилась некая последовательность этапов, эта последовательность традиционна и сложилась достаточно давно. Каждый из этапов можно условно разделить на последовательность шагов: 1. Сбор первичных данных. 2. Статистическая обработка, систематизация, анализ. 3. Заключение, диагноз или оценка. Сбор первичных медико-биологических данных рассмотрен в главе 5. Первым шагом в статистической обработке данных, как правило, является нахождение точки среднего значения всех исследуемых характеристик - геометрического центра многомерного облака точек. Обычно удобно сдвинуть все точки описаний состояний на один и тот же вектор так, чтобы центр облака оказался в начале координат. Далее следует нормировка - преобразование всех значений характеристик материалов так, чтобы они попадали в сопоставимые по величине интервалы. В качестве нормирующей величины обычно выбирается один из характерных масштабов. Статистическую обработку результатов наблюдений (медико- биологической информации) выполняют для оценки этой статистической совокупности наблюдений при помощи сводных показателей. Научную статистическую обработку медико-биологической информации начинают с вычисления обобщающих медико-статистических показателей (различных производных величин). Готовые обобщающие показатели исследователи получают после обработки собранных в базы данных материалов с применением стандартных пакетов программ. Очень важная роль при выполнении научного исследования отводится методу. Достаточно напомнить меткое высказывание И.П. Павлова: «При правильно выбранном методе исследования и не очень талантливый человек может сделать многое». Понятие «метод» в широком смысле слова означает путь к достижению поставленной цели, является способом решения какой-либо научной задачи. 125 Метод представляет собой совокупность определенных приемов, используемых для познания объективной действительности. Метод – это способ (путь) исследования данного явления, всегда исходящий из определенных общих принципов и представлений о специфике объекта, и содержит вытекающие из них приемы (частные методики) и требования, обеспечивающие достижение цели. Совокупность приемов и операций познания и преобразования действительности [17]. Основной задачей обработки медико – биологической информации является получение максимально объективной и достоверной оценки изучаемого объекта. Показатели и методы применяемые при решении задач медикобиологического анализа статистическими методами показаны в таблице 9.1 Таблица 9.1 Показатели и методы для статистической обработки медико- биологической информации. Показатели и методы Относительные величины Средние величины Сравнение показателей Оценка влияния факторов Частоты, структуры, соотношения, наглядности, динамики Средняя арифметическая, среднее квадратическое отклонение, средняя ошибка средней арифметической, Коэффициент вариации t – критерий Стьюдента, χ2 – критерий Пирсона Корреляционный анализ, регрессионный анализ, дисперсионный анализ, факторный анализ Кроме того, в многомерном облаке данных существует несколько характерных масштабов. Во-первых, это стандартное отклонение - квадратный корень из общей дисперсии облака данных. Когда анализируемое множество медико-биологических показателей является выборкой из многомерного нормального распределения, в шаре радиуса находится около двух третей от числа анализируемых описаний состояния. 126 Объект исследования или наблюдения (object) – 1. Статистическая совокупность, состоящая из отдельных предметов или явлений, т.е. единиц наблюдения. 2. Выделенная по некоторым правилам часть мира, являющаяся предметом познания или практической деятельности. Единица наблюдения или счетная единица – составная часть статистической совокупности, подлежащая отдельной регистрации. Свойства объекта (object property) – то, в чем рассматриваемый объект сходен с другими, сравниваемыми объектами или отличаются от них. [55,65]. Применение системного подхода предполагает рассматривать статистическую совокупность с учетом взаимодействия и взаимосвязи. Статистическая совокупность дает новое (интегративное) свойство, которым не обладает каждая из ее составных частей. Обобщающими характеристиками такой совокупности при обработке данных являются статистические показатели, такие как: средняя величина (арифметическая, геометрическая, гармоническая), среднее квадратическое отклонение, коэффициент вариации и др. Совокупность отдельных наблюдений оценивают, прежде всего, по результатам вычислениям средней величины и оценки рассеяния или вариабельности. Последующий статистический анализ сравниваемых совокупностей заключается в сопоставлении между собой их сводных показателей для решения вопроса о достоверности различий между ними. Полученные в результате исследований средние величины и относительные числа отображают действительность и позволяют изучать закономерности. Средняя величина (mean, average) – 1. Один из основных показателей, характеризующих распределение выборки или генеральной совокупности. 2. Обобщающие количественные характеристики совокупности по одному варьирующему признаку. Средние величины играют в обработке информации, статистике и статистическом анализе важную роль, поскольку они являются обобщенной характеристикой большого количества индивидуальных значений варьирующих (изменяющихся) признаков. При 127 обработке информации и медико-статистическом анализе их часто используют в качестве обобщающих показателей. Расчет средних величин применяют для отображения того общего и типичного, что характерно для всех показателей изучаемой совокупности. Средняя величина имеет абстрактный характер и игнорирует те различия, которые наблюдаются у отдельных признаков, взаимно погашая их. Средние величины широко используются в медико-биологических исследованиях для анализа обобщенных характеристик различных массовых процессов. При выполнении медико-биологических исследований вычисляют различные виды средних величин: средняя арифметическая, средняя гармоническая, средняя квадратическая, средняя геометрическая, средняя хронологическая, структурные средние медиана и мода. Каждый вид средних имеет свои особые свойства, которые наиболее полно соответствуют цели и решению поставленных задач и свои способы расчета. Выбирая ту или иную форму средней, следует исходить из медико-биологической сущности усредняемого признака и характера распределения варьирующих значений изучаемых признаков. Вариабельность (оценка рассеяния), разбросанность отдельных вариантов вокруг своей средней оценивается по среднему квадратическому отклонению – σ. Построение распределений эмпирических данных позволяет наглядно представить тип распределения, подобрать соответствующее математическое выражение для описания выбранного распределения [51]. В зависимости от типа признака (количественный, порядковый или номинальный) применяют различные методы расчета числовых характеристик случайной величины. Относительные величины – соотношение абсолютных величин друг с другом, их получают в результате деления одной величины на другую. В зависимости от того, что берут в числителе и знаменателе этого отношения, различают несколько типов относительных показателей: 128 Интенсивные, характеризующие распространенность явления в среде и изучаемой совокупности наблюдений. К ним относят, например, показатели заболеваемости, рождаемости, смертности и др.; Показатели соотношения, свидетельствующие о соотношении различных ресурсов и населения. К ним относят показатели обеспеченности населения койками, штатами, врачами, лекарствами, аппаратурой и др.; Экстенсивные – показатели, структуры и распределения. К ним относят показатели структуры населения по возрасту, диагнозам, полу и др. [51]. Обработка информации приведения исходной информации оценки и анализа. комплексном (information к виду, – processing) удобному для использования, При изучении социально-гигиенических исследовании человека процесс собирают самую проблем и разнообразную информацию. Каждую из них обрабатывают разными методами. Обработка информации включает следующие процедуры (операции): отбор исходной информации, наиболее полно и наилучшим образом характеризующей состояние исследуемого объекта; обработку информации (группировку, упорядочивание, классификацию, сводку, агрегирование и расчет необходимых показателей); получение и анализ результатов, их проверку, приведение к сопоставимому виду. Выполнение научного исследования требует анализа литературы по проблеме. Анализ отечественной и зарубежной литературы позволяет определить степень проработки избранной темы исследования, выбрать методы исследования и оценить полученные результаты. организованной В хорошо на современном уровне работе исследователь, изучая литературные источники, делает выкопировки из них путем сканирования наиболее значимых фрагментов (или всей статьи), соответствующего оформления изученного литературного источника для последующего включения в обзор или цитирования. Для того, чтобы можно было легко найти в собственной обширной базе материалов ранее собранный и уже изученный 129 материал, применяют методы шифрования, «связывания» наиболее важных «отмеченных» сведений с источником по типу гиперссылок или другим способом. Многокритериальное, комплексное, рейтинговое исследование и оценка объекта должны, таким образом, складываться из нескольких показателей, каждый из которых необходимо измерять в искусственной шкале интервалов (ранги, места), или отношений (баллы, очки, коэффициенты), для получения числового значения или результата, который был бы пригоден для дальнейшей алгоритмической обработки. Такой обобщенным подход к показателем и логической исследованию математико-статистической позволит (многокритериальной, оперировать рейтинговой с оценкой медико-биологических объектов) как с измеримой величиной. Для получения рейтингового ряда медико-биологических показателей обычно проводят ранжирование оцениваемых объектов или исследуемых показателей, что позволяет при сопоставлении ряда ранговых мест оценить, насколько один конкурирующий объект или показатель предпочтительнее другого. Из литературных источников (или материалов, исследования контрольной группы) получают эталонные показатели по каждому из исследуемых критериев. К обработке информации относятся такие понятия теории управления объектами (системами) как получение, сбор, изучение, отображение информации о состоянии изучаемых объектов, расчет показателей, анализ полученной информации и принятие решений. В основе алгоритмирования для последующего анализа процессов функционирования медико-биологических систем лежит теория игр, которая позволяет строить математические, в том числе имитационные, модели функционирования объектов исследования и принятия решений. В ряде случаев в медико-биологических исследованиях все переменные являются категорированными (т.е. они оцениваются качественно на нескольких уровнях), например, в результате лечения может наступить: улучшение – (код –01); 130 отсутствие изменений - (код –02); ухудшение - (код –03). В этом случае при наблюдении n объектов, в каждом из которых m признаков, описывающих эти объекты, в исходной матрице наблюдений будут представлены им соответствующие коды, например, для признака результат лечения - 03 означает – ухудшение. На основе исходной матрицы наблюдений строят таблицы сопряженности с частотами наблюдений. Для анализа таблиц сопряженности применяют сложные многомерные математические модели и многомерный статистический анализ. Многомерный статистический анализ (multidimensional, multivariate statistical analysis) – «раздел математической статистики, посвященный математическим систематизации методам и построения обработки оптимальных многомерных планов статистических направленным на выявление характера и структуры сбора, данных, взаимосвязей и компонентами исследуемого многомерного признака и предназначенным для получения научных и практических выводов»2. Применение методов многомерного статистического анализа позволяет учесть при изучении взаимодействие нескольких показателей одновременно с учетом их динамики [35,48,49]. Многомерный статистический анализ включает дискриминантный анализ, кластерный анализ и другие методы, они рассмотрены и описаны кратко в отдельных подразделах. 2 Математическая энциклопедия, т.3, 1982 131 9.2 Случайные события и величины в системном анализе Как уже было отмечено ранее, в медико-биологических системах предметом исследований могут быть следующие группы объектов: здоровые и больные люди, т. е. реальные, физически ощутимые объекты с заранее заданными параметрами их количественного и качественного описания; оценки и показатели качества деятельности различных служб (подсистем) и врачей специалистов; медико-биологические показатели функционирования исследуемых органов и систем человека или животного; информация в виде сообщений о событиях в системе и значениях описывающих ее поведение величин; экономические показатели функционирования исследуемых объектов. Обратим внимание на достаточно тесную системную связь параметров и показателей функционирования всех выделенных показателей. Приведем некоторые примеры. Число здоровых (больных) лиц, вне сомнения, зависит от объемов финансирования, т.е. количества денег, выделяемых на организацию здравоохранения, профилактическую, лечебно-диагностическую и иную деятельность в стране, федеральном округе, субъекте федерации, городе, районе и т.д. Количество и качество выполненных исследований зависит от оснащения медицинских учреждений, обученности и опыта медицинских специалистов. Организация работы, умение и готовность врачей и средних медицинских специалистов обусловливают соответствующие результаты и показатели лечебно-диагностической, экспертной или иной работы. Примеры можно продолжить. Если рассматривать показатели, характеризующие изучаемые физические величины, скажем количество больных, принятых в поликлинике за день (неделю, месяц, год), то сведения об этой величине после окончания периода наблюдения могут быть получены достаточно точно и достоверно. 132 Вместе с тем, при системном анализе и исследовании научных проблем или задач нас куда больше интересует будущее, а именно - сколько больных будет принято (может быть принято) за будущий день (неделю, месяц, год)? То есть, нужен учет сведений, характеризующих изучаемую систему или объект, так как без предварительной информации, знаний о количественных показателях в исследуемых системах нам не обойтись. Эти величины могут принимать различные значения в зависимости от внешних по отношению к стохастическими. поступившего ним Так, условий например: и называются артериальное случайными давление на лечение, может быть различным, - или больного, это непрерывная случайная величина — с тем или иным количеством возможных значений, пол больного может быть женским или мужским - дискретная случайная величина. Для случайных величин используют особые, (статистические) методы описания. В зависимости от типа случайных величин - дискретной или непрерывной это делается по-разному. Дискретное описание заключается в том, что указываются все возможные значения данной величины (например - 7 цветов обычного спектра) и для каждой из них указывается вероятность или частота наблюдений именно этого значения при бесконечно большом числе всех наблюдений. К понятию вероятности значения дискретной случайной величины можно подойти и иным путем — через случайные события. Случайное событие (random event,chance event) - исход, случай, результат статистического или иного эксперимента, выборочная точка, элементарное событие, значение случайной величины, значение переменной и др. – основное понятие теории вероятностей. Событие, которое может произойти, либо не произойти и для которого имеется определенная вероятность его наступления. Это наиболее простое понятие в теории вероятностей и математической статистике — событие с вероятностью 0.5 или 50% в 50 133 случаях из 100 может произойти или не произойти, если же его вероятность более 0.5 - оно чаще происходит, чем не происходит. События с вероятностью 1 называют достоверными, а с вероятностью 0 — невозможными. 9.3 Факторный анализ медико-биологических данных В практике работы различных специалистов при проведении исследований наряду с ответом на вопрос о достоверности различий сравниваемых числовых характеристик тех или иных признаков или явлений достаточно часто возникает потребность в ответе на другой важный вопрос: "Оказывает ли влияние величина одного признака на значения какого-либо другого или нескольких других признаков?". Считается, что все явления в природе и обществе и весь мир в целом представляют собой сложную систему отношений, существенной стороной которой является связь и взаимодействие причины и следствия. Благодаря этой связи, одни явления и процессы порождают другие, осуществляется вечное движение и развитие. Общая закономерность связи и взаимодействия относится также и к случайным явлениям, изучаемым в медико-биологических исследованиях. Доказано, что имеется определенная связь между показателями физического развития человека (длина тела, его масса и др.) и между признаками, характеризующими функционирование систем здорового или больного человека (температура тела, частота пульса, артериальное давление и др.). Для того, чтобы правильно понять изучаемое явление, нужно рассматривать его в связи с другими явлениями и процессами. Методы изучения связей таких случайных явлений, как условия труда и быта, - с одной стороны, и показателями состояния здоровья и заболеваемости выделенной категории работающих, - с другой, занимает важное место в медицинской статистике. Врач-исследователь должен быть вооружен методами для выявления связи между случайными явлениями и методами их количественной оценки. 134 9.3.1 Сущность факторного анализа и интерпретация главных факторов После утверждения исследуемых характеристик объекта основным вопросом, предваряющим планирование, является выбор воздействующих факторов. Последние обычно имеют различную биофизическую природу, различаются по направленности своего воздействия относительно систем организма и измеряются в различных, зачастую несравнимых друг с другом единицах. Кроме того, по сути они могут быть как количественные, так и качественные. Поэтому, на практике оказывается достаточным, сравнивать лишь ограниченные диапазоны изменения факторов. Причем ограничения могут накладываться физическими областями их существования, возможностями экспериментальной техники, но, в основном, поставленной задачей исследования. Хотя их относительное влияние на исследуемую функцию может значительно изменяться, характер этого изменения с некоторой точностью можно проследить. Исключить несоразмерности в единицах измерения интервалов возможно, сделав каждый из них изменяющимся от -1 до 1 с нулем в середине интервала. Такое нормирование исследуемых диапазонов особенно важно с теоретической точки зрения, так как в дальнейшем позволит формализовать факторов. проведение Отнормировав «масштабирование») эксперимента диапазоны факторов, в (часто изучаемом пространстве употребляют термин мы преобразуем область определения исследуемой функции отклика в многофакторном пространстве управляемых переменных в многомерный, по числу факторов, куб (гиперкуб). Обычно интервалы варьирования определяются практической необходимостью, из анализа проделанных ранее экспериментов, собственным опытом и искусством экспериментатора. В дальнейшем, при анализе функции отклика, может выявиться необходимость изменения исследуемых диапазонов вариации некоторых факторов, что на основе полученных данных будет значительно легче сделать. 135 Выбор факторов, существенно влияющих на измеряемый параметр, можно проводить с помощью так называемых отсеивающих экспериментов. Теория их планирования занимает несколько обособленное положение. При этом основной вопрос заключается в определении минимального числа экспериментов в зависимости от количества исследуемых факторов для надежного выделения существенных воздействий. Используемые алгоритмы выделения значимых признаков основаны на эвристических рассуждениях, отсутствует аксиоматика построений планов, хотя имеются общие принципы построения статистических программ и даже детали пакетов программ выделения существенных эффектов линейной регрессионной модели. Поэтому в дальнейшем мы остановимся на планах отсеивающих экспериментов, проводимых по общей схеме исследования влияния факторов. Зависимость изучаемого эффекта от входных параметров обычно не только не является детерминированной (стохастическая, так как на результаты экспериментов кроме исследуемых факторов оказывают возмущающее влияние неуправляемые рандомизированные воздействия), но она, как правило, и не определена функционально. Даже вид ее в многофакторном пространстве неизвестен. Остановимся на поисках вида разложения исследуемой функции в многомерный степенной ряд. Такой подход предполагает описание процессов дифференциальными уравнениями, однако на современном этапе познания это сделать не представляется возможным. Более того, предполагается, что такую систему дифференциальных уравнений можно решить, хотя решение неизвестно и неизвестен аналитический вид той функции, которой оно задается. Таким образом, коэффициентами полинома являются значения частных производных в точке многомерного пространства, вокруг которой производится разложение искомой функции в ряд Тейлора. При этом аппроксимирующая функция с каждым шагом остается линейной относительно предыдущей, что значительно облегчает все последующие статистические процедуры. Ортогональность степенных функций, простой вид разложения, возможность постепенного усложнения формы аппроксимирующей поверхности отклика в многомерном пространстве введением степеней более высокого 136 порядка и максимального ее приближения к реально существующей - все это позволяет ограничиться исследованием такого рода моделей для оценок эффектов совместного действия комплекса факторов. Кроме того, такой подход позволяет длительных осуществлять последовательный исследованиях в новых ввод условиях новых с факторов при дополнительными воздействиями на биологический объект. Факторный статистического анализ анализа, (factor analysis) объединяющий – методы раздел оценки многомерного размерности множества наблюдаемых переменных посредством исследования структуры ковариационных или корреляционных матриц. Область математической статистики (один из разделов многомерного статистического анализа), объединяющая вычислительные методы, которые в ряде случаев позволяют получить компактное или сжатое описание исследуемых явлений на основе обработки больших объемов информации. Факторный анализ позволяет получить количественное координатное представление структуры взаимосвязей между объектами, однако эти методы опираются на разные предположения о связи между координатами и полученными данными о близости. Модель факторного анализа предполагает, что структура связей между анализируемыми признаками может быть объяснена тем, что эти переменные зависят от меньшего числа непосредственно не измеряемых факторов. [22,26,32]. От других средств подобного «сжатия информации» метод факторного анализа отличается тем, что не опирается на априорный перечень факторов, влияющих на изучаемые определенных правил переменные. Этот метод при соблюдении обеспечивает возможность обнаружения наиболее важных из этих факторов, даже скрытых. При применении факторного анализа, необходимо помнить и использовать следующие обозначения: Y – изучаемый фактор; Xi – фактор в соответствующих единицах измерения; 137 i = 1, 2, ..., n – номер фактора; k – количество исследуемых факторов; S – число уровней фактора Xi , то есть число различных значений, которые фактор Xi принимает в эксперименте. Для количественных факторов: Xi min, Xi max – минимальная и максимальная границы; ∆Xi – диапазон изменения фактора; Xi0 = (Xi min, – Xi max )/2 – центр диапазона варьирования фактора; xi = 2(Xi, – Xi0 )/ Xi – фактор в нормированных безразмерных единицах, изменяющихся от – 1 до +1. Для качественного фактора обычно не вводится никаких преобразований для перехода к безразмерной переменной, то есть: xi = Xi Факторные модели - это наиболее общие модели, учитывающие как качественные, так и количественные факторы. Такая модель состоит из групп слагаемых, каждое из которых является зависимостью только одного из факторов. Причем для качественного фактора число слагаемых равно числу его уровней, а для количественного - на единицу меньше. Подчеркнем, что стратегия многофакторного эксперимента состоит в варьировании всех контролируемых факторов сразу и их оценивании по результатам всех опытов, проведенных в этом эксперименте. Поэтому уменьшается дисперсия оценки по сравнению с дисперсией единичного измерения. Факторный анализ играет важную роль при решении задач классификации (таксономии, типологии) исследуемых объектов и явлений, а это позволяет: минимизировать описание, т.е. определить основные аспекты различий между объектами наблюдения и изучения; сформулировать гипотезы о природе основных аспектов различий между объектами; 138 выявить структуру взаимосвязей в наборе признаков, проверить гипотезы о взаимосвязях признаков; сопоставить структуру нескольких наборов признаков; построить некоторый обобщающий показатель; ранжировать объекты наблюдения; осуществить типологию объектов наблюдения. Основное предположение факторного анализа заключается в том, что корреляционные связи между большим числом наблюдаемых переменных определяются существованием меньшего числа гипотетических наблюдаемых переменных или факторов. Применение факторного анализа состоит из последовательного выполнения следующих процедур: оценки факторной структуры, т.е. учета факторов j, необходимых для объяснения корреляционной связи между величинами Xi; оценки факторной нагрузки aij выбранных факторов; оценки самих факторов по данным выборки. Принципиальная трудность при интерпретации набора факторов состоит в том, что при их количестве более одного ни сами факторы, ни факторные нагрузки не определяются однозначно, так как в приведенной выше линейной модели они могут быть заменены любым ортогональным преобразованием. Это свойство модели используется в целях преобразования, называемого вращением факторов, которое выбирается так, чтобы наблюдаемые величины имели максимально возможные нагрузки на один главный фактор и минимальные - на остальные. Следует отметить, что если количество выбранных главных факторов совпадает с объёмом выборки (равно количеству исходных параметров Хi), то задача факторного анализа сводится к преобразованию одних параметров в другие (Хi в fi). Иными словами, факторный анализ – это метод сжатия информации об изучаемом явлении на основании представления системы исходных данных 139 некоторой хорошо подобранной системой факторов. Качество этого представления (описания, аппроксимации) оценивается одним или, как правило, несколькими критериями качества матрицы факторных нагрузок. Далее система факторов и оценка их влияния оптимизируются путем итерационной процедуры поиска экстремальных значений выбранных критериев. Отметим также, что правильно и корректно поставленная исследовательская задача - залог успеха в исследовании многофакторных воздействий. Складывается впечатление, что чем больше мы знаем об изучаемых эффектах комбинированного действия, тем успешнее можем сформулировать вопрос к природе и тем точнее будет полученный ответ. И, хотя постановка задачи определяется рядом причин (среди них: требования практики, степень знакомства с объектом и воздействующими факторами, методическая оснащенность экспериментатора, имеющиеся силы и средства и т.п.), на этом этапе оказывается возможным формализовать ряд операций исследователя в зависимости от степени его знакомства с изучаемыми факторами и их действием на организм. При этом цель исследования может определяться четырьмя типами задач, каждой из которых соответствует ряд взаимосвязанных методов статистической обработки данных для проверки выдвигаемых гипотез о поведении многофакторного объекта. 9.3.2 Метод главных компонент Метод главных компонент (Principal component analysis, PCA) — один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Изобретен К. Пирсоном (англ. Karl Pearson) в 1901 г. Вычисление главных компонент сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных. Иногда метод главных компонент называют преобразованием КархуненаЛоэва (англ. Karhunen-Loeve)[1] или преобразованием Хотеллинга (англ. Hotelling transform). 140 Метод главных компонент заключается в определении последовательности ортогональных осей координат, вдоль которых каждый раз в убывающем порядке определяется максимум полной дисперсии (какой процент общей дисперсии всех характеристик воспроизводится отображением их пространства в пространство главных компонентов). Геометрически максимум дисперсии всегда связан с осью первой главной компоненты, максимум оставшейся дисперсии - с осью второй главной компоненты и т.д. Причем попарные коэффициенты корреляции между главными компонентами равны нулю (пространство главных компонентов ортогонально). На практике выделение главных компонентов производится до тех пор, пока они не будут воспроизводить более 90 % общей дисперсии пространство описаний состояния. Формально первые q главные компоненты z1…zq пространства характеристик состояния x1…xn (q<n) получаются, если в качестве допустимых преобразований исходного пространства выбрать всевозможные линейные ортогональные нормированные комбинации характеристик состояния [188] z i ( X ) u1i ( x1 m1 ) . . . u ni ( x n mn ) ; n 2 , u ij 1 ; i 1 n u ij u ik 0 , j k. i 1 где uij – постоянные коэффициенты (нагрузки главных компонентов). Векторы, составленные из коэффициентов, являются собственными векторами ковариационной матрицы, поэтому для их вычисления используется известное уравнение [125, 126] K U i i U i , где i – собственное число ковариационной матрицы K, соответствующее собственному вектору Ui. Собственные числа равны дисперсиям главных компонентов. Если упорядочить собственные числа в порядке убывания, то первой главной компоненте будет соответствовать 141 максимальное собственное число, второй главной компоненте – второе по величине собственное число и т.д. Зная собственное число, соответствующее главной компоненте, можно найти вектор её нагрузок. Для корректного использования метода главных компонентов характеристики состояния должны иметь вариационные размахи одного порядка (для чего исходные данные нормируются в соответствии с п. 4.1.1). Для облегчения интерпретации классов по полученным главным компонентам целесообразно провести вращение их пространства. Целью вращения является получение более простой структуры нового пространства характеристик – когда величины нагрузок переменных на главные компоненты становятся такими, что каждая главная компонента «сильно нагружена» (модули величин нагрузок близки к единице) небольшим числом характеристик состояния и «слабо нагружена» (величины нагрузок близки к нулю) остальными характеристиками. Такое преобразование пространства главных компонент решается методами факторного анализа (пространство главных компонентов преобразуется в пространство факторов). Пространство главных компонентов – частный случай факторного пространства, математическая модель которого имеет следующий формальный вид k x i ( b ij f j ) c i i e i j 1 , i 1..n. , где хi – исходная переменная (характеристика состояния); fj – общие факторы; bij – величины нагрузок на общие факторы; i – характерные факторы; ci – величины нагрузок на характерные факторы; ei – ошибки. Математическая модель метода главных компонентов имеет следующий формальный вид k x i ( a ij z j ) a i0 , j 1 142 где aij – значение нагрузки i-й переменной на j-ю главную компоненту. При определении должной размерности факторного пространства (количества факторов) используются два критерия [215, 375, 516]: 1. критерий Кайзера, рекомендующий учитывать только факторы, соответствующие собственным значениям, превышающим 1. 2. критерий каменистой осыпи, предполагающий анализировать зависимость величины собственного значения от номера фактора для выявления скачков аналогично тому, как это осуществлялось при определении оптимального числа классов по динамике коэффициентов их слияния. Для интерпретации осей сформированного пространства осуществляется этап их вращения. Наиболее эффективными методами вращения осей пространства главных компонентов являются: метод квартимакс – имеет тенденцию к выделению генерального фактора и упрощает интерпретацию за счёт уменьшения числа факторов, связанных с каждой исходной характеристикой состояния; метод варимакс – облегчает интерпретацию за счёт уменьшения числа характеристик состояния, связанных с каждым фактором; методы эквимакс и биквартимакс – дают промежуточный, по сравнению с первыми двумя методами, эффект; метод обликью – реализует косоугольное (не ортогональное) вращение, в результате чего получается более простая структура проекций факторных осей на исходные координатные оси. При решении практических задач выбирается тот метод, с помощью которого получается структура пространства, наиболее понятная эксперту, интерпретирующему классы. Альтернативным способом визуализации пространства объектов, как отмечалось выше, является их отображение на канонические дискриминантные направления. То есть метод главных компонент позволяет на основе специальной обработки данных наблюдений выделить главные факторы, определяющие ход 143 исследуемого случайного явления, и на их базе построить его модель. Применение метода главных компонент включает последовательное выполнение следующих основных этапов: 1. Нормирование значений всех признаков, т.е. приведение их к одному масштабу. 2. Расчёт корреляционной матрицы, характеризующей связи между признаками. 3. Выявление "главных" компонент, в наибольшей мере определяющих дисперсии всех наблюдаемых признаков. 4. Вычисление матрицы факторных нагрузок, содержащей факторные нагрузки наблюдаемых признаков на выбранные главные компоненты. 5. Интерпретация главных компонент в терминах предметной области исследования с целью более тесной привязки их к наблюдаемым группам признаков (методом так называемой ротации факторов). Перед нормированием над матрицей исходных данных производят еще и специальные преобразования, к числу которых чаще всего относятся различные способы пополнения исходной матрицы производными параметрами. Нормирование – это, обычно, последнее преобразование матрицы исходных данных, непосредственно предшествующее применению методов факторного анализа. Самый распространённый вид нормировки – это приведение к стандартной форме, осуществляемое по формуле: zi xi xi xi , (9.2) где xi - математическое ожидание признака хi, xi - среднее квадратическое отклонение признака хi. Ранее уже отмечалось, что как задача выбора перечня всех учитываемых факторов, так и выявление среди них "главных" не имеют однозначного решения. Поэтому для уточнения постановки задачи принято налагать дополнительные требования, основывающиеся на содержательной стороне 144 изучаемого явления, а именно: требование упорядоченности общих факторов по их вкладам в дисперсию наблюдаемых признаков. Если при этом оказывается, что из найденного числа общих факторов лишь несколько имеют упомянутые большие вклады, то для практического анализа, как правило, ограничиваются рассмотрением лишь этих нескольких "наиболее весомых" факторов; при этом факторами с малыми вкладами можно просто пренебречь. Первый фактор находится из условия минимума функционала I1, представляющего собой дисперсии разностей: n I 1 ( zi ai1 fi ) 2 min (9.3) i 1 при том, что фактор fi задан в стандартной форме (т.е. центрирован и нормирован). Доказано, что факторные нагрузки, обеспечивающие минимум функционала I1, должны быть равны коэффициентам корреляции между соответствующим признаком и данным фактором r (zi , fi). При этом фактор f1 должен соответствовать максимуму функционала I2: I2 n r i 1 2 ( zi, f 1) max (9.4) Затем выбираются второй главный фактор, третий и т.д. После того, как выбраны несколько главных факторов (компонент), в значительной степени объясняющие рассеивание данных выборки, можно рассчитать нормированную корреляционную матрицу, в которой коэффициенты корреляции между исходными параметрами и выбранными факторами как раз и будут представлять собой факторные нагрузки i-й переменной на j-й фактор. Интерпретация главных компонент в терминах предметной области исследования с целью более тесной привязки их к наблюдаемым группам признаков (методом так называемой ротации факторов). Метод корреляционных плеяд, предложенный Терентьевым П.В., 145 основан на представлении корреляционной матрицы в виде полного взвешенного графа, что позволяет построить процедуру выделения групп сильно коррелированных параметров. Если получаемые на основе такой обработки группы оказываются с содержательной точки зрения осмысленными как группы связанных параметров, то открывается возможность использовать подход К. Холзингера, который для каждой такой группы предлагает построить один фактор, поведение которого определяло бы поведение всей группы. Иногда с этой целью применяются методы экстремальной группировки параметров. 9.3.3 Вращение (ротация) главных компонент Как уже отмечалось ранее, матрица факторных нагрузок определяется методами факторного анализа неоднозначно, с точностью до произвольного ортогонального преобразования. Это преобразование означает вращение системы координат в подпространстве общих факторов, которое, однако, не меняет положения этого подпространства в пространстве, в частности, относительно множества из n векторов zi, соответствующих исходным параметрам xi. На рисунке 9.1 показана иллюстрация того, как поворот системы координат может упростить трактовку влияния факторов на исходные параметры и, порой, даже уменьшить размерность задачи. 146 f'2 f2 Xk f'1 f1 Рис. 9.1 Иллюстрация того, как поворот системы координат позволяет выявить влияние факторов на исходные параметры На рисунке показана иллюстрация того, как поворот системы координат может упростить трактовку влияния факторов на исходные параметры и, порой, даже уменьшить размерность задачи. Вначале признак Xk представлял собой линейную комбинацию двух факторов f1 и f2, но после ортогонального преобразования (вращения системы координат) стал зависеть лишь от одного фактора f'1; таким образом, размерность факторного пространства уменьшилась. Ротацией главных компонент находят (пытаются найти) матрицу В', наиболее близкую к "идеалу". На каждом шаге итерационной процедуры решения преобразуют лишь один столбец матрицы факторных нагрузок. В основе ротации главных компонент лежит принцип варимакс, который обеспечивает возрастание корреляции главных факторов с определенными группами признаков и уменьшение корреляции с другими признаками при сохранении накопленного вклада выявленных главных факторов в дисперсию наблюдаемых признаков. 9.3.4 Построение линейных моделей для признаков По полученной после ротации матрице факторных нагрузок даётся более 147 точная интерпретация главных факторов, лежащих в основе изучаемого явления, и строятся модели для результирующих признаков, выражающие их через главные факторы: zi ai1 f 1 ai 2 f 2 ... aimfm (9.5) где aij – нагрузки j-го главного фактора на i-й признак, fj – нормированные значения j-го фактора. Переход от нормированного значения признака к его натуральному значению осуществляется по формуле: xi = xi + zi . xi (9.6) где xi - математическое ожидание признака xi , xi - среднее квадратическое отклонение признака xi . По моделям для результативных признаков изучают характер их изменения при изменении главных факторов, степень влияния главных факторов на дисперсию признаков, прогнозируют их значения для заданных величин главных факторов. 9.3.5 Классификация объектов по главным факторам Для проведения классификации объектов наблюдения производится расчёт нормированных значений главных факторов по матрице факторных нагрузок после последней ротации. По полученным данным строят график положения объектов наблюдения в системе координат главных факторов. Вычисляя евклидовы расстояния между парами объектов, можно объединять их в группы выбранного типа по данному фактору. Методы выявления взаимосвязей между случайными величинами находят все более широкое применение в научно-практических работах медико-биологической направленности. Использование факторного анализа позволяет количественно выразить зависимость между факторами-причинами и их следствиями, представить ее в 148 виде математической (и графической) модели. Освоение биологами, врачами клиницистами и организаторами здравоохранения факторного анализа будет способствовать качеству выполнения научных исследований и объективизации клинико-диагностических, экспертных заключений и, тем самым, улучшению лечебной, лечебно-диагностической, экспертной, профилактической и организационной работы. Использование врачами средств современной вычислительной техники существенно облегчит проведение такого анализа. В книге рассмотрены вопросы измерения связи только между несколькими количественными и качественными факторами и одним выходным показателем. Дальнейшее изучение факторного анализа включает применение методов оценки взаимовлияния многих факторов при большом числе наблюдений, измерения связей между количественными и качественными признаками. Необходимая литература по применению этих методик в медицине и биологии имеется [19,28,53,55,56]. 9.4 Дискриминантный анализ Дискриминантный анализ (discriminant – analysis) метод многомерной статистики, применяемый для решения задач классификации (распознавания образов) и позволяющий отнести объект с определенным набором признаков к одному из известных классов. Метод предназначен для решения задач, связанных с разделением совокупности наблюдений (учитываемых признаков, элементарных данных). Метод применяется при наличии у исследователя по одной выборке (она называется «обучающей») из каждой известной ему генеральной совокупности, для приписывания новых результатов наблюдений к своей генеральной совокупности. Метод широко применяется для решения многих медико- биологических задач. В медицине дискриминантный анализ применяется для решения диагностических, прогностических, экспертных задач, выбора методов и схем лечения. 149 Методом дискриминантного анализа получают дискриминантные функции – решающие правила диагностики, которые позволяют выполнить классификацию объектов. Дискриминантный анализ предназначен для изучения различий между несколькими группами объектов. Исходными данными для дискриминантного анализа является множество объектов с указанием классов, к которым они относятся. Для корректного использования линейного дискриминантного анализа (обеспечения достоверности полученных результатов) необходимо обеспечить выполнение двух условий: 1. классифицируемые наблюдения должны быть извлечены из генеральной совокупности, подчинённой многомерному нормальному закону; 2. ковариационные матрицы альтернативных классов должны быть равны. Методы проверки соответствия закона распределения описаний исходных данных нормальному закону проанализированы, например, в [493, 557]. В литературе [31, 340, 492] отмечается, что несоответствие закона распределения описаний исходных данных нормальному закону распределения, хотя и не позволяет гарантировать высокую надежность результатов, но позволяет сделать общие выводы о разделимости исходного пространства дискриминантными функциями. Для проверки равенства ковариационных матриц двух классов используется критерий Бартлетта [31, 528], статистика которого (WB) имеет вид 2 WB 1 ( 1 j 1 sss j 1 2 sss j ) ( 2N 2 2 2 3N 1 ) ( sss j ln [det K 12] (sss j ln [det K jj ]) ) 6( N 1) j 1 j 1 j 1 , где sssi=Ni-1 – число степеней свободы для i-го класса; Ni – число объектов в i-м классе; det – определитель (детерминант) матрицы; Kij – оценка ковариационной матрицы между объектами i-го j-го классов; 150 N – число объектов в i-м и j-м классах. При проверке гипотезы полученная статистика аппроксимируется хиквадрат распределением с n(n+1)/2 степенями свободы. Далее поступают стандартно: если значение WB меньше табличного значения хи-квадрат распределения (с заданным уровнем значимости и числом степеней свободы), то гипотеза о равенстве ковариационных матриц классов принимается. В случае если ковариационные матрицы классов отличаются друг от друга, при построении дискриминантных функций следует использовать меру Фишера, связанную с отношением правдоподобия, расстояние Кульбака, учитывающее различие в ковариационных матрицах и некоторые другие меры, которые при равных ковариационных матрицах классов с точностью до константы сводятся к расстоянию Махаланобиса. В зависимости от порядка получаемых функций дискриминантный анализ бывает 1-го порядка (линейным), 2-го порядка (квадратичным) и т.д. На практике наиболее часто используется линейный дискриминантный анализ, в случае которого объекты разделяются на классы с помощью линейных функций, уравнения которых - линейные комбинации переменных- характеристик объектов классификации - имеют вид: n g ( g ic x i ) , Gc 0c i 1 где Gc – значение дискриминантной функции для с-го класса; gic –значение i-го коэффициента дискриминантной функции для сго класса. Коэффициенты линейной дискриминантной функции определяются из соотношений [31] n g ij l 1 1 k lj x l n n g ij 0,5 q 1 l 1 1 k ql x l x q , где kij-1 – элемент обратной ковариационной матрицы; xi – выборочное среднее i-го класса 151 n ck x ijk xk i 1 j 1 , ck где ck – число объектов в k-м классе. Геометрически уравнение дискриминантной функции определяет гиперплоскость в пространстве характеристик. Число дискриминантных функций равно числу классов, классифицируемый объект относится к тому классу, значение дискриминантной функции которого максимально CL arg max i df i ( X ) , где dfi– значение дискриминантной функции для i-го класса. Другими словами, объект классификации, описываемый вектором характеристик Х, относится к классу Сi, апостериорная вероятность принадлежности к которому максимальна P ( C / X ) exp [ G c ( X . ) ] m exp [ Gi ( X i 1 Показателями качества разделения объектов на ) ] классы в дискриминантном анализе являются: 1) процент правильных классификаций (совпадение решений о классах объектов, полученных с помощью дискриминантных функций с классами, указанными априорно); 2) величина статистики Уилкса - меры различий между классами по всем дискриминантным переменным; 3) попарные расстояния между центрами классов. Для определения процента правильных решений наиболее часто используется метод скользящего экзамена (U-метод, метод Лахенбруха, метод складного ножа - jackknife-метод), который заключается в том, что из исходной совокупности объектов поочередно исключается каждый объект, на сокращённом множестве объектов решается задача дискриминантного анализа и определяется количество дискриминаций. Результатом применения метода 152 является частота неправильной классификации - несмещённая оценка вероятности ошибочной классификации. Для анализа значимости межклассовых различий используется попарное расстояние Махаланобиса, которое связано со статистикой Фишера F ij2 где ( sss k n 1 ) sss m1 sss m2 sss k n ( sss m1 sss m2 ) D ij2 , F – значение статистики Фишера; D – значение расстояния Махаланобиса; sssk – число степеней свободы оценки ковариационной матрицы (в случае отсутствия пропущенных значений – как обычно бывает при диагностики состояния человека – оно на единицу меньше числа объектов); sssmi – число степеней свободы оценки математического ожидания i-го класса (в случае отсутствия пропущенных значений – как в решаемой задаче – число объектов). n – число характеристик состояния. Для андерсоновской модификации линейной дискриминантной функции [31, 553] T Gc ( X X c ) Kc ( X Xc ) ln det K c , c 1, m и выборок, извлеченных из нормально распределенной генеральной совокупности, между межклассовым расстоянием Махаланобиса и ошибками классификации существует монотонная зависимость Рош= Ф(-0,5 D), где Ф – функция Лапласа. Статистика Уилкса (-статистика) - является обобщением дисперсионного отношения Фишера на случай нескольких классов - учитывает как межклассовые различия, так и однородность каждого класса. Для вычисления значения статистики используется формула det K det K , где К – общая ковариационная матрица; 153 К – ковариационная матрица для матрицы данных, полученной объединением всех групп объектов. K K 1 k ' smi ( M i M 0 ) ( M i M 0 ) , sk i 1 где k- число классов; Mi – вектор математического ожидания i-го класса; Мо – математическое ожидание объединённой матрицы данных (для всех классов). Значения статистики Уилкса, близкие к 1 (максимальное её значение) свидетельствуют о совпадении центров классов (плохая различимость), а значения, близкие к 0 (минимальное значение статистики) - о хорошем различении классов. Пр По каждого объекта определяется номер кластера, к которому он отнесён. Полученные результаты классификации являются исходными данными для решения задачи интерпретации выделенных классов. Классификация (classification) – отнесение изучаемых объектов или элементов к тому или иному классу (подмножеству, элементы которого характеризуются неким существом признаком или группой существенных признаков). Дискриминантные функции имеют вид линейных уравнений: F (X) = b1 * x1 + b2 * x2 + … + bk * xk, где b1, b2, …, bk - коэффициенты дискриминантной функции; x1, x2, …, xk – значения 1-го, 2-го, … , k – го признака у обследуемого объекта. Методам исследования общности изучаемых медико-биологических объектов, с описанием их характеристик различными по количеству и качеству признаками, количественными методами разбиения их совокупности 154 на группы посвящен специальный раздел прикладной статистики, который носит название "Кластерный анализ". 9.5. Кластерный анализ В практике работы различных должностных лиц и специалистов здравоохранения и медицинской службы при проведении статистического анализа данных, наряду с ответом на вопрос о достоверности различий сравниваемых числовых характеристик тех или иных признаков или явлений достаточно часто возникает потребность в ответе на другой важный вопрос: "К какому классу следует отнести тот или иной исследуемый медикобиологический объект с выделенным набором признаков?". Иначе говоря "Как классифицировать группу исследуемых медико-биологических объектов?". Именно на эти вопросы даёт ответы кластерный анализ. Кластерный анализ кластер-анализ (cluster-analysis) позволяет разбивать исследуемую систему (объект) таким образом, чтобы ее подсистемы (элементы) одного класса находились на небольшом расстоянии друг от друга, в то время как разные классы были бы на достаточном удалении друг от друга и не разбивались бы на столь же взаимоудаленные части. При выборе метода решения научных задач учитывают то, что полученные результаты должны быть легко интерпретируемы, то есть исследователь должен охарактеризовать каждый полученный класс объектов в соответствующих терминах. Использование методов многомерного шкалирования представляется нецелесообразным, поскольку попарные сравнения обследуемых не являются информативным методом (сложно выбрать «эталон» попарного сравнения и разработать метод анализа отклонений от него). Целенаправленное проецирование используется для анализа выборок, в которых отсутствуют наблюдения, сильно отличающиеся от общей моды, чего при решении задачи диагностики состояния человека гарантировать нельзя. 155 Также может сложиться ситуация, когда даже в пространстве малой размерности не выявляются классы объектов (приходится либо повторно применять методы автоматической классификации, либо использовать другие методы анализа исходного пространства). Кластерный анализ объединяет различные процедуры, используемые для проведения классификации объектов, разбиение которых на однородные (обладающие похожими характеристиками, признаками) группы на первый взгляд не очевидно. Под кластером обычно понимают группу объектов, обладающую свойством плотности (то есть, плотность объектов внутри кластера выше, чем вне его), рассеиванием (характеризуемым дисперсией), отделимостью от других кластеров, формой, размером. Сложность применения метода кластерного анализа состоит в том, что исследуемые медико-биологические объекты, являются многомерными, то есть описываются не одним, а несколькими признаками (если объекты – это больные, тогда признаки – это результаты клинического обследования), объединение их в группы проводится в пространстве большого числа измерений. К тому же, отдельные параметры исследуемых объектов могут иметь нечисловой характер. 9.5.1 Сущность кластерного анализа и его основные этапы Кластерный анализ – раздел многомерного статистического анализа, разрабатывающий методы классификации изучаемых медико-биологических или иных объектов на основании набора их характеристик (признаков). Кластерный анализ предназначен для разбиения исходного пространства объектов на однородные группы (кластеры, таксоны) таким образом, чтобы расстояния между объектами какой-либо группы были существенно меньшими, чем расстояния между группами объектов. Пусть задана совокупность объектов, каждый из которых характеризуется набором m признаков (данными наблюдения) Х = (x1, x2, … , 156 xm). Предполагается, что внутри этой совокупности объектов присутствует некая закономерность их взаимного расположения, которая, может быть, поначалу неизвестна, но которую нужно выявить. Это можно сделать разбиением всей совокупности объектов на несколько частей, внутри которых вариабельность объектов будет значительно меньше, чем во всей совокупности. Такие части называют кластерами (таксонами – в таксономии или образами – в распознавании образов). Методы кластеризации делятся на две большие группы: агломеративные (от слова agglomerate – скопление). В агломеративных (объединительных) методах наиболее близкие по характеристикам объекты объединяются в один кластер; далее эти кластеры могут объединяться в кластеры следующего, более высокого, уровня. Схематически это представляют в виде дендрограммы или дерева. дивизимные (от слова division – деление, разделение). В дивизимных (итеративных) методах единая поначалу совокупность объектов разбивается на кластеры, обладающие некоторым единством признаков. Процедуру разбиения совокупности объектов на кластеры образно можно показать в следующем виде. Вообразим пространство, в котором точками представлены объекты. Даже из чисто интуитивных соображений эти объекты можно объединить в группы по признакам подобия, близости друг к другу или взаимосвязи между ними. То есть, одной из главных характеристик, принимаемых во внимание при этом, выступает взаимное расстояние между объектами, оценить которое можно различными мерами. В общем случае задача классификации заключается в нахождении такого разбиения объектов на классы, при котором показатель качества классификации принимает экстремальное значение. Формальная постановка задачи имеет вид k Q ( ; d X j XC i ) i 2 X jk i где Q– extr – k– extr , показатель качества классификации; экстремум (минимум или максимум); число классов состояний; 157 X – вектор характеристик классифицируемого объекта (описание текущего состояния индивида); XC i – вектор характеристик, определяющих центр i-го класса. d– метрика, определяющая расстояние между точками в пространстве характеристик состояния. Для решения задачи классификации необходимо установить правила отнесения объекта классификации к одному из нескольких классов на основании определения некоторого числа его характеристик и построить описания этих классов. Отнесение объекта к одному из классов с известным описанием называют идентификацией объекта. С помощью методов кластерного анализа однородные группировки выявляются на основе анализа расстояний между объектами. Разработано большое число алгоритмов формирования однородных группировок, поэтому можно рассчитывать на успешность применения этого подхода при решении задачи синтеза математического обеспечения состояния. Решение задачи кластер-анализа предусматривает выполнение следующей последовательности этапов (шагов): 5. выбор меры близости между объектами; 6. выбор подхода к выделению кластеров (стратегии кластеризации); 7. выбор типа алгоритма кластеризации; 8. выбор признака формирования кластера. Первым этапом решения задачи классификации является выбор меры близости между классифицируемыми объектами - метрики. Метрика - это количественная мера различия, удовлетворяющая четырём требованиям: неразличимость идентичных объектов; различимость нетождественных объектов; симметрия; неравенство треугольника [321]. Среди характеристик состояния могут быть характеристики, измеряемые в количественной, номинальной или порядковой шкалах. В самом простом случае все характеристики состояния измеряются в одной и той же шкале, но на практике для описания состояния может использоваться и несколько типов шкал измерения. 158 Перед применением к исходным данным алгоритмов анализа их структуры всегда возникает необходимость использования предобработки, состоящей в оцифровке, нормировке и выборе метрики. 9.5.1.1 Этапы кластерного анализа Процедура применения метода кластерного анализа обычно включает в себя два этапа: 1. Формирование представления о взаимном расположении объектов, для чего вводят меру сходства объектов. Обычно это осуществляют следующими путями: - устанавливают коэффициенты подобия объектов; - определяют коэффициенты корреляции между признаками объектов; - вычисляют расстояния между объектами в пространстве признаков. 2. Объединение объектов в кластеры на основе информации о мере их сходства- это и есть собственно процедура кластеризации. Существует три типа процедур кластеризации: - иерархические процедуры, когда на каждом шаге объединяются два или более объекта, образуя новый кластер, которые постепенно укрупняются, включая в себя "близкие" к ним объекты – до тех пор, пока не образуется несколько крупных кластеров, включающих все исследуемые объекты. Иерархические процедуры относительно просты в реализации, но при большом количестве объектов их сложно применить за приемлемое время даже при наличии современной вычислительной техники; - параллельные процедуры, когда на каждом шаге оперируют сразу со всеми объектами; в процессе итераций кластерная структура совокупности объектов улучшается, пока не станет удовлетворять заданным критериям; - последовательные процедуры, когда на каждом шаге обрабатывается небольшая часть объектов, и полученный результат сравнивается с результатом предыдущего этапа. 159 9.5.1.2 Коэффициент корреляции как мера сходства объектов Одной из важных задач медико-биологических исследований является изучение связи между факторами, воздействующими на организм, и параметрами-откликами на эти воздействия. Выявление и установление причинно-следственной связи – важный элемент исследования. Наиболее распространенный стандартный способ выявления и доказательства взаимосвязи нескольких переменных, измеряемых по порядковой или интегральной шкале, - вычисление коэффициента корреляции. То есть два фактора могут рассматриваться в качестве причины и следствия, если между ними имеется корреляция. Например, и это доказано, что распространение СПИДа связано с половым поведением и применением наркотиков. Автомобильный травматизм и уровень смертности от него связан с качеством дорог, культурой поведения водителей, соблюдением правил дорожного движения. Производственный травматизм - с несоблюдением правил техники безопасности. Специалисты в области биологии и медицины, изучающие (исследующие или выявляющие) причину, обычно ищут патогенетический механизм или путь развития заболевания. Установление причины и выяснение патогенеза заболеваний играет важнейшую роль в решении научных и практических задач прогресса медицины и науки. Вместе с тем, при выполнении исследований необходимо помнить, что корреляция не всегда обусловлена причинно-следственной связью. Коэффициент корреляции может быть преобразован в меру расстояния между двумя объектами следующим образом: Dr = arc cos r, где r - коэффициент корреляции признаков объектов. Такая мера расстояния отвечает всем требованиям, предъявляемым к метрикам. Из формулы видно, что при r = 1 расстояние Dr = 0; 160 при r = 0 расстояние Dr = π/2; при r = -1 расстояние Dr = π – максимальное значение. Следует учитывать, что использование коэффициента корреляции в качестве меры близости исследуемых объектов допустимо лишь при проверке сходства внутри одной выборки, а не между группами объектов. 9.5.1.3 Коэффициенты подобия как мера сходства объектов Рассмотрим так называемые дихотомические (бинарные) признаки, то есть признаки, которые могут принимать только два значения: "Да" и "Нет". При этом каждый объект характеризуется вектором наблюдений, составляющие которого могут принимать значения только 0 или 1 – наличие или отсутствие качества. Для таких признаков в медицине, биологии и пр. применяются меры сходства, называемые коэффициентами подобия. Коэффициенты подобия должны удовлетворять трем требованиям: 1. 0 ≤ S(x1, x2) ≤ 1 при x1 ≠ x2; 2. S(x1, x2) = 1 при x1 = x2; 3. S(x1, x2) = S(x2, x1). (9.7) Таким образом, наибольшее сходство характеризуется коэффициентом подобия S(x1, x2) = 1, а полное отсутствие сходства S(x1, x2) = 0. Отметим, что коэффициент корреляции не может служить коэффициентом подобия, так как не удовлетворяет первому требованию. Простейшей мерой подобия может служить отношение числа совпадающих признаков к общему их количеству: S12 = (n11 + n00) / m , (9.8) где m – размерность вектора признаков, n11 – количество совпадающих признаков у двух объектов, имеющих значение 1; n00 - количество совпадающих признаков у двух объектов, имеющих значение 0. 161 9.5.2 Функции расстояния для непрерывно варьирующих признаков Расстояние между объектами – одна из важнейших мер сходства объектов. Интуитивно понятно, что чем меньше расстояние между объектами, тем более они схожи. Но как ввести меру сходства, как естественно выбрать "линейку" для измерения расстояния между объектами? 9.5.2.1 Понятие функции расстояния (метрики) и требования к ним Есть два объекта с векторами наблюдаемых признаков Х1 и Х2; известны (или можно рассчитать) средние X 1 и X 2 . Тогда некоторая функция от этих векторов средних ( X 1 X 2) называется функцией расстояния или метрикой, если выполняются условия: 1. ( X 1 X 2) ≥ 0; 2. ( X 1 X 2) = 0, если 3. ( X 1 X 2) = ( X 2 X 1) ; 4. ( X 1 X 3) ≤ ( X 1 X 2) + ( X 2 X 3) . X1 = X 2; ( 9.9) 9.5.2.2 Некоторые виды метрик для непрерывно варьирующих признаков 1. Метрика Хемминга Расстояние по Хеммингу вычисляется как сумма абсолютных величин разностей средних значений признаков двух объектов: m ( X 1 X 2) X 1i X 2i . (9.10) i 1 В 1909 году Я. Чекановским было предложено оценивать расстояние между двумя объектами по формуле, являющейся доработкой метрики Хемминга: 162 1 m Dcz ( X 1 X 2) X 1i X 2i . m i 1 (9.11) Но со временем выяснилось, что отсутствие учёта дисперсий признаков приводит к тому, что на значение этого расстояния большое влияние оказывают признаки с большей изменчивостью, тогда как признаки, имеющие малые дисперсии, меняют его слабо. Кроме того, эта формула не учитывает влияние корреляции между признаками. В 1932 году Я. Чекановский устранил отмеченный выше недостаток, введя в формулу средние квадратические отклонения признаков: 1 m X 1i X 2i Dcz ( X 1 X 2) . m i 1 i (9.12) 2. Расстояние Евклида Расстояние по Евклиду вычисляется как расстояние между двумя точками в пространстве: DE m ( X 1i X 2i ) i 1 2 . (9.13) В 1898 году Ф. Гейнке применил в биологических исследованиях евклидову меру расстояния, в которой разность по каждому признаку нормировалась на значение внутригруппового среднего квадратического отклонения: 2 DH2 1 m X 2i X 1i 1 m ( ) d i2 . m i 1 i m i 1 (9.14) В начале 50-х годов Л. Пенроуз предложил разбить общее (рисунок 9.2) расстояние по Евклиду на два: по величине (график А) и по форме (график В): 163 DQ DQ А В С Рис. 9.2. Графики расстояний между двумя точками в пространстве по Евклиду На рисунке 9.2, (график С) показан вариант, когда между объектами есть различия как по величине, так и по форме. Тогда расстояние по Евклиду (9.13) может быть записано суммой этих двух составляющих: 1 m 2 1 m 2 m m 1 1 m 1 DE DH2 DQ2 DZ2 di di di . (9.15) m m i 1 m m 1 i 1 m i 1 Одним из недостатков метрики Евклида является невозможность учёта взаимной коррелированности признаков. Пусть, например, два признака Х1 и Х2 коррелированны; тогда оси, соответствующие им, образуют косоугольную систему координат. В этой системе координат расстояние между объектами 2 и 4 значительно меньше, чем между 1 и 3. Но если рассматривать эти признаки как некоррелированные, то придётся работать в прямоугольной системе координат, в которой расстояния 1 – 3 и 2 – 4 "примерно равны", что не соответствует действительности (рисунок 9.3). Л.Пенроуз коррелированность и Р.Кнуссманн признаков, но пытались только в учитывать частном взаимную случае, когда коэффициенты корреляции приблизительно равны; к тому же, их формулы аналитически не обоснованы. 164 Х2 Х2 2 2 3 3 1 1 4 Х1 4 Х1 Рис.9.3 Расстояние между объектами 2 - 4 и 1 - 3 в прямоугольной и косоугольной системах координат 3. Супремум-норма Мерой расстояния в этом случае служит точная верхняя граница абсолютных величин разностей средних значений признаков двух объектов: ( X 1 X 2) sup X 1i X 2i 4. Расстояние Махалонобиса Расстояние по Махалонобису сводится к преобразованию вектора разности средних значений признаков двух объектов и вычисляется следующим образом: 2 DM ( X 2 X 1)'.S 1.( X 2 X 1) , (9.16) где S-1 – обратная матрица ковариационной матрицы признаков исследуемых объектов; — - знак транспонирования. Этот подход был предложен в 30-х годах П.Махалонобисом и Р.Фишером, их подход позволяет учитывать взаимную коррелированность признаков. Кстати, упоминаемое ранее (евклидово) расстояние по Ф.Гейнке (2.4) является частным случаем расстояния Махалонобиса: 2 2 DM mDH 165 Подобно формуле (9.15) расстояние по Махалонобису (9.16) тоже может быть разложено на расстояния по величине и по форме, но эта операция связана с огромным объёмом промежуточных вычислений. 9.5.3 Функции расстояния для качественных признаков Различные подходы к вычислению расстояний между непрерывно изменяющимися признаками выдвигаются учеными многих стран уже более века, а вот история оценки расстояний для качественных признаков насчитывает всего лет 40-50. Пусть существует m качественных признаков объектов; предположим, что первый признак может принимать k1 значений с частостями соответственно p11, p12, …, p1k1; второй признак может принимать k2 значений с частостями соответственно p21, p22, …, p2k2 и т.д. Для каждого признака выполняется условие pij 1. Величину fi=ri – 1 будем понимать как число j степеней свободы i-го качественного признака. Следует отметить, что если при работе с непрерывно варьирующими признаками подразумевается нормальный закон их распределения, а при работе с дискретно варьирующими признаками обычно рассматривают полиномиальное распределение. Тогда описание изменчивости i-го качественного признака задаётся вектором частостей Pi' [ pi1, pi 2, ..., p1k1 ] и ковариационной матрицей Si. Взаимные связи признаков не рассматриваются, что значительно упрощает ситуацию. pi1(1 pi1) Si pi1 pi 2 pi1 pi 2 ... pi1 pik i pi 2(1 pi 2) ... pi 2 pik i ... ... ... ... pi1 pik i pi 2 pik i ... pik i(1 pik i) (9.17) 166 1. Расстояние Спулера Эта форма является самой простой, но, в то же время, и самой несовершенной мерой расстояния между объектами, характеризуемыми качественными признаками, поскольку не учитываются ковариации внутри системы объектов: m ki p 2ij p1ij 2 Ds i 1 j 1 . m (9.18) fi i 1 Здесь для каждого признака вычисляются квадраты различия частостей по числу степеней свободы; полученные результаты суммируются по каждому объекту и по всем объектам; всё это делится на сумму степеней свободы по всем признакам. 2. Расстояние Сангви Эта мера по своей конструкции напоминает критерий χ2: i2 ki p 2ij p1ij 2 j 1 pij , (9.19) где pij = ( p2ij p1ij )/2 – среднее значение частости появления данного признака у сравниваемых объектов; причем, объёмы выборок, по которым вычисляются векторы p1i и p2i, должны быть равны. Тогда расстояние по Сангви получается суммированием этих "критериев" по всем признакам: 100 D m 2 m i2 (9.20) fi i 1 i 1 Показано, что эта форма оценки расстояния с точностью до множителя равно расстоянию, в котором учитываются ковариационные матрицы 167 признаков. 3. Расстояние Стейнберга А.Стейнберг предложил формулу, похожую на расстояние Махалонобиса: 2 DSt m p 2i p1i ' .Si1. p 2i p1i (9.21) i 1 где Si-1 – матрица, обратная ковариационной матрице (9.19) для вектора частостей pi=( p1i p2i )/2, причем, размерность матрицы, для которой берется обратная, в этом случае на единицу меньше, чем у матрицы (9.19), т.к. из неё исключается столбец и строка, соответствующие признаку. Расстояния Сангви и Стейнберга связаны соотношением: 2 DSt 2 m D fi . 50 i 1 1 (9.22) Если объёмы выборок, по которым вычисляются векторы p1i и p2i, не равны, то усреднение в формулах (9.20) и (9.21) производится по формуле: pji 1 N1 N 2 N1 p1i N 2 p2i (9.23) В этом случае соотношение (9.21) уже не выполняется. 4. Расстояния на основе трансформации частостей в угловую меру Наиболее часто применяется преобразование вида, идея которого принадлежит Р.Фишеру: ij arcsin pij . (9.24) При этом дисперсии сравниваемых признаков стабилизируются и равны N/4. Для бинарных (дихотомических) признаков, вычисляются разности "угловых" мер расстояний, а уж по ним расстояние Оливье – Хауэллса: 168 2ij 1ij arcsin p2ij arcsin p1ij , m ( 2ij 1ij ) 2 DOH i 1 . m (9.25) К сожалению, до сих пор не разработано достаточно корректного способа вычисления расстояний между объектами, имеющими смешанный (качественные и непрерывные количественные) набор признаков. Использование кластерного анализа позволяет научно аргументирвть и классифицировать объекты исследования, представить их состояние в виде математической и (или) графической модели, осуществить необходимый прогноз. Освоение врачами кластерного анализа способствует объективизации клинико-диагностических заключений и тем самым повышению качества лечебной, лечебно-профилактической и научной работы. Использование средств современной вычислительной техники существенно облегчит применение такого анализа. Рассмотренные вопросы классификации объектов, описываемых как количественными, так и качественными признаками дают возможность выполнять дальнейшее изучение медико-биологических объектов и позволяют проводить и оценивать их кластеризацию при большем (или меньшем) числе наблюдений, а также измерять связи между количественными и качественными признаками исследуемых объектов. 9.6 Дисперсионный анализ в исследовании медико-биологических проблем В своей практической и научной работе врачи различных специальностей нередко сталкиваются с необходимостью установления и оценки степени влияния одного или нескольких факторов на выходной параметр. В этом случае наряду с корреляционным и регрессионным 169 анализами при изучении причинно-следственных отношений между явлениями особенно ценным может оказаться метод дисперсионного анализа. Дисперсионный анализ (variance analysis) - 1. Раздел математической статистики, посвященный методам выявления влияния отдельных факторов на результат эксперимента. 2. Метод математической статистики, предназначенный для моделирования количественного выходного параметраотклика на воздействующие входные факторы, уровни которых оцениваются качественно, по номинальной шкале [22,26]. Этот метод впервые предложил Роналд Эйлмер Фишер как средство обработки результатов агрономических опытов и многофакторных агробиологических экспериментов, с помощью которых выявлялись наиболее благоприятные условия для выращивания сельскохозяйственных культур. Метод постоянно совершенствовался, развивался и в настоящее время правильнее говорить не о методе, а о методах дисперсионного анализа. Факторов, влияющих на результативный признак, много, но учету подлежит лишь небольшая группа основных, организованных в конкретном исследовании. Остальные, неконтролируемые факторы, учитываются суммарно, недифференцированно. В зависимости от количества контролируемых факторов различают одно-, двух-, и многофакторный дисперсионный анализ. Обработка клинических и экспериментальных данных с использованием дисперсионного анализа связана с большим объемом вычислений. В последние годы с появлением возможности выполнять расчетные работы на персональных компьютерах по стандартным программам, дисперсионный анализ стал более широко использоваться в медицинских исследованиях и экспериментах, особенно для установления степени влияния на результирующий признак качественных факторов, то есть таких факторов, уровни которых невозможно оценить количественно (например, методы лечения, медицинские препараты и т.д.). В современных условиях решение задач методами дисперсионного анализа проводится на персональных компьютерах по модулю 170 ANOVA/MANOVA пакета прикладных программ Statistica или в иных пакетах прикладных программ. 9.6.1 Сущность и задачи дисперсионного анализа. Полный факторный эксперимент Признаки, изменяющиеся под воздействием тех или иных причин, называются результативными признаками3, а причины, вызвавшие изменение величины результативного признака или признаков, - факторами. Например, показатели физического развития, заболеваемость студентов их успеваемость и т.п. - все это признаки, на которые оказывают влияние различные факторы: режим питания, труда, отдыха, физические и умственные упражнения (занятия), окружающая среда и т.п. Факторы обозначаются заглавными буквами латинского алфавита A, B, C … , а учитываемые признаки строчными - через x, y, z, … . На один и тот же результативный признак может воздействовать много факторов, но в опыте регулируются лишь некоторые из них. Они называются регулируемыми или организованными факторами в отличие от тех, которые регулированию не подвергаются, хотя и оказывают воздействие на величину результативного признака. Обычно каждый регулируемый фактор испытывается серийно, в виде нескольких обособленных друг от друга групп, называемых уровнями или градациями фактора. Их принято обозначать теми же буквами, которыми обозначаются факторы. Например, уровни фактора А обозначаются через А1, А2, А3 и т.д., а фактора В - В1, В2, В3 и т.д. Число уровней (градаций) того или иного фактора определяет врачспециалист, исходя из цели и задач исследования, глубокого знания существа изучаемого явления (например, испытываемые дозы лекарственных веществ, методы лечения, возрастные группы больных и т.д.). Выходной параметр в научной литературе называют также результативными признаками или параметрами-откликами 171 3 Каждый фактор в эксперименте может варьировать на нескольких уровнях, фиксируемых количественно (например, фактор А - температура среды: А1 - 30о, А2 - 15о, А3 - 0оС; фактор В – тяжесть заболевания: В1 - легкая, В2 - средняя, В3 - тяжелая) или качественно (например, три метода лечения некоторого заболевания). Дисперсионный анализ позволяет оценивать совместное действие регулируемых факторов на результативный признак, а также действие каждого из них в отдельности. Нерегулируемые в опыте факторы учитываются не дифференцированно, а суммарно. Сущность дисперсии дисперсионного выходного параметра анализа заключается (параметра-отклика, в разложении результативного признака) на составляющие: - дисперсию вследствие влияния контролируемых факторов; - дисперсию, вызываемую действием неконтролируемых, случайных факторов и ошибками ввода или измерения. При своем зарождении в 1920-1930-х годах прошлого столетия задачей факторного эксперимента считалось усреднение влияния неконтролируемых факторов. Эксперимент полностью рандомизировался для того, чтобы при обработке методами дисперсионного анализа можно было бы четко выделить влияние неконтролируемых факторов. В настоящее время построение регрессионных моделей с помощью получивших широкое развитие методов планирования экспериментов является одним из возможных и перспективных способов исследования. В общем случае нормирование таких ситуаций можно проводить на основе кусочно-гладкой экстраполяции изучаемых эффектов. Необходимость нормирования комбинированного (многофакторного) воздействия закономерно выдвигает задачу разработки методов дискриминации сочетаний факторов, используя эмпирические модели. Связав диапазон вариабельности объектов с уровнем приемлемого риска, можно проникнуть внутрь биологической вариабельности, поставив ей в противовес определенный параметр – вероятность неправильной классификации [Ушаков]. 172 Для применения методов дисперсионного анализа обычно применяют полный факторный эксперимент. Число опытных точек, равное числу сочетаний уровней входных факторов в полном факторном эксперименте, равно произведению числа уровней всех факторов. Например, в двухфакторном эксперименте при числе уровней фактора А р = 4 и фактора В q = 3, число опытных точек (наблюдений) равно pq = 4 3 = 12. При наблюдении в каждой опытной точке n = 5 испытуемых общее число испытаний в эксперименте составит N = pqn = 5 * 4 * 3 = 60. Если число исследуемых факторов более 3, то целесообразно планировать дробный факторный эксперимент, который строится, чаще всего, по схеме латинских квадратов. Латинский квадрат порядка n – квадратная матрица порядка n, каждая строка и каждый столбец которой являются перестановками элементов конечного множества S, состоящего из n элементов. Два латинских квадрата, построенные на одном и том же множестве S, называют эквивалентными, если один из другого получается перестановкой строк, столбцов и переименованием элементов. Два латинских квадрата А и В, построенные на одном и том же множестве S, с элементами aij и bij называют ортогональными, если (aij, bij) ≠ (akl, bkl) при (i, j) ≠ (k, l), при i, j, k, l € S, где (aij, bij) – элемент на пересечении i-й строки и j-го столбца матрицы, полученной наложением двух латинских квадратов А и В. Множество из n-1 попарно ортогональных латинских квадратов порядка n называется полным. План дробного факторного эксперимента с тремя факторами, построенный по схеме латинского квадрата первого порядка показан в таблице 2. Таблица 2 План дробного факторного эксперимента с тремя факторами Уровни факторов B1 Факторы A1 A2 A3 C3 C2 C1 173 B2 C1 C3 C2 B3 C2 C1 C3 План дробного факторного эксперимента с четырьмя факторами, построенный по схеме латинского квадрата второго порядка показан в таблице 3. Таблица 3 План дробного факторного эксперимента с четырьмя факторами Факторы Уровни факторов A1 A2 A3 А4 В1 C1D1 C4D2 C3D3 C2D4 В2 C2D3 C1D4 C4D1 C3D2 В3 C3D4 C2D3 C1D2 C4D1 В4 C4D2 C3D1 C2D4 C1D3 Сущность метода дисперсионного анализа заключается в следующем. Если регулируемый фактор оказывает влияние на признак, то непременно скажется на величине групповых средних, которые будут существенно отличаться друг от друга. Внутри каждой группы тоже обнаружится варьирование, вызванное влиянием на признак нерегулируемых в опыте факторов. Зависимость между этими источниками варьирования выразится равенством: SS SS1 SS2 (9.26) где SS - сумма квадратов отклонений в N наблюдениях выходного параметра Yik от общего среднего Y , i = 1, 2, … , p; k = 1, 2, … , n; SS1 - сумма квадратов отклонений P средних значений Yi от общего среднего Y , обусловленных влиянием контролируемого фактора А; 174 SS2 - остаточная сумма квадратов отклонений N наблюдений Yik от P средних значений Yi , обусловленных влиянием случайных, неконтролируемых факторов. Степень влияния факторов на выходной параметр характеризуется отношениями: SS1 1 100% SS 2 ; SS 2 100% . SS (9.27) Отнесением сумм квадратов отклонений к числам степеней свободы (f) SS1 SS 2 SS D D D 1 2 получаются выборочные дисперсии , f1 ; f2 ; f которые служат оценками соответствующих генеральных параметров: D 2 - общей дисперсии комплекса , D1 - межгрупповой дисперсии 12 , D2 - дисперсии внутригрупповой, или остаточной 2 . 2 Отношение дисперсии межгрупповой или факториальной, к дисперсии внутригрупповой, или остаточной, F D1 D2 служит критерием оценки влияния на признак регулируемых в опыте факторов. Величина F называется критерием Фишера. Нулевая гипотеза H o сводится к предположению, что генеральные межгрупповые средние равны и дисперсии групп и межгрупповые генеральные дисперсии не различаются. Иными словами, нулевая гипотеза исходит из того, что никакого систематического воздействия регулируемых факторов на результативный признак не существует, и наблюдаемые между 175 групповыми средними различия случайны. Это предположение, или нулевая гипотеза, отвергается, если Fнабл Fкр для принятого уровня значимости и чисел степеней свободы f1 и f 2 . В противном случае, т.е. когда Fнабл Fкр нулевая гипотеза принимается, и различия, наблюдаемые между групповыми средними комплекса, признаются несущественными, случайными. После доказательства статистической достоверности действия регулируемого фактора (факторов) или их совместного действия на признак, переходят, когда это необходимо, к сравнению групповых средних друг с другом или с другими показателями (общей средней комплекса, с принятой нормой и т.д.). Заключительный этап дисперсионного анализа - оценка силы влияния отдельных факторов или их совместного действия на результативный признак. 9.6.2 Определение степени влияния факторов на выходной параметр и оценка её значимости 9.6.2.1. Анализ однофакторных комплексов Однофакторные дисперсионные комплексы могут быть равномерными и неравномерными. Независимо от этого, техника дисперсионного анализа однофакторных комплексов сводится, главным образом, к расчету показателей варьирования, которыми в области дисперсионного анализа служат средние квадраты отклонений, или дисперсии, а также к расчету групповых или частных средних Yi и общей средней арифметической для всего комплекса в целом Y . Пусть исследуется влияние на выходной параметр (результативный признак) Y всего одного фактора A, варьирующего на P уровнях. На каждом уровне фактора A наблюдаются n объектов. Общее число испытаний N = n * P. Результаты этого эксперимента представляют в виде таблицы значений 176 выходного параметра Yik i 1,2,....,P; K 1,2,....,n , в которой будет n строк и p столбцов (таблица 4). Таблица 4 Исходные данные для однофакторного дисперсионного анализа Номер опыта Уровни фактора A A1 A2 ... Ai ... Ap 1 Y11 Y21 ... Yi1 ... Yp1 2 Y12 Y22 ... Yi2 ... Yp2 . ... ... ... ... ... ... k Y1k Y2k ... Yik ... Ypk . ... ... ... ... ... ... n Y1n Y2n ... Yin ... Ypn образом исходные данные Представленные таким (результаты клинических наблюдений или экспериментальных данных) могут быть обработаны на ПЭВМ по соответствующей программе (даже без участия врача-специалиста) с выдачей на печать конечных результатов обработки для последующего анализа и формирования выводов. Формулы для расчета сумм квадратов отклонений SS, числа степеней свободы f, дисперсий D, корреляционных отношений и критерия Фишера F даны в таблице 5. Одно- и двухфакторные комплексы дисперсионного анализа могут успешно решаться и с помощью доступного каждому врачу персонального компьютера. При этом обработка первичных данных может проводиться различными схемами. Для однофакторных равномерных комплексов такой схемой может служить следующий порядок операций. 1. Сгруппировать исходные данные в виде комбинационной таблицы таким образом, чтобы градации регулируемого фактора (А) располагались по горизонтали в верхней части таблицы, образуя ее графы или столбцы, а 177 значения результативного признака (Y), т.е. варианты (Yi) размещались по строкам. 2. Рассчитать вспомогательные величины, необходимые для определения сумм квадратов отклонений - Y i N 2 Yi i 1 N i 1 N SS Yi Y N 2 i 1 2 , (9.28) где SS - общая сумма квадратов; межгрупповая сумма квадратов рассчитывается по следующим формулам: P SS1 Y i 1 2 i n 2 Y i ; N N SS1 n Yi Y P 2 i 1 или N Yi P 2 SS1 n Yi i 1 N i 1 2 . (9.29) Внутригрупповую, или остаточную, сумму квадратов определяют по разности между общей и межгрупповой суммами квадратов: SS2 SS SS1 . Здесь Yi - варианты, входящие в состав всего комплекса его отдельных групп, или градаций; Y - общая, а Yi - групповые средние арифметические; 178 n - число вариантов в отдельных группах (градациях) комплекса; N n - общее число вариантов или объем дисперсионного i комплекса. 3. Определить число степеней свободы (f) по формулам таблицы 2. Следует иметь ввиду, что числа степеней свободы в соответствии с равенством SS SS1 SS2 находятся между собой в определенных количественных соотношениях: f f1 f 2 . По этому равенству можно контролировать правильность расчета этих величин. 4. Рассчитать общую дисперсию для всего комплекса, межгрупповую и остаточную дисперсии по формулам таблицы 2. 5. Определить эффективность действия фактора А на результативный признак. Для этого применить дисперсионное отношение, или критерий Фишера F D1 D2 приD 1 D2 (9.30) Результаты дисперсионного анализа сводят в таблицу. Так как дисперсионное отношение F D1 D2 - величина случайная, его сравнивают с табличным (критическим) значением критерия Фишера для принятого уровня значимости F кр и соответствующих чисел степеней свободы f1 и f2. При этом число степеней свободы для большей дисперсии находится по горизонтали, а для меньшей дисперсии - в первом столбце таблицы Фишера. Нулевая гипотеза отвергается и эффективность действия фактора А на результативный признак признается статистически достоверной, если Fнабл Fкр . В противном случае нулевая гипотеза принимается. 179 Таблица 2. Формулы для расчета общей, межгрупповой и остаточной дисперсий Вариация Межгрупповая Внутригрупповая Общая Число степеней свободы (f) Суммы квадратов отклонений (SS) f1 p 1 SS1 f2 N p f N 1 SS 2 SS Средние квадраты (S2) D1 SS1 f1 D2 SS 2 f2 D SS f Дисперсион ное отношение (Fф) Fф D1 D2 --- 180 9.6.2.2. Анализ двухфакторных комплексов Принципиальной разницы между анализом многофакторных комплексов и схемами, применяющимися при анализе однофакторных дисперсионных комплексов, нет. Многофакторный анализ не изменяет, а лишь несколько усложняет общую схему, поскольку наряду с воздействием каждого фактора в отдельности приходится учитывать и их совместное действие на результирующий признак. Результаты эксперимента представляют в таблице с n строками и pq столбцами, где p - градации (уровни) фактора А, q - градации фактора В и n численность вариантов в отдельных клетках комбинационной таблицы. Основное уравнение двухфакторного дисперсионного анализа : SS SS A SSB SS AB SS2 (9.31) где SS - сумма квадратов отклонений результатов N наблюдений от общего среднего Y ; SSA - сумма квадратов отклонений средних значений Yi от общего среднего Y , обусловленных влиянием фактора А; SSB - сумма квадратов отклонений средних значений Y j от общего среднего Y , обусловленных влиянием фактора B; SSAB - сумма квадратов отклонений средних значений Yij от общего среднего Y , обусловленных влиянием взаимодействия факторов А и В; SS2 - сумма квадратов отклонений результатов наблюдений от средних значений Yij , обусловленных влиянием случайных, неконтролируемых факторов. Средние значения выходного параметра определяют по формулам : 181 n Yij Y ijk k 1 , n (9.32) q Yi Y ij j 1 , q (9.33) p Yj Y Y ij i 1 p , p q n i 1 j 1 k 1 (9.34) Y ijk N , (9.35) где i – номер варианта фактора А, i = 1 - p, j - номер варианта фактора B, j = 1 – q, k – номер опыта при данном сочетании факторов А и В, k = 1 – n, N = p*q*n – общее количество опытов. Формулы для расчета сумм квадратов отклонений SS, числа степеней свободы f, дисперсий D, критерия Фишера F и корреляционных отношений даны выше. Обработку первичных данных по этим формулам осуществляют, как правило, с помощью ЭВМ по стандартным программам по следующей схеме: 1. Как и при обработке однофакторных комплексов, рассчитать общую сумму квадратов отклонений SS Yi 2 H i . (9.36) 2. Определить общую факториальную (SS1) и остаточную (SS2) суммы квадратов отклонений: 182 2 Y2 i H SS1 i n i, j . (9.37) 3. Определить суммы квадратов отклонений для фактора А и В: SS A Y SS B Y Y H; Y H . (9.38) 2 2 H , или SS A A nA 2 B nB A pq 2 H , или SS A B pn 4. Определить сумму квадратов отклонений для совместного действия факторов: SS AB SS1 SS A SSB , или SS AB SS1 SS A SSB . (9.39) В этих формулах: Y ij i, j H N где Yij 2 , - варианты, входящие в состав дисперсионного комплекса; YA - сумма вариантов по фактору А; i YB - сумма вариантов по фактору В; j nA p q - количество вариантов в градациях фактора А; nB pn - количество вариантов в градациях фактора В; N pqn - общая численность вариантов, входящих в состав дисперсионного комплекса; 183 p - число градаций фактора А; q - число градаций фактора В. 5. Установить число степеней свободы f: f1 = pq – 1; f2 = N – pq. Отношением сумм квадратов отклонений к соответствующим числам степеней свободы определяются дисперсии, а по их отношениям к величине остаточной дисперсии определяется F критерий, который сравнивается с критическим значением F кр для принятого уровня значимости и соответствующих чисел степеней свободы (f). Метод дисперсионного анализа находит все более широкое применение в научно-практической работе врачей всех специальностей. Использование дисперсионного анализа позволяет количественно установить степень влияния входных факторов и их взаимодействий на исследуемый выходной параметр (результативный признак). Основная идея метода заключается в изучении источников изменчивости выходного параметра и разложения общей дисперсии его наблюдаемых значений на составные части: дисперсию, обусловленную влиянием контролируемых факторов и их взаимодействий и остаточную дисперсию, являющуюся следствием неконтролируемых, случайных факторов. Сравнение факториальных дисперсий с остаточной, позволяет оценить статистическую значимость влияния факторов и их взаимодействий на выходной параметр. По доле факториальной дисперсии в общей дисперсии судят о степени влияния факторов и их совместного действия на объективизацию заключений об эффективности применяемых методов лечения и профилактики и тем самым повышению качества лечебной и профилактической работы. Кроме рассмотренных одно- и двухфакторных примеров применения дисперсионного анализа в практике медицинских исследований применяют также трех-, и четырехфакторные модели дисперсионного анализа. Выделять в группе контролируемых более трех-четырех факторов нецелесообразно по причинам сложности обработки и интерпретации результатов эксперимента. Так как, уже в случае трехфакторного эксперимента необходимо оценить 184 степень влияния на изменчивость результативного признака трех контролируемых факторов А, В, С, трех парных взаимодействий факторов А и В, А и С, В и С и одного взаимодействия всех трех контролируемых факторов А, В и С. Алгоритм обработки результатов полного многофакторного эксперимента дается в специальной литературе (Лисенков А.Н., 1979; Юнкеров В.И., 2002). Очевидно, что многофакторный дисперсионный анализ при трех-пяти уровнях каждого фактора и достаточном количестве объектов наблюдения в каждой ячейке плана эксперимента, требует значительного количества испытаний, затрат средств и времени. 185 10. ПРОГНОЗИРОВАНИЕ В НАУЧНЫХ ИССЛЕДОВАНИЯХ После накопления информации, ее систематизации, создания логических и, по возможности, математических моделей исследуемого процесса конечной, последней точкой всякого медицинского исследования является создание системы врачебного прогноза нежелательных сдвигов в организме и разработка комплекса мероприятий по их предупреждению. В настоящее время вполне сформировалась теоретико- методологическая база, методологический и технический арсенал средств и методов прогнозирования, причем развитие конкретных методов прогнозирования происходило опережающим способом по отношению к общей теории, что в течение достаточно длительного периода способствовало осторожному отношению к прогностике, как науке и методологии научного познания [3,4,6,10]. Представляется целесообразным пояснить содержание терминов "прогнозирование" и "прогноз". Прогнозирование (forecasting, prognostique) - это научное исследование, основанное на установлении причинно-следственных связей и закономерностей выявления состояний и вероятных путей развития медикобиологических явлений и процессов; сущностью прогнозирования является процедура разработки прогноза. Прогнозирование предполагает получение и оценку показателей, характеризующих эти явления и процессы в будущем. Для достоверного прогнозирования необходим системный подход к изучаемым объектам, явлениям и процессам [9,20,24]. Прогноз (forecast, prediction) - научно обоснованное предвидение основных параметров исследуемых процессов в более или менее отдаленном будущем. При решении задач организации здравоохранения прогноз выполняется обычно в форме расчета показателей заболеваемости (величины и структуры) в целом или по отдельным нозологиям, построенного на гипотезах относительно будущей динамики тех или иных значений при некоторых обоснованных предположениях об ожидаемых изменениях влияния факторов 186 и условий внешней среды (обстановки). Предвидение может иметь разный диапазон, от оценки общей величины показателей заболеваемости в регионе (городе, районе, округе, субъекте федерации) до детального расчета предполагаемой структуры заболеваний по сезонам, кварталам, иным периодам, степени тяжести, профилю и др. Шиган Е.Н. под прогнозированием понимает определение свойств и состояния изучаемого объекта в будущем [50] . В ряде работ по социальному прогнозированию Бестужев-Лада И.В. определяет прогнозирование как специальное научное исследование, предметом которого являются перспективы развития изучаемого явления [3,4]. С позиций самых общих подходов, прогнозирование, как одна из форм научного предвидения, представляется, как функция всех наук, причем, в каждой науке она проявляется по-разному, но проявляется обязательно. Медико-биологическими объектами прогнозирования могут быть здоровье индивидуума, деятельность учреждений и системы здравоохранения в целом, ресурсы здравоохранения, их использование и др. В теории по проблемно-целевому критерию различают два типа прогнозов: поисковые и нормативные [4]. Поисковый прогноз – это определение возможных состояний в будущем на основе исследования тенденций развития изучаемого явления в прошлом и настоящем. Нормативный прогноз – это определение путей и сроков достижения возможных состояний явления, принимаемых в качестве цели. Кроме основных типов прогнозов, некоторые авторы выделяют так называемый организационный прогноз [3,6,9,31]. Этот прогноз ориентирует управленческие решения на достижение поставленной цели. В нем сопоставляются результаты нормативов, охватывающих весь комплекс организационных мероприятий с целью повышения качества управления. В основе прогнозирования лежат три источника информации о будущем: 187 оценка перспектив развития, будущего состояния прогнозируемого явления на основе опыта, чаще всего путем аналогии с достаточно хорошо известными сходными явления и процессами; условное положение в будущее (экстраполяция) тенденции, закономерности развития которых в прошлом и настоящем достаточно хорошо известны; модель будущего состояния или иного явления, построенная сообразно ожидаемым или желательным изменениям ряда условий, перспективы развития которых достаточно хорошо известны. Упоминая, что вообще методов прогнозирования более ста, Мартыненко В.Ф. [22] предлагает различать три крупных класса этих методов. Первый класс составляют методы экстраполяции, которые разделяются на группы: процедур экстраполяции данных о параметрах объекта прогноза; оценочных, функциональных характеристик систем; системных и структурных характеристик. Второй класс составляют методы экспертизы, которые включают группы методов индивидуальных и коллективных экспертных оценок. Третий класс составляют методы моделирования, в которых различают три группы: "логических моделей-образцов" (методы исторических аналогий, прогнозных сценариев и др.); математических моделей (вероятностных, статистических, имитационных и др.); информационных моделей (методы патентного поиска, анализа потоков публикаций и др.). Шиган Е.Н. к уже упоминавшимся трем классам методов прогнозирования - экстраполяции, экспертизе и моделированию добавляет класс комбинированных прогнозов, объединяющий различные методы первых трех классов [50,51]. 188 В недалеком прошлом одним из основных методов получения прогнозов были методы экстраполяции, основной идеей которых является предположение или уверенность в том, что тенденции прошлого сохранятся в будущем, а определяющие эти тенденции факторы останутся без изменения. Понятно, что такая идеология четко ограничивает применение этих методов только для слабодинамичных, склонных к монотонности стабильных систем, которые не имеют тенденций сколько-нибудь значительного изменения в будущем [4,6,10,31,49]. Сущность методов прогнозной экстраполяции состоит в предварительном изучении динамики интересующего параметра за достаточно длительный период времени. Выявленная таким образом предшествующая тенденция представляется в виде динамического (временного) ряда. Далее используется хорошо разработанная методология анализа временных рядов, как правило, предполагающая определение тренда с последующим подбором соответствующего аппроксимирующего уравнения для описания выявленной тенденции и ее пролонгирования. Прогнозирование тенденции на перспективу проводится с использованием того же аппроксимирующего уравнения [49]. Отмечая широкое распространение этих методов и чрезвычайную полезность их применения в задачах организации здравоохранения, следует отчетливо понимать, чего они не позволяют: учитывать уже происшедшие изменения факторов, определяющих традиционное поведение системы в прошлом, следовательно, поведение продолжаться не будет и прогноз не имеет смысла; предсказать результат, если один или несколько факторов изменятся, и это приведет к другим темпам развития; подсказать, какие именно факторы (условия) надо изменить, чтобы добиться желаемого развития. Таким образом, методы экстраполяции не являются универсальными и не позволяют решить всех прогностических задач, которые предлагает современная теория и практика. 189 Особенностью прогнозирования ситуационной медицинской обстановки в научных исследованиях и практической деятельности является необходимость синтеза основных видов прогноза, т.е. поисковый прогноз должен быть дополнен целевым прогнозом, позволяющим в конечном итоге наметить пути достижения поставленной цели (целей). Для осуществления поискового прогноза ситуационной медицинской обстановки необходимо учитывать следующие прогнозные модели: ретроспективной динамики уровня и структуры заболеваемости; экологической обстановки; возможностей материальной базы учреждений здравоохранения по выполнению возлагаемых на них задач; возможностей медицинских кадров. Для прогнозирования возможного развития ситуационной медицинской обстановки требуются исходные данные о заболеваемости, об учреждениях здравоохранения, плотности населения, типе местности, наличии населенных пунктов и др. При исследовании динамических процессов, характеризующих заболеваемость (смертность, летальность или иных) за определенный промежуток времени выделяют тенденцию развития изменений, она может снижаться, нарастать или сохраняться на прежнем уровне. Однако, далеко не во всех случаях, тенденция может быть определена достаточно точно. Для этого используют специальные методы расчета и получение таких показателей как абсолютный уровень, рост, прирост и темп роста и прироста. Эти показатели позволяют судить о величине изменений, происходящих в каждом из сопоставляемых рядов. К методам прогнозирования относят также выявление систематических или трендовых изменений, определяющих общую тенденцию развития, для чего используют сглаживание и выравнивание рядов. трендовых изменений являются важнейшими Тип и характер характеристиками эпидемических процессов. 190 В книге рассмотрены организационные основы и методологические аспекты применения метода системного анализа для познания, исследования, обучения, изложения, достижения определенных результатов и практического преобразования медицинских, биологических и других объектов. Материалы изложены с учетом общих принципов применения метода системного анализа для решения научных задач в области медицины и биологии. При написании монографии использован опыт преподавания на кафедре автоматизации управления медицинской службой (с военно-медицинской статистикой) Военно-медицинской академии, а также опыт анализа научных исследований, выполненных в Государственном научно-исследовательском испытательном институте военной медицины Минобороны России, опыт рецензирования научных статей и диссертационных работ. Не претендуя на исчерпывающее изложение вопросов, касающихся статистической обработки медико- биологической информации, авторы выражают надежду, что обобщенные в монографии литературные данные помогут лицам, приступающим к выполнению исследований, избежать ошибок при его проведении, правильно спланировать выполнение работ, предусмотреть использование современных информационных технологий и методов сбора, обработки и анализа информации. Книга подготовлена коллективом авторов в результате длительного обсуждения проблем и применения системного анализа для решения медикобиологических задач. Авторы выражают большую благодарность за предложения и замечания, способствовавшие улучшению издания, рецензентам - … 191 СПИСОК ЛИТЕРАТУРЫ 1. Авен П.О., Ослон А.А., Мучник И.Б. Функциональное шкалирование. М.: Наука, 1988, 182с. 2. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей: Справочное издание. М.: Финансы и статистика, 1985, 487с. 3. Алешина Н.А., Анисов А.М., Быстров П.И. и др. Логика и компьютер. Моделирование рассуждений и проверка правильности программ. М. Наука.- 1990.- 240 с. 4. Антонов А.В. Системный анализ. – М.: Высшая школа, 2004. – 452 с. 5. Анфилатов В.С., Емельянов А.А., Кукушкин А.А. Системный анализ в управлении. – М.: Финансы и статистика, 2003. – 367 с. 6. Бестужев-Лада И.В. Поисковый и нормативный прогнозы, как основа для предпроектной иерархизации перспективных социальных проблем и целей социального развития// Вопросы социального проектирования: Материалы ХШ Международного симпозиума "Планирование и прогнозирование социальных процессов". - М.: Мысль, 1990.165 с. 7. Бешелев С.Д., Гурвич Ф.Г. Математико-статистические методы экспертных оценок. – М.: Статистика, 1980. – 262 с. 8. Бирюков Б.В., Воробьев Г.Г. Тезаурусный подход к коммуникативным процессам и документальная информация. В кн.: Информация и управление. Философскометодологические аспекты. М.: "Наука". 1985. С. 47-69 9. Бобровницкий И.П., Гридин Л.А., Богомолов А.В. Возможности ранней автоматизированной диагностики артериальной гипертензии // Врач, № 1, 2001. 10. Богомолов А.В. Автоматизированное распознавание ранних стадий нарушений функционального состояния человека на базе лингвистических переменных и методов обработки экспертной информации // Информационные технологии, № 8, 1999. 11. Богомолов А.В. Синтез выражения для расчёта индекса соответствия объекта альтернативным классам по результатам многомерной статистической классификации // Информационные технологии, № 12, 1999. 12. Богомолов А.В., Гридин Л.А., Кукушкин Ю.А., Ушаков И.Б. Диагностика состояния человека: математические подходы – М.: Медицина, 2003. – 464 с. 13. Вишнев С.М. Основы комплексного прогнозирования. – М.: Финансы и статистика, 1981. –223 с. 192 14. Волкова В.Н., Денисов А.А. Основы теории систем и системного анализа. – СПб: изд. СПбГТУ. – 510 с. 15. Воробьев Г.Г., Канцлерис А.Ю. К определению понятия "документ". - Сов. архивы, 1972, № 2, с. 67-69 16. Генкин А.А., Медведев В.И. Прогнозирование психофизиологических состояний. – Л.: Наука, 1973. – 143 с. 17. Георгиевский А.С. Методология и методика научно-исследовательской работы в медицине.― Л. : Медицина, 1981.— С 12. 18. Горский Д.П., Ивин А.А., Никифоров А.Л. Краткий словарь по логике.- М.: Просвещение, 1991.- 208 с. 19. Григорьев С.Г., Столяр В.П. К вопросу о моделировании и прогнозировании в решении задач управления здравоохранением// I городская научно-практическая конференция военных учебных и научных учреждений Санкт-Петербурга «Военная наука и образование - городу».- СПб, 1997.- Ч.2.- С. 135. 20. Гублер Е.В. Вычислительные методы анализа и распознавания патологических процессов. Л.: Медицина, Ленингр. отд., 1978, 294с. 21. Дегтярёв Ю.И. Системный анализ и исследование операций. – М.: Высшая школа, 1996. – 355 с. 22. Демидов Б.А. Методы военно-научных исследований. ч.1.- Харьков: ВИРТА ПВО, 1987.- 673с. 23. Дмитриев А.К., Кравченко И.Д. Модель процесса диагностирования при использовании непрерывных диагностических признаков // Изв. ВУЗов. Приборостроение.1994.- № 11-12.-С.7-14. 24. Дорошев В.Г. Системный подход к здоровью лётного состава в XXI веке. – М.: Паритет– Граф, 2000. – 365 с. 25. Дэйвисон М. Многомерное шкалирование: Методы наглядного представления данных. М.: Финансы и статистика, 1988, 254с. 26. Евстигнеев Е.А К вопросу методологии математического моделирования операций // Военная мысль. - 1987.- №7.- с. 33-41. 27. Емелин И.В. Компьютеризированная история болезни и системы классификации медицинских терминов // Компьют. технол. в мед. -1997. - №2. - С.53-57. 28. Емелин И.В. О стандартах электронного обмена медицинскими документами // Компьют. технол. в мед. -1996.-№1.-С.44-48. 193 29. Иванов В.Н., Голов Ю.С. Системный подход к организации медицинского обеспечения войск//Актуальные проблемы медицинской реабилитации/6 Центральный военный клинический госпиталь МО РФ.-М., 1995.-С.16-21. 30. Кант В.И. Математические методы и моделирование в здравоохранении. – М.: Медицина, 1987. – 224 с. 31. Катулев А.Н., Северцев Н.А. Математические методы в системах поддержки принятия решений. – М.: Высшая школа, 2005. – 312 с. 32. Кислова Ю.В., Солошенко Н.В., Богомолов А.В., Загородников С.Н.Математическое моделирование нервной регуляции гемодинамики человека // Биомедицинские технологии и радиоэлектроника. - № 11-12, 2005. 33. Кобринский Б.А., Бухны Д.И., Тестер И.Б. и др. Система компьютерного анализа взаимосвязи заболеваемости детей с факторами загрязнения окружающей среды. Российский фонд алгоритмов и программ: Nо.гос.рег. 50920000048. М.: НПО "МЕДСОЦЭКОНОМИНФОРМ", 1992, 28с. 34. Компьютерная биометрия: Пакет CSS 3.1 Практикум по анализу данных/ Киреев О.В., Кобзев А.С., Лядов В.Р., Николаевич М.С., Скрипка А.А., Юнкеров В.И.; Под ред. проф. В.Р.Лядова.- 1977.- 156 с. 35. Концепция единого информационного пространства Вооруженных Сил Российской Федерации (проект) М.: 2004 .- 28с 36. Корнеенко А.А. Разработка и научное обоснование метода оптимизации информационной инфраструктуры многопрофильного лечебного учреждения (на примере 400-коечного госпиталя). Дис. … канд. мед. наук.- Л.: ВМедА, 2000.-208с 37. Кузютин Д.В. Математические методы стратегического анализа многосторонних отношений: учебное пособие. – СПб.: изд. СПбГТУ, 2000. – 91 с. 38. Кузютин Д.В. Методы поиска коллективных предпочтений групп экспертов. – М., 1999. – 90 с. 39. Кукушкин Ю.А., Богомолов А.В. Методика синтеза показателя психофизиологического напряжения оператора //Медицинская техника. - 2001. - №4. - С. 29- 33. 40. Кукушкин Ю.А., Бухтияров И.В., Богомолов А.В. Обобщение материалов независимых экспериментальных исследований методом мета-анализа //Информационные технологии - 2001. - №6. - С. 48-53. 194 41. Кукушкин Ю.А., Усов В.М., Богомолов А.В. Автоматизированное оценивание риска нарушения состояния человека с помощью компьютерных вопросников на основе нечеткой логики //Информационные технологии. – 2002. - №10 – С. 44-49. 42. Кукушкин Ю.А., Ушаков И.Б., Богомолов А.В. Математическое обеспечение оценивания состояния материальных систем – М.: Новые технологии, 2004. – 36 с. 43. Лагоша Б.А., Емельянов А.А. Основы системного анализа. – М.: МЭСИ, 1998. – 106 с. 44. Ларичев О.И., Мошкович Е.М. Качественные методы принятия решений. – М.: Наука, 1996. 45. Литвак Б.Г. Экспертная информация: методы получения и анализа. – М.: Радио и связь, 1982. – 94 с. 46. Лопатников Л.И. Экономико-математический словарь, М.: Наука.- 1987.- 509 47. Лощилов В.И., Щукин С. И. Принципы анализа и синтеза биотехнических с. систем: учебное пособие. - М.:МВТУ, 1987. - 89 с. 48. Любищев А.А. Дисперсионный анализ в биологии. М.: Изд-во Моск. ун-та, 1986, 200с. 49. Лядов В.Р. Основы теории вероятностей и математической статистики: Для студентов медицинских ВУЗов Информационно-аналитическая библиотека, Вып.2. - СПб.: ВМедА, 1998. – 108 с 50. Максимов И.Б. Офтальмохирургическая помощь в вооруженном конфликте – 2006 Военно-медицинский журнал. – 2006. - №10. – С. 22-25. 51. Максимов И.Б., Жаров В.В., Найговзина Н.Б. Модель государственной офтальмологической больницы субъекта Российской Федерации М., «АНК», 2003 174 с 52. Масимей И.В. Имитационное моделирование на ЭВМ. - М.: Радио и связь, 1988.- 135с. 53. Математические методы и модели в фармацевтической науке и практике. / Н.Н. Зубов, С.З. Умаров, С.А. Бунин – СПб.: Изд-во Политехн ун-та, 2008. – 249с. 54. Математико-статистические методы в клинической практике. Учебное пособие / под ред. Кувакина В.И. - СПб.: ВМедА, 1993. - 199 с. 55. Международная статистическая классификация болезней и проблем, связанных со здоровьем. МКБ-10.-10-й пересмотр. - Женева: ВОЗ.-«Медицина», 2003г.Т.1(часть 1), 698 с., Т.1(часть 2) 633с.Т.2, 179с.Т.3, 924с 195 56. Мерков А.М., Поляков Л.Е. Санитарная статистика.- М.: Медицина, 1974.- 384 57. Месарович М., Тахакара Я. Общая теория систем: математические основы. – с. М.: Мир, 1978. – 311 с. 58. Методы математической статистики в обработке экономической информации: учебное пособие, Т.Т. Цымбаленко, А.Н. Байдаков, О.С. Цымбаленко и др..- М. Финансы и статистика; Ставрополь: АРГУС, 2007.- 200 с. 59. Механизация и автоматизация обработки статистической информации в медицине и здравоохранении. Под редакцией проф. Л.Е.Полякова.- Л.: Медицина,- 1976г., 200 с. 60. Миротин Л.Б., Ташбаев Ы.Э. Системный анализ в логистике. – М.:Экзамен, 2002. – 480 с. 61. Многомерный статистической анализ и вероятностное моделирование реальных процессов. – М.: Наука, 1990. – 296 с. 62. Моисеев Н.Н. Математические задачи системного анализа. - М. Наука, 1981. 63. Новосельцев В.И., Тарасов Б.В., Голиков В.К., Дёмин Б.Е. Теоретические основы системного анализа. – М.: Майор, 2006. – 592 с. 64. Новосельцев В.Н. Теория управления и биосистемы. Анализ сохранительных свойств. - М.: Наука, 1978. – 320 с. 65. Огарков П.И., Белов А.Б. Современная классификация болезней в информационно-аналитической деятельности медицинской службы при осуществлении санитарно-эпидемиологического надзора.// ВМЖ, т.323, №6.-2002г.-С.61-66. 66. Пеккер Я.С., Бразовский К.С. Компьютерные технологии в медико – биологических исследованиях. Сигналы биологического происхождения и медицинские изображения. Учебное пособие. – Томск: Изд. ТПУ, 2002. – 240 с. 67. Петровский А.М. Системный анализ некоторых медико-биологических проблем, связанных с управлением лечением //Автоматика и телемеханика. – 1979. - № 2.С. 54-61. 68. Платонов А.Е. Статистический анализ в медицине и биологии: задачи, терминология. Логика, компьютерные методы.- М.: из-во РАМН, 2000.- 52 с. 69. Полонников Р.И., Юсупов Р.М. Телемедицина- становление, развитие и проблемы.// Научно- практический семинар «Телемедицина- становление и развитие» под ред. Проф. Р.М.Юсупова, проф. Р.И.Полонникова.-С-Пб.-2000г.-С.5-13. 196 70. Поляков Л.Е., Игнатович Б.И., Лашков К.В. Основы военно-медицинской статистики: Учебник. -Л.: ВМедА, 1977. - 335 с. 71. Рабочая книга по прогнозированию / Отв. Ред. И.В. Бестужев-Лада. – М.: Мысль, 1982. – 430 с. 72. Реброва О.Ю. Международный медицинский терминологический стандарт: использование при разработке информационной системы в неврологии // Сборник по медицинской кибернетике. М., 2004г.- С.72-82. 73. Ривкин В.Л. О научной медицинской информации// Информационные ресурсы России.- 1999.- № 5.- с.24-26. 74. Саати Т. Принятие решений. Методы анализа иерархий. - М.:Радио и связь, 75. Системный анализ и принятие решений (словарь-справочник). –М.: Высшая 1993. школа, 2004. –614 с. 76. Советов Б.Я., Яковлев С.А. Моделирование систем: Лабораторный практикум.- М: Высшая школа, 1989.- 80 с. 77. Спицнадель В.Н. Основы системного анализа: Учеб. пособие. СПб.: Изд. дом «Бизнес-пресса», 2000.-326 с. 78. Столяр В.Л. Телемедицинская сеть России: состояние и перспективы// Новые технологии в медицине.- 1999.-№ 33 (3).- с. 4-7. 79. Столяр В.П., Зубков А.Д., Величко А.Д., Пастухов А.В Применение математических методов формализации медицинских знаний при разработке программного модуля «Диагноз» Медицинская кибернетика в клинической практике: Материалы научнопракт. конф. с международным участием.- Часть 1-М.: ГВКГ им. Н.Н. Бурденко, 2004.с.239-248 80. Столяр В.П., Зубков А.Д., Колесников А.В. Об индивидуальном носителе медицинской информации. ВМЖ № 4 2007, с. 11-16 81. Столяр В.П., Корбут В.Б., Иванов А.Ю. Применение компьютерных технологий в решении задач первичного медицинского учета/ Компьютерные технологии в здравоохранении и курортном лечении// Материалы 6-го Всероссийского симпозиума "Математическое моделирование и компьютерные технологии" 20-22 апреля 2000г. г. Кисловодск. 82. Теория систем и методы системного анализа в управлении и связи. – М.: Радио и связь, 1986. – 248 с. 197 83. Терентьев П.В. Метод корреляционных плеяд. – Вестник ЛГУ, 1959, №9. 84. Терновой К.С., Розенфельд Л.Г., Терновой Н.К., Колотилов Н.Н. Принципы поиска решений медицинских проблем, под ред. К.С. Тернового; АН УССР.- Киев: Наукова думка, 1990.- 200 с. 85. Технология системного моделирования. / Под ред. Емельянова С.В.. – М.: Машиностроение, 1988.- 520с 86. Тимофеев А.В., Иванов В.Ю. Алгоритмы и интернет-технология логико- вероятностного синтеза оптимальных баз знаний. // Международная конференция ИНТЕРНЕТ, ОБЩЕСТВО, ЛИЧНОСТЬ. Тезисы докладов. – СПб., 1999.- с.253-254 87. Титов В.В. Возможности системного анализа применительно к научному и техническому творчеству// "Научная организация труда и управления в научноисследовательских и проектных учреждениях", Москва, МДНТП им. Ф.Э.Дзержинского, 1987.- 7с. 88. Ушаков И.Б., Богомолов А.В., Гридин Л.А., Ю.А.Кукушкин. Методологические подходы к диагностике и оптимизации функционального состояния специалистов операторского профиля – М.: ОАО «Издательство «Медицина», 2004. – 136 с. 89. Ушаков И.Б., Богомолов А.В., Кукушкин Ю.А. Технология автоматизированной синдромной диагностики заболеваний на основе трехзначной логики //Информационные технологии. – 2003. - №7 – С. 34-44. 90. Ушаков И.Б., Пономаренко В.А., Кукушкин Ю.А., Богомолов А.В. Автоматизированные системы для контроля состояния специалистов опасных профессий М.: Новые технологии, 2005. - 24с. 91. Хайтун С.Д. Наукометрия. Состояние и перспективы. – М.: Наука, 1983. – 344 92. Химмельблау Д. Анализ процессов статистическими методами. – М.: Мир, с. 1973. – 957 с. 93. Черкасский Б.Л. Российская и американская эпидемиологические школы: сравнительный анализ// Эпидемиол. и инфекц. бол.-1999.-№4.-С.9-12. 94. Шаппо В.В., Столяр В.П., Зубков А.Д О разработке единого информационного пространства медицинской службы ВС и совершенствования информационного обеспечения системы ее управления ВМЖ № 12 2007, с. 4-11 95. Шевченко Ю.Л., Шихвердиев Н.Н., Оточкин А.В. Прогнозирование в кардиохирургии.- СПб: Питер Паблишинг, 1998.- 208 с. 198 96. Шибанов Г.П. Порядок формирования экспертных групп и проведения коллективной экспертизы // Информационные технологии, № 12, 2003. – С. 26 - 29. 97. Шиган Е.Н. Моделирование и системный анализ в здравоохранении.- М.: ЦОЛИУВ, 1982.- 71с. 98. Щеглов И.Н., Богомолов А.В., Печатнов Ю.А. Алгоритм формирования обучающей выборки искусственной нейронной сети // Нейрокомпьютеры: разработка и применение, № 2, 2000. 99. Щеглов И.Н., Богомолов А.В., Печатнов Ю.А.Интенсификация разработки автоматизированных систем обучения на основе нейросетевых технологий // Информационные технологии, № 11, 2002. 100. Эйзен С., Афифи АА. Статистический анализ: Подход с использованием ЭВМ.- М.: Мир, 1982. – 156 с. 101. Эфрон Б. Нетрадиционные методы многомерного статистического анализа. М.: Финансы и статистика, 1988, 263с. 102. Югай Г.А. Философские проблемы теоретической биологии.- М.: Мысль, 1976.- 247 с. 103. Юнкеров В.И. Основы математико-статистического моделирования и применения вычислительной техники в научных исследованиях.- СПб, 2000.-138 с. 104. Юнкеров В.И., Григорьев С.Г. Математико-статистическая обработка данных медицинских исследований. – СПб.: ВМедА, 2002. – 266 с. 105. Chute C.G., Cohn S.P., Campbell K.E. etal. The content coverage of clinical classifications // Am. J. Med. Inform. Assoc. -1996. - Vol.3, N3. - P.224-233. 106. E1kIn P.L., RuggIeri A.P., Brown S.H. et al. A randomized controlled trial of the accuracy of clinical record using SNOMED-RT as compared with ICD9-CM // Proc AMIA Symp. -2001.-P.159-163 107. Miller G.A. The magical number seven, plus or minus two; some limits on our capacity, for process-ing information. Psychol. Rev., 1956, vol.63, p.81-87. 108. Norell S.E. Workbook of Epidemiology. N.Y.; Oxford: Oxford Univ. Press. 1995. 317pp. 109. Shortliffe E.H., Buchanan, B.G. Mathematical Biosciences, vol.23, 1975. (MYCIN), с.318 199 110. Vinik E., Sirman D., Georges L.P. "Medical informatics in a medical research facility. An interactive multimedia presentation". Diabetes as a model / Proc. Annu. Symp. Comput. Appl. Med. Care, 1991, p.879-881. 111. William Farr (1856): Sixteenth annual report. London, Registrar General of England and Wales, 1856, App. p. 73. 112. Zwolinski P., Rivest P. Graphic symbol system for health services.- In: Systems science on health care. Toronto. 1981, vol. 2, p.1555-1557. 200