www.rae.ru Научный журнал "Фундаментальные исследования" Российская Академия Естествознания №2 2009 год УДК 621.372 ОНТОЛОГИИ МЕДИЦИНСКОГО ЗНАНИЯ С ТЕМПОРАЛЬНЫМИ АСПЕКТАМИ 1 Хашаев З.Х.-M. , Плесневич Г.С.2, Шекшеев Э.М.3 1 Институт проблем передачи информации им. А.А. Харкевича РАН, Москва 2 Московский Энергетический Институт 3 Институт биохимической физики им. Н.М. Эмануэля РАН, Москва Подробная информация об авторах размещена на сайте «Ученые России» - http://www.famous-scientists.ru В работе показано как строить онтологии медицинского знания, используя концептуальные языки системы «Бинарная Модель Знаний». Важной чертой этих онтологий является учет темпоральных (временных) ограничений, определяющих течение болезни. Такие онтологии могут использоваться в Семантическом вебе. Ключевые слова к статье: гепатит В, медицинская онтология, темпоральные аспекты, модели знаний. 1. Введение Темпоральные (временные) аспекты играют существенную роль в медицинском знании. Болезни характеризуются сложными паттернами симптомов, которые появляются и исчезают в определенной временной последовательности. Во многих случаях этот темпоральный паттерн симптомов является существенным для диагноза болезни. Рассмотрим, например, задачу диагноза гепатита В на основе выявления антигенов и антител, описанную в [1]. Для диагноза гепатитов выполняются серологические исследования, при которых могут быть обнаружены антитела к вирусам гепатита. Первая фаза после заражения вирусом гепатита В – инкубационный период, который обычно длится от двух до четырех месяцев, хотя встречается очень короткий период (10 дней) или очень длинный (9 месяцев). К концу инкубационного периода обнаруживается определенные антитела, которые указывают на начало острой фазы заболевания. Затем наступает период выздоровления, при котором происходит сероконверсия антигенов вируса гепатита в антитела. Последний период – фаза выработки иммунитета, характеризуемого положительным тестом на антитела. Возможны различные течения гепатита. Эти течения описываются как курсы, которые представляются в виде системы событий, определяемых появлением и исчезновением определенных антигенов и антител. Имеется 4 основных курса, анализ которых показывает, что: ▪ количественная темпоральная информация (длины временных интервалов событий) представляется средними значениями, тогда как индивидуальные значения могут варьировать от случая к случаю. Но качественная темпоральная информация (например, что данное антитело появляется в курсе раньше другого) является устойчивой; ▪ все курсы выглядят одинаково с точки зрения серологических данных. Они различаются порядком их появления. Это подсказывает, что в формальную модель (онтологию) для представления медицинского знания о течении болезней, следует включать темпоральные отношения. Известной логикой темпоральных отношений является интервальная логика Аллена [2]. Мы рассмотрим расширение системы концептуальных языков «Бинарная Модель Знаний» (БМЗ) [3], [4], [5] [6], которое включает средства логики Аллена, и покажем как, используя БМЗ составить онтологию, представляющую знание о течении гепатита В. Российская Академия Естествознания №2 2009 год www.rae.ru Научный журнал "Фундаментальные исследования" Замечание. Медицинские онтологии используются при построении семантических веб-сервисов для биоинформатики [7], а также при составлении метаданных для биомедицинских ресурсов в Семантическом вебе [8]. 2. Пример составления онтологии на основе БМЗ Типичная инфекционная болезнь, имеет 4 фазы: инкубационный период, острый период, выздоровление и период иммунизации, которые следуют друг за другом. Введем события Инкубация, Острый_период, Выздоровление, Иммунизация, представляющие эти фазы. Тогда эти события представляются следующими предложениями [6]: event(Инкубация), event(Острый_период), event(Выздоровление), event(Иммунизация). Рассмотрим гепатит В, т.е. гепатит, возникающий при инфицировании вирусом HBV. Следующие предложения пред- ставляют некоторое общее знание, касающееся гепатита В: Гепатит = Внутренняя_болезнь(Место_поражение = Печень) Вирусный_гепатит = Гепатит(Этиология.Фактор = Вирус), Вирус[Тип:String, Антигены:Антиген(*)], (Антиген Сероконверсия Антитело), Гепатит_В = Вирусный_гепатит(Вирус.Тип = 'HBV'). При рутинном серологическом исследовании на диагноз гепатита В проводится тесты на: ▪ поверхностный антиген HBsAg и антитело к нему anti-HBs; ▪ оболочный антиген HBeAg и антитело к нему anti-HBe; ▪ антитела anti-HBc IgN и anti-HBc к ядерному антигену НВс. Обозначим через С<HBsAg> событие, во время которого существует антиген при тесте на антиген HBsAg. Подобные обозначения сделаем для событий, определяемых другими антигенами и антителами. Декларируя все эти события в онтологии, записываем следующие предложения: event(C<HBsAg>), event(C<anti-HBs>), event(C<HBeAg>), event(C<anti-HBe>), event(C<Ign_anti-HBc), event(C<anti-HBc>). Введем классы, означающие обнаружение антигена и антитела: Обнаруж Антитигена = C<anti-HBs> | C<anti-HBe | C<anti-HBc | C<Ign_anti-HBc. Обнаруж Антитела = C<HBsAg> | C<HBs> | C<HBeAg> Гепатит В имеет четыре основных типа течения, примеры которых могут быть такими [1]: Тип 1 характеризуются следующим паттерном временных интервалов: Инкубация Острый_период Выздоровление Иммунизация |==========|===============|=============|============| C<HBsAg> C<anti-HBs> |========================| ========= C<HBeAg> C<anti-HBe> |==========|===================================== www.rae.ru Научный журнал "Фундаментальные исследования" Российская Академия Естествознания №2 2009 год C<anti-HBc> |========================================== C<Igm_anti-HBc> Тип 2 характеризуется следующим паттерном временных интервалов: Инкубация Острый_период Выздоровление Иммунизация |===========|=============|==============|===========| C<HBsAg> C<anti-HBs> |=========================| ======== C<HBeAg> C<anti-HBe> |===========| |==================== C<anti-HBc> |========================================== C<Igm_anti-HBc> |==============================| Тип 3 характеризуется следующим паттерном временных интервалов: Инкубация Острый_период Выздоровление Иммунизация |===========|=============|==============|===========| C<HBsAg> C<anti-HBs> |=========================| ================ C<HBeAg> C<anti-HBe> |===========| |============| C<anti-HBc> |========================================== C<Igm_anti-HBc> Тип 4 характеризуется следующим паттерном временных интервалов: Инкубация Острый_период Выздоровление Иммунизация |===========|=============|==============|===========| C<HBsAg> C<anti-HBs> |=========================|==================| C<HBeAg> C<anti-HBe> |===========|===============| C<anti-HBc> |========================================== C<Igm_anti-HBc> |======================| Информацию о типе 1 течения гепатита В можно представить в онтологии следующими предложениями: (Инкубация meets Острый_период), (Инкубация overlaps C<HBsAg>), (Инкубация meets C<anti-HBc>), (Инкубация meets C<Igm_anti-HBc) (Острый_период meets Выздоровление), (Острый_период starts C<anti-HBc>), (Острый_период starts C<Igm_anti-HBc>), (Острый_период i-overlaps C<HBeAg>), (1) (2) (3) Российская Академия Естествознания №2 2009 год www.rae.ru Научный журнал "Фундаментальные исследования" (Иммунизация overlaps C<anti-HBs>), (Иммунизация during C<anti-HBe>), (Иммунизация during C<anti-HBc>), (Иммунизация i-overlaps C<Igm_anti-HBc>), (Выздоровление meets Иммунизация), (Выздоровление i-overlaps C<HBsAg>), (C<HBеAg> meets C<anti-HBe>), Замечание. Так как в диаграмму интервалов для типа 1 входят 10 событий, то имеется 102 = 100 предложений, выражающих базовые темпоральные отношения между этими событиями. Однако, вышеуказанные 14 предложений составляют минимальное множество предложений, из которых остальные 86 предложений являются логическими следствиями этих 14 предложений. Например, ясно, что из предложений (1) – (4) следует предложение (Острый_период during C<HBsAg). Аналогичные минимальные системы предложений можно указать для типов 2, 3 и 4. Из минимальных систем предложений для указанных четырех типов течений гепатита В можно получить обобщенный тип течения болезни. Этот тип представляется следующими предложениями: (Инкубация meets Острый_период), (Инкубация overlaps C<HBsAg>), (Инкубация meets C<anti-HBc>), (Инкубация meets C<Igm_anti-HBc), (Острый_период meets Выздоровление), (Острый_период starts C<anti-HBc>), (Острый_период starts C<Igm_anti-HBc>), (Острый_период ioverlaps, C<HBeAg>), (Иммунизация {overlaps, starts, i-overlaps} C<anti-HBs>), (Иммунизация {during, i-overlaps} C<antiHBe>), (Иммунизация {during, i-before} C<anti-HBc>), (Иммунизация {i-overlaps, imeets, i-before} C<Igm_anti-HBc>), (Выздоровление meets Иммунизация), (Выздоровление {i-overlaps, i-before} C<HBsAg>). Работа выполнена при финансовой поддержке РФФИ (проект № 06-0100567). СПИСОК ЛИТЕРАТУРЫ: 1. K.-P. Adlassnig, W. Horak. Development and retrospective evaluation of HEPAXPERT-1: a routinely-used expert system for interpretive analysis of hepatitis A (4) and B serological findings. “Artficial Intelligence in Medicine”, 1995, v. 7, P. 1-24. 2. Allen J.F. Maintaining knowledge about temporal intervals. “Communications of the ACM”, 1983, v. 26, N. 11. 3. G.S. Plesniewicz. Binary Data and Knowledge Model. Proceedings of the 6th Joint Conference on Knowledge-based Software Engineering, IOS Press, 2004. 4. Г.С. Плесневич, С.В. Гаврилов, А.М. Малышков. Метод абдукции для интервальной логики Аллена // Труды международных научно-технических конференции IEEE AIS'03, CAD-2003 (Дивноморское 3-10 сентября). – М., Физматлит, 2003, т. 1, с. 147-155. 5. Г.С. Плесневич. Бинарная модель знаний // III-й Международный научнотехнический семинар «Интегрированные модели и мягкие вычисления в искусственном интеллекте». Сб. научных трудов (Коломна, май 2005). – М: Физматлит, 2005, т. 1б с. 106-117. 6. Г.С. Плесневич. Бинарные модели знаний // Труды международных научнотехнических конференции IEEE AIS'08, CAD-208 (Дивноморское 3-10 сентября) М., Физматлит, 2008 , т.2, c. 135-145 7. P. Lord, S. Bechhofer, M.D. Wilkinson, G. Schlitz, D. Gessler, D. Hull, C. Goble, L. Stein. Applying semantic web services to bioinformatics // In: LNCS, v. 3298, 2004. 8. З.Х.-М. Хашаев, С.М. Авдошин, П.А. Кандауров. Метаданные для биомедицинских ресурсов в Семантическом вебе // Труды международных научнотехнических конференции IEEE AIS'07, CAD-2007 (Дивноморское 3-10 сентября), М., Физматлит, 2007, т.3, c. 457-466. 9. P. Ladkin, A. Reifled. Effective solution of qualitative interval constraint problems. “Artficial Intelligence Journal”, 1992 v. 17, P. 105-204. www.rae.ru Научный журнал "Фундаментальные исследования" Российская Академия Естествознания №2 2009 год MEDICAL KNOWLEDGE ONTOLOGIES WITH A TEMPORAL FACTOR Khashaev Z.Kh.-M., Plesniewich G.S., Sheksheev E.M. Institute for Information Transmission Problems (Kharkevich Institute) RAS, Moscow It is shown how design medical knowledge ontologies using conceptual languages of the system “Binary Knowledge Model”. An important feature of these ontologies is the presence of temporal constraints which determine a currant of deceases. Keywords: hepatites B, medical ontologies, temporal factors, knowledge models.