Анализ и алгоритм диагностики дисбиозов с использованием

advertisement
ISBN 978-5-7262-1775-8 НЕЙРОИНФОРМАТИКА-2013. Часть 2
А.С. ПОЖИДАЕВА
Нижегородский государственный технический университет им. Р.Е.
Алексеева
pozhidaeva.a.s@Gmail.com
АНАЛИЗ И АЛГОРИТМ ДИАГНОСТИКИ ДИСБИОЗОВ С
ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ
Представлены
результаты
бактериологического
исследования
качественного и количественного состава микрофлоры желудочнокишечного тракта различных возрастных групп населения, на основе
которых разработан метод диагностики дисбиозов желудочно-кишечного
тракта человека с использованием нейронных сетей.
Ключевые слова: нейронная сеть, дисбиоз, классификация, алгоритм,
возрастная группа, клинически значимые признаки
Введение
Актуальным направлением современной биологии, экологии и
медицины является изучение микробной флоры человека.
Микрофлора человека – это чувствительная индикаторная система,
которая своими количественными и качественными изменениями
реагирует на любые нарушения состояния здоровья макроорганизма.
Правильная трактовка результата бактериологического исследования
имеет исключительное значение при решении вопроса о природе
кишечного заболевания и соответствующих методах лечения, так как
кишечная микрофлора человека наиболее представительна и подвержена
колебаниям в зависимости от многих факторов.
На протяжении ряда лет совершались неоднократные попытки
объективизации оценок результатов исследования микробиоценозов
кишечника [1]. Первой попыткой был метод сравнения результатов
бактериологических исследований с эталонной группой здоровых людей,
выбранных с помощью экспертных оценок. Позднее был разработан
метод оценки состояния микрофлоры кишечника с учетом распределения
показателей состава микробиоты здоровых и больных в соответствии с
евклидовым расстоянием от математической нормы. Третьей попыткой
стала разработка линейной модели:
190
УДК 004.032.26(08) Нейронные сети
ISBN 978-5-7262-1775-8 НЕЙРОИНФОРМАТИКА-2013. Часть 2
N
N 3
i 1
i  N 1
K   vi  bi   xi .
(1)
Здесь i – микроорганизм; vi – весовой коэффициент признака; bi –
выделенное количество микроорганизма; N+1 – признак количественного
соотношения анаэробов и аэробов; N+2 – признак количественного
соотношения условно-патогенных микроорганизмов; N+3 – функция,
определяющая наличие патогенных микроорганизмов.
В качестве критерия оценки используется относительная частота
ошибки.
Несмотря на проводившиеся ранее исследования, до настоящего
времени не разработан метод определения дисбиоза желудочнокишечного тракта человека с применением информационных технологий.
Предварительная обработка диагностических показателей
Цель исследования –
разработка метода обработки данных
бактериологических исследований на основе нейронных сетей.
На первом этапе собраны и систематизированы результаты
бактериологических исследований микрофлоры ЖКТ 2576 человек.
На втором этапе на основе анализа отечественной и зарубежной
литературы, полученных результатов бактериологических исследований,
опираясь на опыт экспертов, был отобран необходимый набор признаков,
наиболее полно характеризующий состояние микробиоценоза желудочнокишечного тракта человека. Всего было выделено 29 признаков,
характеризующих состояние микрофлоры желудочно-кишечного тракта
по микроорганизмам 376 видов из 70 родов.
Следует также отметить, что видовой и количественный состав
«нормальной» микрофлоры у «детей» и «взрослых» имеет существенные
различия.
По ОСТ 91500.11.0004-2003 при определении степени дисбиоза
выделяют 3 возрастные группы людей:
 0 – 1 год;
 1 год – 60 лет;
 более 60 лет.
В результате исследования было выделено 8 возрастных групп
обследуемых:
 0 – 23 ч;
 24 – 167 ч;
 7 – 29 дней;
УДК 004.032.26(08) Нейронные сети
191
ISBN 978-5-7262-1775-8 НЕЙРОИНФОРМАТИКА-2013. Часть 2
 30 дней – 11 месяцев;
 1 год – 6 лет;
 7 – 17 лет;
 18 – 59 лет;
 60 лет и более.
Такое деление позволило увеличить точность разграничения людей с
«нормальной» микрофлорой и патологией.
Проведённые исследования доказывают, что качественный и
количественный состав микрофлоры желудочно-кишечного тракта внутри
этих групп различен [2].
На третьем этапе была создана информативная база данных,
содержащая сведения о состоянии микробиоценозов пациентов и
структурированная по различным признакам: по возрасту, по дате
анализа, по лечебному учреждению, по видовому и количественному
разнообразию микроорганизмов в единице объема субстрата, по наличию
ассоциаций микроорганизмов, по степени выраженности дисбиоза [3].
Для управления базой данных был разработан программный продукт,
позволяющий
обрабатывать
и
систематизировать
результаты
бактериологических исследований качественного и количественного
состава микрофлоры желудочно-кишечного тракта из базы данных –
система управления базой данных (СУБД), которая написана на языке
FoxPro в среде программирования Microsoft Visual FoxPro 8.0 (файлсерверная реляционная СУБД) в рамках операционной системы Windows.
На этапе инфологического проектирования было выделено 5 основных
сущностей: человек, возрастная группа, лечебное учреждение, в котором
обследовался пациент, микроорганизм, анализ. Для проектирования был
выбран метод сущность-связь.
Доступ к базе программно организован таким образом, что
пользователь может модифицировать и обрабатывать данные на уровне
доступного и понятного ему графического интерфейса. Для удобства
работы в программный продукт также встроено руководство
пользователя, где можно найти всю необходимую информацию о работе с
программой [4].
СУБД обеспечивает возможность систематизации лабораторных
анализов и обладает следующими функциональными возможностями:
 ввод информации;
 корректировка информации;
 выборка;
 построение диаграмм;
192
УДК 004.032.26(08) Нейронные сети
ISBN 978-5-7262-1775-8 НЕЙРОИНФОРМАТИКА-2013. Часть 2
 сравнение выборок;
 импорт и экспорт таблиц Microsoft Excel 2003.
Ввод информации в базу данных и её корректировка осуществляется с
помощью электронной формы бланка анализа, который включает в себя:

дату сдачи анализа;

возраст обследуемого;

название лечебного учреждения;

значения 29 показателей состояния микрофлоры ЖКТ.
Задача определения дисбиотических состояний является задачей
классификации. В машинном обучении задача классификации решается с
помощью методов искусственных нейронных сетей.
В качестве входных параметров нейронной сети используются
результаты медицинских анализов, в частности, микрофлоры желудочнокишечного тракта людей различных возрастных групп. Все данные
медицинских анализов должны быть сгруппированы по возрастному
признаку.
Вектор входных признаков выглядит следующим образом:
Х={количество1;…; количество29; возраст; лечебное учреждение},
где значения количественных характеристик могут изменяться в пределах
от 0 до 1012.
Вектор выходных данных будет таким:
Y={норма, дисбиоз I степени, дисбиоз II степени, дисбиоз III степени}.
Для обучения нейронной сети векторы входных и выходных
параметров необходимо привести к одной размерности, которая должна
быть снижена.
Первым шагом стало уменьшение количества входных параметров.
Все числовые показатели разделим на 4 группы – по характеру их
положительного или отрицательного влияния на состояние микрофлоры
человека [5].
В первую группу входят те микроорганизмы, присутствие которых
оказывает безусловно положительное влияние на состояние микрофлоры.
Причем это влияние усиливается с увеличением количества и
разнообразия этих микроорганизмов.
Во вторую группу входят те микроорганизмы, присутствие которых в
микробиоте имеет ограниченно отрицательное влияние. Это означает, что
наличие их в количествах, меньших 1*105, не несет никакой угрозы
здоровью человека и даже «улучшает работу» первой группы
УДК 004.032.26(08) Нейронные сети
193
ISBN 978-5-7262-1775-8 НЕЙРОИНФОРМАТИКА-2013. Часть 2
микроорганизмов. Присутствие же в больших количествах может
осложнить течение основного заболевания.
К третьей группе относятся микроорганизмы, которые оказывают
безусловно отрицательное влияние на состояние микрофлоры, которое
усиливается с увеличением количества и разнообразия представителей
этой группы.
Четвертая группа состоит из двух видов бактерий, но их влияние на
состояние микрофлоры желудочно-кишечного тракта человека таково, что
при обнаружении хотя бы одного микроорганизма можно без проведения
дальнейшего анализа диагностировать дисбиоз III степени, так как они
являются возбудителями таких заболеваний, как дизентерия и
сальмонеллез.
Затем необходимо понизить степень ординальных переменных
входного вектора, преобразовать категориальные переменные «возраст» и
«лечебное учреждение» – все они должны иметь одинаковую
размерность. Преобразование количественных параметров происходит
следующим образом: берётся десятичный логарифм от каждой
количественной переменной и округляется до целого числа. Каждой
категориальной переменной присваивается индивидуальный номер.
Следует отметить, что при определении степени дисбиоза важно знать
не только количества бактерий, но и видовой состав микрофлоры.
Поэтому были введены оценочные показатели, характеризующие наличие
ассоциаций микроорганизмов, разбитых на 4 группы.
В первой группе «безусловно положительных» микроорганизмов было
выделено 6 категорий, во второй и третьей группе выделено по 5 категорий,
в четвертой группе мы выделяем только 2 категории. Также в этой,
последней, группе не учитывается количество бактерий, так как наличие
хотя бы одного из этих микроорганизмов гарантирует дисбиоз III степени.
Затем производим «оцифровку» ординальных переменных коэффициент1,
коэффициент2, коэффициент3 для того, чтобы все примеры несли
одинаковую информационную нагрузку. Для этого воспользуемся
формулой
(2)
xk  Pk / P ,
где Pk – число примеров класса k, а P – общее число примеров. Центр
каждого такого отрезка будет являться численным значением для
соответствующего ординального класса.
Таким образом, вектор входных параметров выглядит теперь
следующим образом:
194
УДК 004.032.26(08) Нейронные сети
ISBN 978-5-7262-1775-8 НЕЙРОИНФОРМАТИКА-2013. Часть 2
X = {группа1; коэффициент1; гр.2; коэф.2; гр.3; коэф.3; коэф.4;
коэф.5; коэф.6}.
Коэффициенты с первого по третий будут принимать значение в
промежутке [0; 1]. Число входных параметров сокращено с 31 до 9,
избавились от размерности и произвели нормировку данных.
Теперь закодируем выходные данные так, чтобы их значения лежали в
интервале [0;1].
После такой предварительной обработки можно переходить к третьему
этапу – конструированию и обучению сети. Для этого был выбран
готовый нейросетевой пакет Neuro Shell.
Выбор нейронной сети
Среди всех сетей, представленных в пакете Neuro Shell для решения
задачи диагностики, наиболее эффективными являются сеть Кохонена и
сеть Ворда.
Классификация по степеням дисбиоза для всех возрастных групп с
использованием одной архитектуры нейронной сети невозможна.
Эффективность разделения на классы существенно затруднена из-за
качественных и количественных различий в составе микрофлоры у людей
разных возрастов, поэтому обучение проводилось для некоторых
возрастных групп отдельно.
Для возрастных групп 0-23 часа и 24-168 часов сеть Кохонена не смогла
произвести разделение по степени дисбиоза, то есть не удалось разделить
«норму» и дисбиоз I степени. Для возрастной группы 7-29 дней, а также
людей в возрасте от 1 года до 60 лет и более сеть Кохонена смогла
разграничить «норму» и дисбиоз I степени от дисбиоза II и III степени. Для
возрастной группы от 1 до 11 месяцев разделения произвести не удалось.
Сеть Ворда смогла провести корректную диагностику степени
дисбиоза для групп 0-23 часа, 7-29 дней. В группе от 1 до 11 месяцев
правильно определялась III степень дисбиоза, для остальных возрастных
групп – удалось отделить «норму» и патологию.
Таким образом, с помощью сети Ворда удалось понизить ошибку
диагностики до 30%.
Дальнейшая работа будет направлена на поиск таких архитектур
нейронной сети, которые позволили бы провести разделение дисбиозов по
степеням.
Выводы
УДК 004.032.26(08) Нейронные сети
195
ISBN 978-5-7262-1775-8 НЕЙРОИНФОРМАТИКА-2013. Часть 2
1. Составлен набор признаков из 29 показателей, сформированных на
основе анализа результатов бактериологических исследований,
позволяющих определить количество микроорганизмов 376 видов из 70
родов в единице объема субстрата, характеризующих состояние
микрофлоры желудочно-кишечного тракта человека.
2. Сформирована база данных, содержащая 2576 результатов
бактериологических исследований микрофлоры ЖКТ различных
возрастных групп населения г.Н.Новгорода по 29 показателям.
3. Разработана система управления базой данных для систематизации
и обработки результатов анализа качественного и количественного
состава микробиоценоза желудочно-кишечного тракта, доступ к которой
программно организован таким образом, что пользователь может
модифицировать и обрабатывать данные на уровне доступного и
понятного ему графического интерфейса.
4. Разработан алгоритм преобразования данных для последующего
обучения нейронной сети.
5. Подобрана архитектура нейронной сети, позволяющая провести
корректное разделение результатов бактериологических исследований на
«норму» и состояние дисбиоза.
Список литературы
1. Соколова К.Я., Соловьева И.В. Дисбактериозы: Теория и практика.
Н. Новгород: НГТУ. 1999.
2. Соловьева И.В., Гелашвили Д.Б., Варичев А.Н., Солнцев Л.А.,
Григорьева Г.И., Белова И.В., Точилина А.Г., Пожидаева А.С. Видовая
структура биопленки толстой кишки здоровых и больных детей
различных возрастных групп// Медицинский альманах. 2011. №4. С. 8993.
3. Бушуева М.Е., Пожидаева А.С. Разработка алгоритма
систематизации результатов бактериологических анализов состояния
микрофлоры желудочно-кишечного тракта людей различных возрастных
групп// IX Международная молодежная научно-техническая конференция
Будущее технической науки. Сборник материалов конференции.
Н.Новгород: НГТУ. 2010. С. 48.
4. Ломакин Д.В., Вигура А.Н., Губернаторов В.П., Пожидаева А.С.,
Соловьева И.В., Ефимов Е.И., Белова И.В. Автоматизированная система
микробиологического мониторинга микробиоценозов желудочно196
УДК 004.032.26(08) Нейронные сети
ISBN 978-5-7262-1775-8 НЕЙРОИНФОРМАТИКА-2013. Часть 2
кишечного тракта (ЖКТ)// Свидетельство о государственной регистрации
программы для ЭВМ №2011614233. 2011. Бюлл. 3 (76) (IIч.).
5. Бушуева М.Е., Пожидаева А.С. Система диагностики состояния
микрофлоры желудочно-кишечного тракта человека// XI Международная
молодежная научно-техническая конференция Будущее технической
науки. Сборник материалов конференции. Н.Новгород: НГТУ. 2012. С. 40.
УДК 004.032.26(08) Нейронные сети
197
Download