Интеллектуальные ДСМ-системы для анализа медицинских данных и диагностики - Статья

бесплатно 0
4.5 138
Применение ДСМ-метода в предметной области - клинической и лабораторной диагностики. Принципы построения интеллектуальной системы, помогающей врачам в принятии решения при диагностике различных заболеваний и выборе способа лечения конкретного больного.


Аннотация к работе
Наш опыт общения с экспертами-врачами различных медицинских учреждений разных специальностей показывает, что медикам хотелось бы иметь интеллектуальную систему, помогающую им в принятии решения при диагностике различных заболеваний и при выборе способа лечения конкретного больного. Перечислим условия применимости ДСМ-метода: возможность структурирования данных и формального определения сходства фактов (из базы фактов (БФ)), наличие положительных и отрицательных примеров (±) - примеров в БФ, интеллектуальная система диагностика клиническая лабораторная наличие в БФ неявно заданных зависимостей причинно-следственного типа ((±) - причины изучаемых эффектов). Таким образом, гипотезы о (±) - причинах, извлекаемых из БФ, порождаются посредством специально созданной процедуры индукции, порождающей сходство объектов - источник или причину наличия (отсутствия) изучаемого эффекта. Рассмотрим общие принципы построения интеллектуальных ДСМ-систем для применения в медицине на примерах трех поставленных задач: (1) прогнозирования высокопатогенных типов вируса папилломы человека (ВПЧ) по цитологическим результатам исследования мазков (Кафедра клинической и лабораторной диагностики Российской Медицинской Академии последипломного образования); 3. в n-элементном кортеже указываются все присутствующие ( ) и все отсутствующие (-) признаки из заранее разработанного списка, наличие или отсутствие остальных признаков считается неизвестным (t).

Введение
В работе рассматривается применение ДСМ-метода в новой предметной области - области клинической и лабораторной диагностики. Описываются основные принципы построения интеллектуальной системы, помогающей врачам в принятии решения при диагностике различных заболеваний и при выборе способа лечения конкретного больного.

Множество результатов медицинских исследований, в большинстве случаев хранящихся в медицинских картах больного, не всегда может быть полностью проанализировано врачом. Наш опыт общения с экспертами-врачами различных медицинских учреждений разных специальностей показывает, что медикам хотелось бы иметь интеллектуальную систему, помогающую им в принятии решения при диагностике различных заболеваний и при выборе способа лечения конкретного больного.

В секторе интеллектуальных систем ВИНИТИ создана интеллектуальная система типа ДСМ) (ИНТС ДСМ) [Финн 1999], основанная на ДСМ-методе автоматического порождения гипотез, реализующем автоматизированные правдоподобные рассуждения. Разрабатываемые правдоподобные рассуждения образуют формализованную эвристику извлечения зависимостей причинно-следственного типа из баз структурированных фактов. Извлечение знаний типа "причина-следствие" основано на принципе: "сходство фактов порождает сходство эффектов и их повторяемость" (этот принцип отличен от вероятностного подхода к анализу данных: "повторяемость эффектов определяет сходство фактов").

Перечислим условия применимости ДСМ-метода: возможность структурирования данных и формального определения сходства фактов (из базы фактов (БФ)), наличие положительных и отрицательных примеров (±) - примеров в БФ, интеллектуальная система диагностика клиническая лабораторная наличие в БФ неявно заданных зависимостей причинно-следственного типа ( (±) - причины изучаемых эффектов).

Таким образом, гипотезы о (±) - причинах, извлекаемых из БФ, порождаются посредством специально созданной процедуры индукции, порождающей сходство объектов - источник или причину наличия (отсутствия) изучаемого эффекта. Предсказание этого эффекта осуществляется посредством аналогии, использующей гипотезы о (±) - причинах, содержащихся в базе знаний и порожденных индукцией. И, наконец, ДСМ - рассуждение завершается абдуктивной процедурой - объяснением начального состояния БФ, которое или является достаточным основанием для принятия гипотез, или является средством расширения БФ для итерации ДСМ - рассуждения, если существуют необъясненные факты из БФ.

ДСМ метод является средством формализованного качественного анализа данных. В силу реализации ДСМ-метода в интеллектуальных системах, работающих в интерактивном режиме, ДСМ-метод удобен для решения задач мониторинга различных медицинских эффектов, представленных в базах фактов для клинических данных.

Рассмотрим общие принципы построения интеллектуальных ДСМ-систем для применения в медицине на примерах трех поставленных задач: (1) прогнозирования высокопатогенных типов вируса папилломы человека (ВПЧ) по цитологическим результатам исследования мазков (Кафедра клинической и лабораторной диагностики Российской Медицинской Академии последипломного образования);

(2) диагностики двух заболеваний глаз: дегенеративного ретиношизиса и наследственных витреоретинальных дистрофий (Лаборатория клинической физиологии зрения МНИИ глазных болезней им. Гельмгольца);

(3) диагностика системной красной волчанки (СКВ) по имеющимся клиническим и иммунологическим признакам больного (Отделение нефрологии Городской клинической больницы им. Боткина).

Настройка ИНТ ДСМ на каждую из перечисленных задач должна включать с себя следующее: разработку языка представления данных;

определение понятия "объект" и "свойство" в терминологии ДСМ-метода;

определение аксиом предметной области;

задание операции сходства;

задание отношения вложения.

Разработка языка представления данных

Первоначальной задачей является разработка языка представления данных. Эта работа ведется совместно со специалистами-медиками. Врач перечисляет все возможные признаки описания состояния больного или описания конкретного анализа больного, по которым надо делать прогноз наличия или отсутствия конкретного заболевания, либо определить подходящий способ лечения.

Анализируя признаки заболеваний, предоставленные врачами различных специальностей, можно выделить несколько различных типов данных: 1. в кортеже длины "n" (где n-количество элементов списка признаков) указываются присутствующие качественных признаки, вместо отсутствующих признаков ставится L (пустой элемент): El (1) =.

В задаче (2) - рефракция: El (1) = ;

2. указывается один из возможных качественных признаков: El (2) = Ati, II{1,…,n}, n-число признаков в списке.

В задаче (3): El (2) =длительность нефрита (At1 - до 3 месяцев, At2=3 месяца - 1 год, At3 =1 год - 3 года, At4=3 года - 10 лет, At5= больше 10 лет) выбирается один из интервалов, например, El (2) = At3.

3. в n-элементном кортеже указываются все присутствующие ( ) и все отсутствующие (-) признаки из заранее разработанного списка, наличие или отсутствие остальных признаков считается неизвестным (t).

El (3) =,…,,…,>, ki I{ ,-,t}, где

При ki=t,=L

Пример из задачи (2): El (3) =стекловидное тело: At1="плавающие помутнения " At5=преритинальные пленки "

At2= "нитчатые помутнения - " At6= "шварты t"

At3= "мембраны t" At7= "задняя отслойка стекловидного тела "

At4= "выраженная зернистая деструкция "

El (3) = , , L, , , L, >

4. указывается норма признака или интервал отклонения признака от нормы с указанием направления отклонения

El (4) =, где DIRI{?,N,}, N - норма признака, ? - отклонение от нормы в сторону уменьшения, - отклонение от нормы в сторону увеличения, а KI{1,2,3,4,5}

В задаче (3): El (4) = или El (4) =;

5. указывается конкретный признак иерархической структуры со знаком " " или "-", ("t" по умолчанию).

Пример из задачи (2): изменение сосудов сетчатки (да - нет, t)

At1 - изменение артерий At 2.2 - расширение вен " "

At 1.1 - сужение артерий At 2.3 - извитость вен

At 1.2 - расширение артерий "-" At 3 - новообразованные сосуды

At 1.3 - извитость артерий At 4 - муфты по ходу сосудов

At 2 - изменение вен At 5 - шварта сосудов

At 2.1 - сужение вен

El (5) =

Используются следующие аксиомы: At11.1.1= - ? At11.1= L

At11.2.2= ? At11.2=

El (5) =

Определение понятия "объект" и "свойство" в терминологии ДСМ-метода

В задаче (1) объект, соответствующий конкретному анализу, представляет собой кортеж из 18 цитологических признаков со степенью выраженности k: O=, где Eli= (Ati - один из 18-ти цитологических признаков: (амфофиллия цитоплазмы; атипическая плоскоклеточная метаплазия и т.д.), ki - степень выраженности этого признака: KIII1,2,3y).

В отсутствии i-ого признака Ati=L.

В задаче (2) объект, соответствующий истории болезни конкретного больного, представляет собой кортеж из 31 элемента.

Оі=

Каждый элемент этого кортежа соответствует конкретному признаку. В соответствие с языком представления данных каждый элемент объекта принадлежит одному из 5-ти типов или же является комбинацией каких-либо типов. Так как задачей врача является диагностирование одного из двух заболеваний дегенеративного ретиношизиса и наследственных витреоретинальных дистрофий, то в терминологии ДСМ-метода эти заболевания являются свойствами.

В задаче (3) объект аналогично (2) соответствует истории болезни конкретного больного и представляет собой кортеж из 61 элемента.

Оі=

Каждый элемент этого кортежа соответствует конкретному признаку, причем, некоторое количество признаков повторяет признаки задачи (2), но в основном признаки разные, что объясняется различием заболеваний. Как и в предыдущей задаче, каждый элемент объекта также принадлежит одному из 5-ти типов или же является комбинацией каких-либо типов.

Свойствами являются: диагноз, результат лечения и осложнения.

Определение операции сходства

Операция сходства определяется поэлементно.

O’=

O”=, O’OO”=

Сходство элементов кортежей определяется в зависимости от того, какому типу данных принадлежит данный признак [Панкратова 2004].

Определение отношения вложения

Определяются два типа вложения: сильное и слабое. При сильном вложении требуется вложение одноименных элементов со значениями " " и "-" в соответствующие элементы со значениями " " и "-". При слабом вложении допускается вложение элементов со значениями " " и "-" в элементы "t", запрещается только вложение атрибутов противоположных знаков.

Аксиомы предметной области

Все перечисленные признаки, входящие в объект, возможно разделить с учетом знаний о предметной области на три группы: 1) Группа необходимых (конъюнктивных) признаков - признаки, без наличия которых гипотеза не имеет смысла, например, нельзя прогнозировать результат лечения без наличия признака терапия (состояние кожи и слизистой, лихорадка и т.д.)

2) Группа существенных (дизъюнктивных) признаков - гипотеза имеет смысл, если в ней присутствует хотя бы один признак из этой группы.

3) Группа сопутствующих признаков - признаки не входящие в группы 1) и 2), например: пол, возраст, артериальное давление и т.д.

Таким образом, можно сформулировать следующую аксиому: Результат операции сходства считается гипотезой, если в нее входит хотя бы один из признаков группы 2) и все признаки группы (1).

Компьютерные эксперименты

1. В настоящее время создана экспериментальная версия системы для задачи прогнозирования высокопатогенных типов вируса папилломы человека (ВПЧ) по цитологическим результатам исследования мазков и было проведено два компьютерных эксперимента.

Сотрудниками Кафедры клинической лабораторной диагностики Российской Медицинской Академии последипломного образования был предоставлен массив результатов исследования мазков (БФ), полученных от 324 больных с указанием наличия или отсутствия вируса ( ( ) - и (-) - примеров, с точки зрения ДСМ), а также массив из 31 результата исследования мазков без указания наличия или отсутствия вируса, информация о которых имелась только на Кафедре ( (t) - примеров).

На первом этапе средствами ДСМ-системы п. п. в.1 (индукцией) порождались гипотезы 1-города: ”Наличие в мазке конкретного набора цитологических признаков с конкретной степенью выраженности есть причина наличия или отсутствия вируса”. Порожденные гипотезы являлись фрагментами БЗ.

На втором этапе с использованием гипотез первого рода правилами 2-города (п. п. в.2 - аналогией) доопределялось наличие или отсутствие вируса в мазках, данных на прогноз.

В результате работы система правильно доопределила наличие или отсутствие ВПЧ в 30 мазках из 31, данных на прогноз: результаты совпали с имеющимися на Кафедре данными [Панкратова 2002].

Второй эксперимент проводился на аналогичном массиве из 245 больных. Система правильно доопределила 58 случаев и неправильно 1 [Цидаева 2003].

2. Компьютерный эксперимент в задаче №2 проводился на данных обследования 50-ти больных, у 21-го из которых был поставлен диагноз дегенеративный ретиношизис миопический.

На первом этапе средствами ДСМ-системы п. п. в.1 (индукцией) порождались гипотезы 1-города: "Наличие у больного конкретного набора признаков есть причина наличия или отсутствия диагноза дегенеративного ретиношизиса миопического". Например, набор следующих признаков: "характер заболевания - приобретенный; общая характеристика ЭРГ - умеренно субнормальная; макулярная ЭРГ - субнорма; функциональное состояние фоторецепторов - угнетение умеренное; РЭРГ на 30 гц - субнорма" есть причина диагноза дегенеративного ретиношизиса миопического.

Порожденные гипотезы являлись фрагментами БЗ.

На втором этапе с использованием гипотез первого рода правилами 2-города

(п. п. в.2 - аналогией) доопределялось наличие или отсутствие дегенеративного ретиношизиса миопического у больных, представленных на прогноз.

В результате компьютерного эксперимента у 38-и больных диагноз был определен верно. Ошибочных нет. Остальные недоопределены.

3. Компьютерный эксперимент для задачи №3 проводился на клинических и лабораторных данных обследования 85-ти больных, у 64-х из которых был поставлен диагноз СКВ.

На первом этапе средствами ДСМ-системы п. п. в.1 (индукцией) порождались гипотезы 1-города: "Наличие у больного конкретного набора признаков есть причина наличия или отсутствия диагноза заболевания СКВ". Например, набор следующих признаков: лихорадка, наличие на коже "бабочки" и поражение суставов есть причина для установки диагноза СКВ.

Порожденные гипотезы являлись фрагментами БЗ.

На втором этапе с использованием гипотез первого рода правилами 2-города (п. п. в.2 - аналогией) доопределялось наличие или отсутствие СКВ у больных, представленных на прогноз.

В результате компьютерного эксперимента у 53-х больных диагноз был определен верно, у двух ошибочно, остальные недоопределены.

Таким образом, подтверждается возможность использования ДСМ-метода автоматического порождения гипотез в области медицинской диагностики, где недостаток формальных знаний может быть “скомпенсирован" богатым фактическим материалом. В некоторых областях медицины, находящихся на стадии феноменологического описания и накопления данных, развитые логико-математические методы восстанавливают причинно-следственные зависимости, служат для пополнения знаний на основе имеющихся фактических данных и являются средством усиления интеллектуальных возможностей экспертов-медиков.

Список литературы
1. [Финн 1999] Финн В.К. Синтез познавательных процедур и проблема индукции // НТИ. Сер.2. - 1999. - №1-2 С.8-44.

2. [Панкратова 2002] Панкратова Е.С., Панкратов Д.В., В.К. Финн В.К., Шабалова И.П. Применение ДСМ-метода для прогнозирования высокопатогенных типов вируса папилломы человека // НТИ. Сер2. - 2002. №6, С.22-26.

3. [Цидаева 2003] Цидаева И.Г. Критерии цитологической диагностики онкогенных типов вируса папилломы человека. Автореферат диссертации на соискание ученой степени кандидата медицинских наук, Москва-2003.

4. [Зуева 2004] Зуева М. В.; Панкратова Е.С., Цапенко И.В. Представление данных в задаче диагностики заболеваний органа зрения. Девятая национальная конференция по искусственному интеллекту с международным участием КИИ’2004, 28сентября - 2 октября 2004г. Тверь, Россия. Труды конференции, Москва, Физматлит 2004, т.1, стр.139-145.

5. [Добрынин 2004] Добрынин Д.А., Захарова Е. В.; Панкратова Е.С. Общие принципы построения интеллектуальных ДСМ-систем для клинической и лабораторной диагностикина примере прогнозирования наилучшего способа лечения системной красной волчанки. Девятая национальная конференция по искусственному интеллекту с международным участием КИИ’2004, 28сентября - 2 октября 2004г. Тверь, Россия. Труды конференции, Москва, Физматлит 2004, т.1, стр.132-139.

6. [Панкратова 2004] Панкратова Е.С. Анализ данных в компьютерных системах. // Новости искусственного интеллекта, №3, 2004, с.67-78.

Размещено на .ru
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?