Симбиоз стандартов DICOM и SNOMED.  /автор: И.В.Емелин/

Система ведения компьютеризованной истории болезни аккумулирует данные, поступающие из разных источников в виде электронных документов, и предоставляет их лечащему врачу для принятия решения о диагностическом или лечебном назначении. Чем лучше упорядочены и структурированы передаваемые данные, тем больше информации можно из них извлечь с помощью компьютерной программы и тем более обоснованным может быть врачебное решение. Поэтому в последние годы значительное внимание уделяется стандартизации формы и содержания электронных медицинских документов.

Задача стандартизации электронных документов с результатами лабораторных анализов достаточно успешно решена в европейском стандарте ENV 1613 и в соответствующих разделах североамериканского стандарта HL7 (1994 год). Гораздо сложнее стандартизовать структуру документов с результатами диагностических исследований, например рентгенологических, гистологических, эндоскопических. Эта задача до сих пор не имеет удовлетворительного решения, хотя работа над ней ведется уже достаточно давно как в Европе, так и в США. Однако совместными усилиями двух комитетов по стандартизации - DICOM и SNOMED - уже подготовлены прототипы соответствующих стандартов, с которыми могут познакомиться все заинтересованные разработчики информационных систем диагностических отделений и медицинских экспертных систем. Эти прототипы имеют достаточно прозаичные названия - дополнения 15 и 23 к стандарту DICOM, микроглоссарий SNOMED-DICOM, но знаменуют собой новое явление в медицинской информатике, а именно симбиоз стандарта электронного обмена медицинскими документами и стандартов медицинской терминологии. Этот симбиоз может стать предтечей будущих стандартов электронной истории болезни и краткое знакомство с ним окажется полезным как разработчикам, так и пользователям медицинских информационных и экспертных систем.

Результаты диагностических исследований

Результаты многих видов диагностических исследований, например лучевой диагностики и микроскопических исследований биоматериала выражаются в повествовательной форме и традиционно состоят из описания наблюдаемой картины, выводов (заключений) и рекомендаций. К повествовательным результатам могут прилагаться избранные снимки или видеокассеты, подтверждающие сделанные заключения, аудиокассеты (файлы) с надиктованным результатом или с записью звуков, характеризующих состояние здоровья пациентов. В сочетании с приложениями повествовательные результаты диагностических исследований представляют собой сложные мультимедийные объекты. Но для того, чтобы электронная передача мультимедийных медицинских документов могла выйти за рамки экспериментов и превратиться в рутинную процедуру, необходимо стандартизовать их структуру и в какой-то мере содержание.

Придание структуры повествовательным результатам диагностических исследований

Способы придания данным структуры, необходимой для последующей компьютерной обработки, существенно зависят от технологии их ввода в компьютер. Для ввода повествовательных результатов исследований используются две основные технологии, а именно, диктофонный ввод и непосредственный ввод. В первом случае врач-диагност диктует текст, который затем вводится оператором и передается врачу на подпись в бумажном или электронном виде. Во втором случае врач-диагност сам вводит текст в компьютер.

Структурирование данных при диктофонном вводе

Технология диктофонного ввода значительно упрощает врачам оформление результатов исследований. Например, результаты гистологических исследований можно диктовать, не отрываясь от микроскопа. Однако сама по себе эта технология не обеспечивает возможности придания результатам структуры, пригодной для эффективной компьютерной обработки. Поэтому после ввода текста нужно выполнить дополнительные действия, например присвоить отдельным компонентам текста коды из определенных медицинских классификаций. Эти коды впоследствии могут использоваться в процедурах выборки данных и в системах обеспечения принятия медицинских решений.

В зависимости от целей последующей компьютерной обработки система кодирования может быть относительно простой и напоминать шифрование диагнозов по классификации МКБ, или же использовать специальный язык кодирования, в котором отдельным компонентам текста присваиваются группы связанных кодов. Кодирование является очень важным элементом технологии; оно позволяет избежать неоднозначности трактовки результатов исследований и значительно упростить последующую компьютерную обработку.

Присваивание кодов может выполняться вручную, полуавтоматически или даже автоматически с помощью специальных и очень сложных программ семантической обработки медицинских текстов.

Структурирование данных при непосредственном вводе

При непосредственном вводе текста результата исследования компьютерная программа может вести врача-диагноста по определенной схеме, тем самым придавая результату необходимую структуру. Но непосредственный ввод не всегда удобен и более трудоемок для врачей, нежели диктофонный ввод.

Существует много способов снижения трудоемкости непосредственного ввода результатов исследований, которые попутно обеспечивают их структурирование. Достаточно типичен следующий сценарий: врач-диагност формирует результат исследования из заранее заготовленных шаблонов (фреймов), в пустые гнезда (слоты) которых вводятся числовые данные, например размеры или площадь выявленного образования, или коды (которые можно выбирать из меню). На всякий случай имеется вырожденный шаблон, целиком состоящий из гнезда, в которое можно ввести произвольный текст.

Этот сценарий имеет следующие достоинства:

  1. Поскольку текст результата исследования формируется из шаблонов, то тем самым контролируется используемая терминология. При наличии семантических связей между шаблонами можно упростить процедуру выбора очередного шаблона и следить за полнотой результата исследования.
  2. Библиотеку шаблонов можно формировать постепенно. Вначале можно пользоваться только вырожденным шаблоном, а затем добавлять в библиотеку наиболее распространенные заключения и фрагменты описаний, а также меню перечисляемых значений.
  3. В гнезда шаблонов можно вставлять не только числа и выбор из меню, но также и ссылки на растровые изображения, графики и кривые, аудио- и видеозаписи.

Однако у этого сценария имеются свои подводные камни:

  1. Если библиотеки шаблонов и меню являются приватными и обновляются независимо друг от друга, то это приводит к невозможности автоматизированного сопоставления результатов исследований, оформленных с помощью одной и той же программы в разных учреждениях или даже на разных рабочих местах в одном и том же учреждении.
  2. Централизованные библиотеки содержат гораздо больше шаблонов и меню, чем приватные. Действительно, словарь отдельного человека обычно ограничен несколькими сотнями слов. Такой словарь просто реализовать и модифицировать. Но если мы хотим объединить словари сотен и тысяч людей, то счет пойдет уже на десятки тысяч слов. При этом любое изменение централизованной библиотеки надо доводить до большого числа пользователей, что как в организационном, так и в техническом отношении представляет собой достаточно сложную задачу. Поэтому централизованная библиотека должна иметь статус стандарта.

Кодирование результата исследования при непосредственном вводе обеспечивается неявным образом и не требует дополнительных трудозатрат от пользователей. Каждому элементу меню отвечает свой код, который используется при сохранении введенного результата в базе данных, но в явном виде в экранной форме не фигурирует и врачом не набирается. Смысловые группировки кодов берутся из структуры шаблонов.

Микроглоссарий SNOMED-DICOM

Микроглоссарий SNOMED-DICOM (SDM) представляет собой пример централизованной библиотеки шаблонов и меню, которая может использоваться как при кодировании диктофонного ввода, так и при непосредственном вводе повествовательных результатов. Он был разработан под эгидой Американского института патологоанатомов CAP (College of American Pathologists) на основе номенклатуры SNOMED International, насчитывающей свыше 140 тысяч медицинских терминов, и некоторых других медицинских классификаций. Его основными элементами являются шаблоны (templates) и контекст кодируемых значений (context groups), то есть меню значений, допустимых в данном контексте. Сами значения берутся или из номенклатуры SNOMED, или из некоторых других медицинских классификаций и стандартов (например HL7 или LOINC). Поэтому микроглоссарий SDM является так называемым отображающим ресурсом (mapping resource). В текущей версии микроглоссария SDM, которую можно получить на странице http://www.snomed.org/sdm/sdm.htm  выделяются 15 шаблонов и 705 классов контекста.

Поясним назначение этих элементов микроглоссария на примере шаблона 004, задающего структуру описания исследуемого образца биоматериала в виде ряда свойств (таблица 1). Эти свойства можно рассматривать как графы лабораторного журнала, часть которых заполняется обязательно, а часть - по мере необходимости. Для некоторых свойств указан идентификатор класса контекста cid). Например, свойство 12, Вид биоматериала , имеет класс контекста 37. Это означает, что данное свойство берется из меню возможных значений, которому в микроглоссарии SDM присвоен идентификатор контекста 37 (таблица 2).

Классы контекста, т.е. меню возможных значений, могут адресоваться самостоятельно, без предварительной ссылки на шаблоны. К примеру, анатомическая локализация исследуемого объекта имеет идентификатор контекста 1 и может использоваться сама по себе или, скажем, в составе шаблона 16, Морфология биоматериала.

Микроглоссарий SDM используется в двух расширениях стандарта DICOM, находящихся на стадии завершения разработки: в дополнении 15, Изображения видимого диапазона, и в дополнении 23, Структурирование результатов исследований.

Дополнение 15 к стандарту DICOM

Диагностические исследования, связанные с анализом визуальной картины, наблюдаемой врачом-диагностом с помощью микроскопа или световода, в том числе эндоскопические и гистологические исследования, не были включены в исходную версию стандарта DICOM. Однако работа по стандартизации их результатов была начата сразу же после ее опубликования, и в настоящее время завершается разработка дополнения 15, Изображения видимого диапазона. В этом дополнении существенно расширено понятие кодируемых значений. В исходной версии стандарта кодируемое значение описывалось четверкой атрибутов обозначение системы кодирования-код-значение кода-версия системы кодирования. А в дополнении 15 к ним добавились еще четыре: отображающий ресурс, версия отображающего ресурса, идентификатор контекста, версия группы контекста. Например, кодируемое значение анатомической локализации объекта исследования в исходной версии стандарта могло передаваться в виде четверки T-5700|Желудок|SNMI|3.4 а согласно дополнению 15 это же значение рекомендуется передавать в виде восьмерки T-5700|Желудок|SNMI|3.4|SDM|1.1|1|1.0 (идентификаторы компонентов сообщения опущены). Добавившиеся компоненты кодируемого значения указывают, что отображающим ресурсом служит микроглоссарий SDM версии 1.1, кодируемое значение взято из контекста с идентификатором 1 (анатомическая локализация) версии 1.0.

За этим на первый взгляд не очень понятным усложнением скрывается принципиальное решение о новом водоразделе между стандартом DICOM и стандартами медицинской терминологии. К примеру, в исходной версии стандарта DICOM об атрибуте объекта исследования Анатомическая локализация говорилось лишь, что он задается как кодируемое значение. На систему кодирования никаких ограничений не накладывалось. А в дополнении 15 явным образом сказано, что это кодируемое значение берется из контекста с идентификатором 1, а рекомендуемый отображающий ресурс - микроглоссарий SDM. В принципе отображающий ресурс может быть и иным, в том числе приватным, но идентификатор контекста анатомической локализации обязан быть тем же самым. Таким образом, в дополнении 15 стандарт DICOM берет на себя ответственность специфицировать идентификатор контекста и рекомендовать отображающий ресурс для этого идентификатора. С другой стороны, конкретные значения контекста (например T-5700|Желудок) по-прежнему не входят в стандарт DICOM и являются составной частью других стандартов, в данном случае - номенклатуры SNOMED.

Это новое разделение обязанностей между разработчиками стандарта электронного обмена медицинскими документами и разработчиками стандартов медицинской терминологии позволило поставить более общую задачу, а именно, стандартизовать общую структуру результатов исследований.

Дополнение 23 к стандарту DICOM

Дополнение 23 специфицирует общую структуру результатов исследований, рассматривая их как мультимедийные документы. В нем выделяется 14 классов данных, которые могут использоваться в этих документах (таблица 3), и вводится терминологический словарь рассматриваемой предметной области, описывающий 110 понятий. Этот словарь используется при построении формализованных моделей предметной области в виде так называемых ER-диаграмм (диаграмм сущностей-отношений). В определениях информационных объектов активно используются идентификаторы контекста, введенные в дополнении 15 и микроглоссарии SDM.

Результат исследования рассматривается дополнением 23 как серия документов: основной документ и произвольное число дополнений, редактирующих основной документ. Внесение изменений непосредственно в основной документ или дополнение считается недопустимым.

В принципе дополнение 23 охватывает не только повествовательные результаты диагностических исследований, но также и результаты лабораторных анализов. Однако в отношении последних оно не обладает специфичностью и не может полностью заменить стандарт ENV 1613 или HL7. В настоящее время складывается следующее разделение сфер влияния между стандартами HL7 и DICOM: первый охватывает больничные информационные системы, а стандарт DICOM - взаимодействие подсистем диагностических отделений и систем обработки изображений. Для обеспечения эффективного взаимодействия подсистем диагностических отделений и других компонентов больничной информационной системы разрабатывается взаимное отображение стандартов HL7 и DICOM.

В целом дополнение 23 представляет собой фундаментальное описание информационной структуры результатов диагностических исследований и заслуживает самого пристального внимания как разработчиков информационных систем, так и медицинских экспертов, готовящих методические пособия для врачей-диагностов.

Заключение

Микроглоссарий SDM и дополнения 15 и 23 к стандарту DICOM знаменуют собой новое явление, а именно, тесный симбиоз стандарта электронного обмена документами и стандартов медицинской терминологии с четким разделением сфер ответственности. Это, с одной стороны, усложняет сами стандарты, с другой позволяет вносить независимые изменения в ту часть стандарта, которая полностью находится в сфере ответственности данного комитета по стандартизации.

Разработчики информационных систем диагностических отделений и систем ведения компьютеризованной истории болезни могут извлечь немалую пользу от знакомства с дополнениями 15 и 23 и микроглоссарием SDM. Приведенные в них описания информационных объектов могут служить хорошей основой для экранных форм и схемы базы данных. Кроме того, в ближайшем будущем эти дополнения будут использоваться для разработки интерфейсов между информационными системами и системами обработки изображений (IS-IS interface).

Таблица 1. Состав шаблона 4 микроглоссария SDM - исследуемый образец биоматериала

Свойство

Название

Определение

Контекст

Примеры

1

Атрибуты взятия биоматериала

Административная идентификация взятия, привязка взятой ткани или жидкости к источнику (пациенту) и процедуре взятия

 

Номер взятия биоматериала, медицинский работник, выполнивший процедуру взятия

2

Дата взятия

Дата завершения процедуры взятия биоматериала

   

3

Время взятия

Время завершения процедуры взятия биоматериала

   

4

Взявший врач

Врач, выполнивший процедуру взятия

   

5

Описание биоматериала

Описание, составленное взявшим врачом

   

6

Идентификатор биоматериала

     

7

Идентификатор биоматериала-источника

Идентификатор биоматериала, послужившего источником данного биоматериала

 

Идентификатор блока, от которого был сделан срез

8

Процедура взятия биоматериала

35

 

9

Код процедуры обработки биоматериала

36

 

10

Предосторожности при обработке биоматериала

214

 

11

Специальные требования к обработке

215

 

12

Вид биоматериала

37

блок, срез

13

Фиксирующий агент

38

этиловый спирт

14

Краситель биоматериала

39

 

15

Ингибитор красителя

40

 

16

Процедура экстракции биоматериала

41

 

17

Процедура гибридизации биоматериала

42

 

18

Процедура усиления гибридизации

43

 

19

Маркировка среза

 

1, 2, 3

20

Идентификатор среза

 

13211-2

21

Толщина среза

   

22

Толщина покровного стекла

   

Таблица 2. Кодируемые значения контекста 37, Вид биоматериала

Код

Значение

Y-X0688

срез

Y-X0689

блок

Y-X0690

вскрытый труп

Y-X0691

труп

Y-X0692

культура

Y-X0693

хроматограмма

Y-X0694

проба

Таблица 3. Классы данных структурированного результата исследования

Название класса данных

Определение

TEXT

Произвольный текст

NUMERIC

Численное значение измерения, единицы измерения и необязательные параметры, характеризующие точность измерения и уровень его автоматизации.

NAMED TYPE

Представление библиографических ссылок, дат, времен, фамилий, ссылок URL и концепций в виде пары Имя/Текст значения.

CODE

Кодируемое (перечисляемое) значение.

COORDINATES

Координаты, описывающие геометрическое или временное расположение области интереса в изображении или сигнале.

REF OBJECT

Ссылка на объект класса CURVE, WAVEFORM, AUDIO DICTATION, SOUND, STRUCTURED TEXT, IMAGE, DOCUMENT IMAGE или OVERLAY.

В будущем возможные другие типы объектов, например программное представление или печатное представление.

CURVE

Двоичное представление векторных данных.

WAVEFORM

Двоичное представление изменяющихся во времени данных.

AUDIO DICTATION

Цифровая аудиозапись надиктованного результата исследования. {Примечание: хотя аудиозапись надиктованного результата представляет собой частный случай цифровой звукозаписи (SOUND), стандарт выделяет этот тип особо, подчеркивая, что информационное содержание записи суть речь.

SOUND

Цифровая звукозапись. {Примечание: хотя цифровая звукозапись представляет собой частный случай сигнала (WAVEFORM), но его важность и наличие специального контекста заставляют выделить ее в отдельный класс данных.}

STRUCTURED TEXT

Документ, в котором использованы специальные правила разметки, например SGML или XML.

IMAGE

Двоичное представление растрового изображения.

DOCUMENT IMAGE

Представление печатаемого документа в виде растрового изображения. {Примечание: хотя это представление является частным случаем растрового изображения (IMAGE),класс DOCUMENT IMAGE выделен особо, подчеркивая, что его информационное содержание суть образ печатаемого документа.}

OVERLAY

Двоичное представление данных, накладываемых на растровое изображение.

© 1998-2008 Computer Technologies in Medicine