В платформе Webiomed обновлен сервис анализа неструктурированных медицинских записей Webiomed.NLP

Сервис Webiomed.NLP позволяет автоматически «извлекать» из медицинских текстовых записей структурированные признаки.

Почему это важно

Сегодня в электронных медицинских картах (ЭМК) до 80% врачебных записей хранится в текстовом виде. Из-за этого их невозможно обработать и использовать для машинного анализа.

Сервис Webiomed.NLP позволяет автоматически «извлекать» из медицинских текстовых записей структурированные признаки. Например: симптомы из жалоб, данные об артериальном давлении, росте и весе пациента из неструктурированных объективных данных, лабораторные показатели из выписок и многое другое.

Количество извлекаемых признаков

На данный момент система Webiomed поддерживает извлечение 1261 признаков, больше половины из которых – МНН (международное непатентованное название)  лекарственных препаратов. На текущий момент это порядка 700 признаков.

Документы ЭМК

Извлечение данных доступно из четырёх типов документов: Протокол осмотра, Эпикриз по законченному случаю амбулаторный, Инструментальное исследование, Эпикриз в стационаре выписной. Каждый из типов документов поддерживает уникальное количество признаков, присущих определенному типу документа.

Webiomed.nlp

Помимо извлечения общих признаков из медицинских документов с помощью сервиса извлекаются признаки сердечно-сосудистых заболеваний и  осложнений беременности, родов и послеродового периода (преэклампсии).

Модели NLP

В настоящий момент в Webiomed подключено  9 моделей, извлекающих признаки и симптомы ССЗ, а также 5 моделей, извлекающих признаки преэклампсии.

Команда NLP проекта Webiomed  работает не только в направлении увеличения количества извлекаемых признаков, но также улучшает старые модели, добиваясь более качественных результатов извлечения признаков и повышая метрики точности до границы не менее 0.9.

В определенный момент, при разработке NLP моделей, остро встал вопрос с грамотной обработкой отрицаний признаков. Довольно часто встречающиеся отрицания признаков в явном или неявном виде не отбрасывались, а записывались в результаты извлечения как положительный результат. Но благодаря внедрению мультиклассификации в модели с бинарными признаками, модели получилось обучить таким образом, что большинство отрицаний начали корректно обрабатываться, что существенно увеличило качество моделей.

Что планируеТся

В планах существенно увеличить количество извлекаемых симптомов из протоколов осмотров, инструментальных исследований для дальнейшего развития предиктивных способностей нашей системы, создать комплекс моделей для извлечения всех существующих МНН лекарственных препаратов.

Подробнее о сервисе Webiomed. NLP здесь: https://webiomed.ai/products/webiomednlp/