Александр Гусев «Эксперту»: «В нашей базе данные уже почти двух миллионов цифровых двойников»

«Эксперт» поговорил с директором по развитию проекта Webiomed Александром Гусевым о том, чем искусственный интеллект может помочь врачу, каковы его технологические возможности, а также получил признание, что в ближайшей перспективе искусственный интеллект никак не сможет заменить ум и сердце врача.

— Для чего предназначен ваш продукт Webiomed?

— Это информационная система, которую мы учим распознавать болезни и помогать врачу в выборе правильной стратегии профилактики заболеваний.

— Насколько это актуально для нашей системы здравоохранения?

— Сейчас система здравоохранения и работа врача устроены так, чтобы «тушить текущий пожар». Врачу на рутинном приеме из-за недостатка времени чаще всего просто не до оценки рисков и прогнозов состояния пациента в будущем. Сам пациент тоже часто не готов уделить внимание своему будущему и тем более тратить деньги на профилактику заболеваний. Для многих заболеваний отсутствуют алгоритмы, с помощью которых можно оценить неблагоприятные события. То есть в реальном здравоохранении профилактика пока не работает, хотя хорошо известно, что эффективная профилактика может сокращать сердечно-сосудистую заболеваемость до 80 процентов, а онкологическую заболеваемость — до 40 процентов. Но пока мы упускаем эти возможности. Поэтому наша команда врачей и специалистов по искусственному интеллекту создает сервис, который помогает врачу восполнить пробелы в оценке рисков пациента через автоматический анализ его медицинских данных.

— Что конкретно представляет собой ваш продукт с технической точки зрения?

— Webiomed — это облачная информационная система, которая размещена в надежном федеральном центре обработки данных. На вход система принимает обезличенную медицинскую карту пациента: врачебные записи, протоколы обследования, заключения ЭКГ, УЗИ, рентгена и так далее. Мы учим искусственный интеллект понимать текст и интерпретировать распознанные данные в зависимости от контекста. Скажем, врач пишет, что пациент курит, такое давление у него, холестерин в динамике. Этого, например, достаточно, чтобы понять, развивается ли в организме атеросклероз. Если мы работаем с лабораторными данными, то очень часто по ним можно автоматически заподозрить сахарный диабет, хроническую почечную недостаточность и многие другие опасные болезни. А врач в силу дефицита времени и порой неосведомленности обо всех аспектах заболеваний может их иногда и пропустить.

— Насколько мне известно, есть огромная проблема с получением достаточного массива медицинских текстов и их унификацией. Их же нужно привести в некий стандартный вид.

— Да, вы на больную мозоль наступили. Мы пытаемся сейчас сотрудничать с разными поставщиками, со всеми, у кого есть ценная медицинская информация — обезличенные карты пациентов. Мы бы могли расти быстрее, приходить в большее количество медицинских организаций, регионов и даже стран, если бы был единый жесткий стандарт формирования и хранения информации, как в любой другой зрелой отрасли. В медицине, к сожалению, каждый разработчик медицинской системы хранит данные в своем формате. И поэтому мы машину учим не просто выявлять разные медицинские сущности, но еще и понимать разные форматы. И в этом наше технологическое ноу-хау.

— На рынке уже много компаний, которые занимаются анализом визуальных медицинских изображений — КТ-снимков, маммографии, рентгеновских снимков. Распознавание текстов — более сложная работа, чем анализ изображений?

— Совершенно верно. Разработок в области анализа медицинских изображений уже очень много, и там тяжелая конкуренция. Упрощенно говоря, с технической точки зрения сегодня любой студент может скачать открытые размеченные наборы медицинских изображений и, используя бесплатные фреймворки, провести машинное обучение и получить модель искусственного интеллекта, умеющую немного «понимать», например, рентгенограмму или КТ легких. С точки зрения развития технологий это замечательно, с точки зрения предпринимателя — плохо, потому что в этой отрасли нужно конкурировать уже с сотней стартапов.

Работа с текстами медицинских записей пока мало проработанная область, во всем мире эта тема развивается медленнее, чем анализ изображений. Вот конкретный пример. Мы полгода учили систему правильно извлекать из записей факт курения. Иногда врач пишет: «Пациент курит». Может написать: «Курение пациент отрицает». Или: «Со слов пациента, не курит уже неделю». Человек легко поймет, в каком случае есть факт курения, а в каком нет. Для машин это сложнее. Поэтому технологически сложно создать надежную и точно работающую систему, умеющую «понимать» текстовые врачебные записи и строить на их основе правильные прогнозы и выводы. В этой отрасли относительно мало конкурентов.

— Но за анализом текстов будущее в применении ИИ?

— Да. Мы внимательно следим за американскими, европейскими публикациями, в них все чаще говорится, что в анализе изображений ИИ вплотную подошел к потолку диагностических возможностей самого изображения. Сегодня точность машинного анализа КТ легкого или маммографии выше, чем у рентгенологов.

Но дело в том, что анализ визуального изображения позволяет только диагностировать существующую проблему: обученный искусственный интеллект, как и человек, видит на снимках отклонения от нормы. Возьмем для примера рак легких. Изменения в легких, характерные для злокачественного заболевания, появятся на снимках только у уже заболевшего человека. И когда пациента привозят в больницу, врач без всякого искусственного интеллекта понимает, что делать. Заниматься профилактикой поздно. Поэтому ценность анализа только изображений с точки зрения предупреждения заболеваний ограничена. А вот комплексная оценка всей медицинской карты пациента, включая тщательный анализ всех врачебных записей и поиск в них скрытых паттернов заболеваний, особенно на бессимптомной или ранней стадии, безумно ценна с прогностической точки зрения.

— Как вы конкретно обучаете ИИ?

— Первое, чему мы учим машину, — понимать тексты с помощью разметки данных, это так называемые NLP-технологии. Вторая важнейшая задача — создание прогностических математических моделей. Мы накапливаем много разных данных о человеке, таких как анамнез, объективные данные врачебных осмотров, результаты инструментальных и лабораторных обследований и так далее; в нашей базе данных накоплено почти два миллиона обезличенных цифровых двойников. В них есть сведения об обращаемости, о смерти, о госпитализации. Таким образом мы фиксируем «вход и выход»: наблюдаемые параметры человека и дальнейшие события, которые с ним происходили. И используя машинное обучение, мы находим в этом море данных характерные паттерны, которые позволяют машине довольно точно научится предсказывать будущее в относительно однородных группах пациентов.

А третья, ключевая и еще более сложная задача — научить искусственный интеллект давать рекомендации по лечению. На наш взгляд, ИИ с этим пока справляется отвратительно. Мы сами пробовали учить этому машину, смотрели, как это делают другие компании, например IBM. И убедились, что пока редко получается пригодный для применения продукт. Поэтому мы считаем более разумным использовать машинное обучение для создания прогнозных моделей. И если они выявляют какую-то опасную ситуацию в будущем, то рекомендации должны формировать уже привычные и проверенные временем экспертные системы, построенные на базе достоверных клинических рекомендаций и простых решающих правил. Такое сочетание позволяет лучше формировать итоговые рекомендации врачам.

— То есть искусственный интеллект пока не может назначить лечение?

— Нет. Для этого слишком мало исходных данных для машинного обучения, клинические знания пока отсутствуют в достаточной степени формализации. И технологии пока позволяют выделять из текстов факты, но не позволяют машине действительно понимать научные рекомендации и на их основе давать врачам советы по лечению. Это удел будущего.

Читать интервью полностью: https://expert.ru/expert/2020/46/iskusstvennyij-intellekt-poka-ne-mozhet-lechit/#