Ассоциация «Национальная база медицинских знаний» совместно с АНО «Врачебная палата Федерального Медико-Биологического Агентства» (ФМБА России) в рамках созданного в начале 2019г. консорциума реализует проект создания «Оператора биомедицинских данных». В состав консорциума, кроме НБМЗ и «Врачебной палаты», вошли ряд ИТ-компаний и разработчиков систем искусственного интеллекта.

Целью консорциума является практическая проверка возможности создания национального банка биомедицинских данных, которые можно было бы собирать из самых разнообразных источников и затем использовать для производства дата-сетов и машинного обучения, которые как известно являются одной из главных задач на пути создания в России собственного рынка искусственного интеллекта для медицины.

Участники консорциума:

  • Ассоциация «Национальная база медицинских знаний», http://nbmz.ru
  • АНО «Врачебная палата ФМБА России», https://palatafmba.ru
  • ГБУЗ МО МОНИКИ им. М.Ф. Владимирского, http://www.monikiweb.ru/
  • Компания «К-МИС», разработчик СППВР Webiomed, http://webiomed.ai
  • Компания «СолСтрикс», разработчик системы хранения биомедицинских данных, http://solstrix.ru/
  • Компания «ИнСофт», разработчик интеграционной шины
  • Корпорация "Медицинские электронные данные", разработки портала о здоровье и медицине «MedAboutMe», https://medaboutme.ru/
  • Компания «Интеллоджик» разработчик СППВР Botkin.Ai, https://botkin.ai
  • Компания «РобоМед Системс», разработчик билинговой системы проекта, https://robomed.io/ru/.
  • Компания «Сколтех», разработчик платформы CoBrain Analytics, https://cobrain.io/

Поставщиками медицинских данных в пилотной фазе проекта выступили свыше 12 медицинских организаций, подчиненных ФМБА России и использующих медицинские информационные системы «КМИС» и «Медеора». Также поставщиком данных согласилась выступить сеть медицинских центров «Открытая клиника».

В результате реализации пилотного проекта на базе АНО «Врачебная палата ФМБА» компанией «СолСтрикс» был создан центр обработки данных, в котором установлено программное обеспечение для сбора «сырой» медицинской информации. С его помощью участники проекта осуществляли сбор деперсонифицированных медицинских данных для последующей их обработки, создания DataSet-ов и проведения машинного обучения.

В итоге в тестовой версии платформы были накоплены сведения о 298 тыс. «цифровых двойников» пациентов, включая деперсонифицированные сведения о случаях обследования и лечения, анамнезе пациентов, зарегистрированных окончательных диагнозов и медицинских протоколах в формате структурированных электронных медицинских документов (СЭМДов).

Выполнена разметка и верификация собранной информации. В качестве пробы создана демонстрационная версия DataSet-а, содержащего данные об инфарктах и инсультах. В ходе пилотного проекта проверено 6 различных алгоритмов машинного обучения (ML) и глубокого обучения (DL) для определения лучшего алгоритма решения поставленной задачи. По результатам предварительного моделирования получена оценка F1, равная 90.1%, что свидетельствует о высокой точности выбора самих признаков и алгоритма машинного обучения «k Nearest Neighbor».