Опыт Европы: как языковые технологии могут помочь бороться с COVID-19

Заместитель генерального директора DG Connect Европейской комиссии Халил Рухана опубликовал в своем блоге статью о том, что языковые технологии (такие как обработка текстов на естественном языке) могут сыграть свою роль для медицинских исследований, особенно сейчас, для борьбы с COVID-19. Речь идет о MLIA, инициативе по многоязычному доступу к информации.
Этот проект функционирует на добровольной основе, чтобы поддержать быстрый обмен информацией и коммуникацию в многоязычной среде, охватывающей все официальные языки ЕС (и не только). Аналогичная инициатива существует в США, но только на английском языке: Covid-19 Open Research Dataset (CORD-19),  конкурс для анализа большого набора научных работ по вирусу.
Европа ищет алгоритм, способный сканировать, агрегировать и представлять данные из различных источников. Он будет обрабатывать не только структурированные данные (например, количество случаев заболевания и  родолжительность инкубационного периода), но и неструктурированные и текстовые данные, содержащиеся в отчетах, исследованиях, статьях и т. д.
Ведь ежедневно в журналах биомедицинской тематики публикуется более 3000 научных статей. Очевидно, что исследователям невозможно просмотреть их все в режиме реального времени, а общественности еще труднее получить доступ ко всей имеющейся информации.
Уже сейчас к инициативе MLIA присоединились более 40 участников: университеты и IT-компании из Европы и всего мира, включая Австралию, Китай, Индию, Иорданию, Саудовскую Аравию и Ботсвану. Первый этап проекта должен завершиться к январю 2021 года.
Инициатива MLIA находится на правильном пути к объединению исследовательских сообществ,
смещению акцента с конкуренции на сотрудничество и более эффективной борьбе с COVID-19, считает Халил Рухана.