Google запустил сервис для удобного поиска датасетов

В январе 2020 года Google запустил сервис для удобного поиска наборов данных Dataset Search после его тестирования на протяжении более одного года.

Этот инструмент позволяет по ключевым словам находить нужную информацию среди примерно 25 млн репозиториев, свободно доступных в интернете. Доступна сортировка результатов поиска по дате обновления, правам использования, стоимости доступа и формату скачивания.

Как пишет издание SiliconANGLE, открытые датасеты играют все более важную роль в технологическом секторе на фоне быстрого распространения искусственного интеллекта. Чем сложнее ИИ, тем больше тренировочных данных нужно обработать, чтобы алгоритм стал готовым для серийного использования. Подобные Dataset Search порталы, где разработчики ИИ-систем могут централизованно искать данным, может стать ценным инструментом для проектов машинного обучения.

Кроме того, свои датасеты обычно предоставляют научно-исследовательские лаборатории и крупные организации, такие как Facebook.

Перед полномасштабным запуском Dataset Search компания Google существенно доработала сервис по сравнению с бета-версией. В частности, было «значительно улучшено» качество описаний для репозиториев и добавлены новые фильтры, позволяющие пользователям сузить результаты поиска в зависимости от того, какой набор данных им требуется.

Теперь вы можете фильтровать результаты на основе желаемых типов наборов данных, которые вы хотите (например, таблиц, изображений, текста), или на основе того, доступен ли набор данных у поставщика. Если набор данных связан с географической областью, вы можете увидеть карту, — написала в блоге исследователь Google Наташа Ной (Natasha Noy).

Отмечается, что разработчики сервиса стремились к стандартизированному описанию данных, предложенных командой schema.org.

Как отмечают эксперты Ассоциации разработчиков и пользователей систем искусственного интеллекта в медицине «Национальная база медицинских знаний», введение в оборот большего количества датасетов может привести к росту валидированных программных продуктов с применением ИИ.

Источник: http://www.tadviser.ru/index.php/%D0%9F%D1%80%D0%BE%D0%B4%D1%83%D0%BA%D1%82:Dataset_Search