В рамках конференции Cloud Next в Сан-Франциско Google анонсировала запуск нового прикладного программного интерфейса на базе машинного обучения, позволяющего автоматически распознавать объекты на видео и делать их доступными для поиска.
Video Intelligence API позволяет разработчикам создавать приложения, которые могут автоматически извлекать обнаруженные на видео объекты. До недавнего времени большинство похожих облачных API могли распознавать только изображения. Помимо извлечения метаданных, новый прикладной программный интерфейс позволяет помечать изменения в сценах.
Такие видеоролики должны храниться в облачном сервисе Google. Демонстрацию работы Video Intelligence API можно найти здесь. Разработчики могут подписаться на участие в закрытом бета-тестировании технологии по этой ссылке.
Как отметила главный научный сотрудник Google Cloud в сфере искусственного интеллекта и машинного обучения Фей-Фей Ли (Fei-Fei Li), мир пикселей выходит за рамки изображений. Работа с видео уже давно была проблемой для исследователей в сфере машинного обучения. Новый сервис же позволяет извлекать информацию из роликов с той же лёгкостью, что в и в случае с картинками.
В дополнение ко всему прочему Ли сообщила, что разработчикам по всему миру стал доступен Cloud Machine Learning Engine — инструмент компании для создания пользовательских моделей машинного обучения с использованием фреймворка TensorFlow.
Ли добавила, что компания хочет демократизировать технологии машинного обучения, создаваемые ею. Video Intelligence API — ещё один тому пример.
Источник: