deepmind lab

[Перевод] Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи

05.11.2018

ALE, CommAI, deepmind lab, Gym, Gym Retro, Malmo, Random Network Distillation, RND, unity, Universe, Месть Монтесумы

Прогресс в игре «Месть Монтесумы» многими рассматривался как синоним достижений в области исследования незнакомой среды Мы разработали метод случайной дистилляции сети (Random Network Distillation, RND) на основе прогнозирования, который поощряет агентов обучения с подкреплением исследовать окружение благодаря любопытству. Этот метод…

DeepMind открыл бесплатный доступ с виртуальной среде машинного обучения

06.12.2016

deepmind, deepmind lab, google

На днях представители подразделения DeepMind (сейчас входит в состав холдинга Alphabet) сообщили о предоставлении бесплатного доступа разработчикам к исходному коду платформы DeepMind Lab. Это сервис машинного обучения на базе Quake III, который предназначен для обучения искусственного интеллекта. А именно —…

deepmind lab

[Перевод] Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи

DeepMind открыл бесплатный доступ с виртуальной среде машинного обучения

Паблик ВКонтакте

Последние посты