ALE
[Перевод] Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи
Прогресс в игре «Месть Монтесумы» многими рассматривался как синоним достижений в области исследования незнакомой среды Мы разработали метод случайной дистилляции сети (Random Network Distillation, RND) на основе прогнозирования, который поощряет агентов обучения с подкреплением исследовать окружение благодаря любопытству. Этот метод…
Читать дальшеПаблик ВКонтакте
Последние посты
- Авария ракеты Blue Origin ставит под угрозу планы NASA и запуск спутникового интернета Amazon
- Virgin Galactic возобновила полеты своего космоплана для развития космического туризма
- Acer представила свои первые умные очки с ИИ: сразу две новинки от бренда
- Астрофизик из Гарварда допустил, что комета 3I/ATLAS принесла жизнь в Солнечную систему
- Авторы Gothic 1 Remake объявили мировое время выхода игры: до релиза осталась неделя
