ALE
[Перевод] Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи
Прогресс в игре «Месть Монтесумы» многими рассматривался как синоним достижений в области исследования незнакомой среды Мы разработали метод случайной дистилляции сети (Random Network Distillation, RND) на основе прогнозирования, который поощряет агентов обучения с подкреплением исследовать окружение благодаря любопытству. Этот метод…
Читать дальшеПаблик ВКонтакте
Последние посты
- Слух: Netflix продлил «Devil May Cry» на третий сезон
- Экранные панели для Samsung Galaxy S27 могут начать закупать в Китае
- В России построят первый частный космодром с планами запуска до 50 ракет ежегодно
- Угроза безопасности в Instagram*: сквозное шифрование личных сообщений отключено
- Бекмамбетов прокомментировал неудачу «Войны миров»
