ALE
[Перевод] Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи
Прогресс в игре «Месть Монтесумы» многими рассматривался как синоним достижений в области исследования незнакомой среды Мы разработали метод случайной дистилляции сети (Random Network Distillation, RND) на основе прогнозирования, который поощряет агентов обучения с подкреплением исследовать окружение благодаря любопытству. Этот метод…
Читать дальшеПаблик ВКонтакте
Последние посты
- Квантовый ластик, Хорхе Луис Борхес и сказка с самопишущимся сюжетом
- Black Myth: Wukong признана игрой года на Golden Joystick Awards 2024
- Камера базового iPhone 16 превосходит iPhone 14 Pro Max, но по версии DxOMark Pixel 9 остаётся лидером
- Камера стандартного iPhone 16 превосходит iPhone 14 Pro Max, но Pixel 9 всё же лидирует, согласно DxOMark
- 12 миллионов геймеров выразили свое мнение: игрой года 2024 признана Black Myth: Wukong, а лучшим девайсом — Steam Deck OLED