ALE
[Перевод] Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи
Прогресс в игре «Месть Монтесумы» многими рассматривался как синоним достижений в области исследования незнакомой среды Мы разработали метод случайной дистилляции сети (Random Network Distillation, RND) на основе прогнозирования, который поощряет агентов обучения с подкреплением исследовать окружение благодаря любопытству. Этот метод…
Читать дальшеПаблик ВКонтакте
Последние посты
- Как создать игру на Phaser 4 с помощью ИИ, если вы не фронтенд-разработчик
- Rockstar Games и профсоюз: итоги предварительного слушания
- США упростят подключение дата-центров к электросетям на фоне ИИ-бума
- Nothing закрывает линейку CMF Phone: релиз модели Pro отменен из-за дефицита памяти и роста цен на фоне бума ИИ
- GamesVoice выпустила русскую версию песни Wide Awake из Alan Wake 2
