ALE
[Перевод] Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи
Прогресс в игре «Месть Монтесумы» многими рассматривался как синоним достижений в области исследования незнакомой среды Мы разработали метод случайной дистилляции сети (Random Network Distillation, RND) на основе прогнозирования, который поощряет агентов обучения с подкреплением исследовать окружение благодаря любопытству. Этот метод…
Читать дальшеПаблик ВКонтакте
Последние посты
- «Скорость, с которой мы излечим рак и болезни сердца, нас поразит» — новейший американский ИИ обещает разработку персонализированных вакцин за 48 часов
- Мощная вспышка на Солнце: образованы два высокоактивных центра
- Илон Маск продемонстрировал впечатляющие снимки Super Heavy в космосе и при посадке на Mechazilla
- Вы неправильно понимаете концепцию калорийности! Вот что вам необходимо знать
- Дональд Трамп объявил о выделении 500 миллиардов долларов на крупнейший инфраструктурный проект в сфере искусственного интеллекта в истории