ALE
[Перевод] Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи
Прогресс в игре «Месть Монтесумы» многими рассматривался как синоним достижений в области исследования незнакомой среды Мы разработали метод случайной дистилляции сети (Random Network Distillation, RND) на основе прогнозирования, который поощряет агентов обучения с подкреплением исследовать окружение благодаря любопытству. Этот метод…
Читать дальшеПаблик ВКонтакте
Последние посты
- Данные миссии NASA MMS раскрыли, как частицы разгоняются до 16 000 км/с в магнитосфере, вызывая сбои в работе космических технологий
- Компания MaxBionic из России представила бионические кисти с сенсорным мизинцем, встроенным генератором захватов и возможностью облачной настройки
- Точность несмотря на размер: кубсаты от Aerospace и Spire Global овладели оптической связью
- Подобного предложения нет на российском рынке: на подходе запуск сервиса «Сторис» с короткими вертикальными видео
- Даже на RTX 4060 игра The Last of Us Part II из числа самых красивых для PS4 идет при 60 кадрах/с на средних ПК