Для обучения инструмента использовали больше 10 миллионов картинок.
NVIDIA выпустила первую версию GauGAN в 2019 году, а в ноябре 2021-го представила GauGAN 2. Главным его нововведением стала возможность генерировать изображения на основе не только эскизов, но и текстовых описаний.
Чтобы натренировать GauGAN 2, использовали суперкомпьютер NVIDIA Selene и свыше 10 миллионов высококачественных изображений видов природы. Нейросеть также учили формировать связь между словами и визуальной информацией, работать с текстом, семантической сегментацией, стилистикой, эскизами.
Опробовать GauGAN 2 можно на сайте NVIDIA. Ранее компания также выпустила редактор Canvas, в основе которого используется нейросеть GauGAN.
Собственную нейросеть, генерирующую изображения на основе текста, ранее создал и «Сбер» — его инструмент получил название ruDALL-E, он составляет изображения по описанию на русском.