Нейросеть может брать изображение и создавать различные его вариации, изменяя композицию, тени и текстуру.
OpenAI начала тестировать DALL-E 2 — обновлённую версию нейросети, впервые представленную в январе 2021-го. Программа теперь генерирует до четырёх раз более качественные изображения, чем предыдущая версия, опираясь лишь на описание на английском языке. На фото слева показаны возможности первой версии, а справа — на что способна обновлённая.
Нейросеть научилась добавлять на изображения новые объекты и редактировать фотографии. DALL-E 2 может, например, заменить на изображении собаку на кота, или добавить надувного фламинго в интерьер. На примерах ниже слева находится оригинал, а справа — изображение после обработки нейросетью.
Нейросеть также способна создавать новые рисунки на основе существующих и делать их в духе оригинала. А при загрузке двух картинок DALL-E 2 может сгенерировать третью, которая будет сочетать элементы исходных изображений.
DALL-E 2 также может объединять совершенно чуждые друг другу концепции. В результате получаются правдоподобные изображения, к примеру, тарелка супа, похожая на связанного монстра.
На своей странице в Twitter старший вице-президент по исследованиям и продукту OpenAI Мира Мурати показала возможности алгоритма, сгенерировав изображение по описанию: «фотография в макросъемке на 35-мм пленке большой мышиной семьи в шляпах у камина».