OpenAI представила Sora 2 — новую модель для генерации видео

OpenAI представила Sora 2 — новую модель для генерации видео

OpenAI представила Sora 2 — новую систему генерации видеоконтента, как сообщается на официальном сайте: подробнее.

Компания проводит параллели: Sora 1 сравнивают с GPT‑1, а Sora 2 — с GPT‑3.5. Новая версия умеет воспроизводить сцены, которые ранее считались недостижимыми — например, ролик с мужчиной, выполняющим тройное сальто назад.

Ранее генеративные модели иногда нарушали физику ради соответствия запросу — например, если баскетболист промахивался, мяч словно «телепортировался» в кольцо. В Sora 2 таких артефактов стало значительно меньше: мяч корректно отскакивает от щита, а модель точнее учитывает физические закономерности.

Sora 2 также научилась синтезировать аудиодорожки — фоновые звуки, речь и звуковые эффекты с высокой степенью правдоподобия, отмечают в OpenAI. Система способна генерировать голосовые реплики в том числе на русском языке.

Модель умеет интегрировать элементы реального мира в синтетические сцены: например, «вставить» человека и его реплики в вымышленную среду.

Для iOS выпущено социальное приложение Sora, где можно сгенерировать видео с собственным участием и поделиться им с другими. Сейчас доступ предоставляется по приглашениям и ограничен США и Канадой.

Пользователи сохраняют контроль над своим цифровым образом: можно запретить генерацию роликов с собой, отзывать разрешения и удалять любые материалы, где они присутствуют.

Базовая версия Sora 2 станет общедоступной бесплатно позднее, а подписчики ChatGPT Pro получат экспериментальный доступ к Sora 2 Pro. Sora 2 появится в API, тогда как Sora 1 Turbo останется доступной вместе с библиотекой уже созданных видео и изображений.

 

Источник