Новая модель преобразования текста в видео OpenAI Sora может создавать потрясающе реалистичный контент

Новая модель преобразования текста в видео OpenAI Sora может создавать потрясающе реалистичный контент

16 февраля 2024 г.

OpenAI открывает новые горизонты, поскольку гигант искусственного интеллекта представил свою первую систему текстовых сообщений -видеомодель по имени Сора, способная создавать шокирующе реалистичный контент.

Нам интересно, когда же компания, наконец, выпустит собственный видеодвижок, как многие ее конкуренты, из Стабильность ИИ до Google опередил их. Возможно, OpenAI хотела все исправить перед полноценным запуском. При таких темпах качество его продукции могло бы затмить современников. Согласно официальной странице, Сора может создавать «реалистичные и творческие сцены» из одной текстовой подсказки; так же, как и другие модели искусственного интеллекта для преобразования текста в видео. Отличие этого двигателя заключается в технологии, лежащей в его основе.

Реалистичный контент

Open AI утверждает, что его искусственный интеллект может понимать, как люди и объекты «существуют в физическом мире». Это дает Соре возможность создавать сцены с участием нескольких людей, различных типов движений, выражений лиц, текстур и объектов с высокой детализацией. Создаваемым видео не хватает пластикового вида или кошмарных форм, которые можно увидеть в другом контенте AI — по большей части, но об этом позже.

Sora также является многомодульным. Сообщается, что пользователи смогут загружать неподвижное изображение, которое послужит основой для видео. Содержимое внутри изображения станет анимированным, при этом большое внимание будет уделено мелким деталям. Он даже может взять уже существующее видео «и расширить его или заполнить недостающие кадры».

Подробнее

Вы можете найти примеры видеороликов на веб-сайте OpenAI и на X (платформе, ранее известной как Twitter). В одном из наших любимых изображений изображена группа щенков, играющих в снегу. Если вы присмотритесь, вы увидите, что их мех и снег на мордах кажутся им поразительно реалистичными. Еще один замечательный клип показывает покачивающегося голубя с короной Виктории. вокруг, как настоящая птица.

Работа в процессе

Какими бы впечатляющими ни были эти два видео, Сора не идеален. OpenAI признает, что у ее «модели есть недостатки». Ему может быть трудно моделировать физику объекта, путать левое и правое, а также неправильно понимать «примеры причины и следствия». Вы можете откусить файл cookie персонажем ИИ, но у файла cookie нет отметки откусывания.

Это также делает много странных ошибок. Один из самых забавных инцидентов произошел с группой археологов. раскапывая большой лист бумаги, который затем превращается в стул, а затем превращается в смятый кусок пластика. У ИИ также, похоже, проблемы со словами. «Выдра» написана с ошибкой как «Отер», а «Ленд Ровер» теперь называется «Дановер».

Увидеть больше

В дальнейшем компания будет работать со своими «красными командами», которые представляют собой группу отраслевых экспертов, «чтобы оценить критические области на предмет вреда или рисков». Они хотят убедиться, что Сора не генерирует ложную информацию, ненавистнический контент или не имеет какой-либо предвзятости. Кроме того, OpenAI собирается реализовать классификатор текста, чтобы отклонять запросы, нарушающие их политику. К ним относятся, среди прочего, запросы на контент сексуального характера, видео со сценами насилия и изображения знаменитостей.

Пока нет информации о том, когда Sora официально выйдет. Мы обратились за информацией о релизе. Эта история будет обновлена ​​позже. А пока ознакомьтесь со списком лучшие видеоредакторы с искусственным интеллектом на 2024 год.

Вам также может понравиться


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE