Генеративный ИИ может стать более активным благодаря этому дикому обновлению Stable Diffusion.
23 ноября 2023 г.Stability AI, разработчик Stable Diffusion, представляет новый генеративный ИИ, который может создавать короткие формы видео с текстовой подсказкой.
Метко названный Stable Video Diffusion, он состоит из двух ИИ. моделей (известных как SVD и SVD-XT) и способен создавать клипы с разрешением 576 x 1024 пикселей. Пользователи смогут настроить частоту кадров в диапазоне от 3 до 30 кадров в секунду. Продолжительность видеороликов зависит от того, какая из моделей-близнецов выбрана. Если вы выберете SVD, контент будет воспроизводиться в течение 14 кадров, а SVD-XT немного увеличит его до 25 кадров. Длина не имеет большого значения, поскольку обработанные клипы будут воспроизводиться всего около четырех секунд до завершения, в соответствии с целью официальное объявление на Hugging Face.
Компания разместила на своем канале YouTube видео, демонстрирующее, на что способна Stable Video Diffusion, и контент на удивление высокого качества. Они определенно не являются тем кошмарным топливом, которое вы видите на других ИИ, таких как Meta's Make-A-Video. Самым впечатляющим, на наш взгляд, является демо-версия Ice Dragon. Вы можете увидеть большое количество деталей в чешуе дракона, а горы сзади выглядят как нечто сошедшее с картины. Анимация, как вы понимаете, довольно ограничена, поскольку объект может лишь медленно покачивать головой. То же самое можно увидеть и в других демо. Это либо медленный цикл ходьбы, либо медленный панорамный снимок.
На ранних стадиях
На этом ограничения не заканчиваются. Сообщается, что Stable Video Diffusion не может «достичь идеального фотореализма», не может генерировать «разборчивый текст», плюс у него проблемы с лицами. Еще одна демонстрация на веб-сайте Stability AI показывает, что ее модель способна отображать лицо мужчины без каких-либо странных недостатков, поэтому это может быть сделано в каждом конкретном случае.
Имейте в виду, что этот проект все еще находится на ранней стадии. Очевидно, что модель не готова к широкому выпуску и не планирует этого делать. Stability AI подчеркивает, что Stable Video Diffusion в настоящее время не предназначен «для реальных или коммерческих приложений». Фактически, в настоящее время он «предназначен только для исследовательских целей». Мы не удивлены, что разработчик очень осторожен со своими технологиями. В прошлом году произошел инцидент, когда Модель Stability Diffusion просочилась в сеть, что привело к тому, что злоумышленники использовали ее для создания глубоких фейковых изображений.
Доступность
Если вы хотите попробовать Stable Video Diffusion, вы можете войти в список ожидания, заполнив форму на сайте компании. Неизвестно, когда людей пустят, но предварительная версия будет включать интерфейс преобразования текста в видео. А пока вы можете ознакомиться с официальным документом AI и прочитайте все подробности проекта.
Покопавшись в документе, мы нашли интересную вещь: в нем упоминается использование «общедоступных наборов видеоданных» в качестве учебного материала. Опять же, неудивительно слышать это, учитывая, что Getty Images подала в суд на Stability AI из-за обвинений в сборе данных в начале этого года. Похоже, команда стремится быть осторожнее, чтобы не нажить больше врагов.
Пока нет информации о том, когда выйдет Stable Video Diffusion. К счастью, есть и другие варианты. Обязательно ознакомьтесь со списком лучших производителей видео с использованием ИИ на сайте TechRadar. 2023.
Вам также может понравиться
- Стабильный Doodle AI может превращать рисующих в художников
- Теперь вы можете бесплатно общаться с ChatGPT, как с Siri, но он не раскроет секреты OpenAI
- Новая стабильность ИИ инструмент преобразования текста в аудио похож на Midjourney для музыкальных образцов
Оригинал