Google представляет Veo и Imagen 3 для платформы искусственного интеллекта
6 декабря 2024 г.Две новые модели генеративного ИИ от Google, Veo и Imagen 3, теперь доступны на облачном хостинге Vertex AI. Veo генерирует видео, а Imagen 3 создает фотографии.
Google предполагает, что эти модели можно использовать в маркетинге, электронной коммерции и т. д.
Veo создает видео из текстовых или графических подсказок
После того, как такие компании, как OpenAI, экспериментировали с генерацией видео с переменным успехом в начале этого года, инфраструктура и вычислительная мощность догнали и сделали генерацию видео более практичной. Буквально на этой неделе Amazon представила модель генерации видео под названием Amazon Nova Reels на AWS.
Veo создает видео из текстовых или графических подсказок и может добавлять элементы в существующие видео. Google решила общие проблемы в области ИИ-генерации видео, такие как сохранение непрерывности и избежание неестественно выглядящих движений. Эти усилия последовали за февральской демонстрацией OpenAI Sora, которая выявила такие проблемы, как странные движения, включая сюрреалистические примеры с волками.
Veo может генерировать изображения длительностью более минуты с разрешением 1080p, а более длинные видеоролики могут включать несколько сцен, созданных на основе последовательных подсказок.
Veo уже доступен в закрытой предварительной версии. Чтобы начать, владельцы аккаунтов могут связаться с представителем Google Cloud своей организации.
Imagen 3 создает фотореалистичные или анимированные изображения
Imagen 3, выпущенный в Vertex AI в закрытом предварительном просмотре в июне, станет общедоступным «начиная со следующей недели». Imagen 3 может создавать реалистичные или стилизованные изображения из текстовых подсказок. Google заявила, что детализация, освещение и устранение артефактов улучшились по сравнению с предыдущим поколением Imagen.
В маркетинге Google подчеркнул, что организации могут включать в изображения, созданные с помощью ИИ, свои собственные «бренды, стиль, логотипы, темы или характеристики продукта». Данные о клиентах не возвращаются в модель для обучения новых итераций Imagen.
Google предложила разработчикам руководство по работе с Imagen 3. Для безопасности Imagen 3 поставляется с цифровыми водяными знаками, фильтрами контента и защитными мерами управления данными.
СМ.: Эти шаблоны видеопроизводства для Google Таблиц и других приложений могут сделать ваш рабочий процесс более плавным.
Компании предлагают больше вариантов генеративного ИИ, изучают источники окупаемости инвестиций
Google Cloud продала Veo и Imagen 3 на Vertex AI различным крупным клиентам, которые высоко оценили инструменты для быстрой итерации контента с использованием генеративного ИИ. Однако гиганты генеративного ИИ и их клиенты иногда испытывают трудности с тем, как извлечь ценность из инструментов.
Между тем, Google заявила, что 74% организаций с инвестициями в генеративный ИИ видят рентабельность инвестиций. Однако прием контента, созданного ИИ, не был всеобщим положительным: видеореклама Coca-Cola, созданная ИИ в ноябре, вызвала споры, и некоторые потребители негативно отреагировали на то, что они восприняли как недостаток креативности или аутентичности.
Оригинал