Google Gemini скоро позволит вам редактировать изображения, созданные искусственным интеллектом, чтобы исправить трехглазых собак и невозможные здания

Google Gemini скоро позволит вам редактировать изображения, созданные искусственным интеллектом, чтобы исправить трехглазых собак и невозможные здания

30 июля 2024 г.

Искусственный интеллект может создавать впечатляющие изображения, но не редкость, что эти изображения имеют странные проблемы, такие как люди со слишком большим количеством зубов или городские пейзажи с уличной планировкой в ​​стиле Эшера. Google Gemini работает над обновлением своей функции создания изображений ИИ, чтобы исправить такие проблемы, как впервые замечено в незавершенном коде Android Authority. Похоже, что возможность тонкой настройки уже в пути, что позволит пользователям вносить подробные изменения в изображения, созданные ИИ.

Инструменты Google Gemini для преобразования текста в изображение не могут вносить изменения после создания изображения прямо сейчас. Вместо этого пользователи должны отправлять новые запросы, надеясь, что новый запрос исправит все проблемы и создаст что-то, что соответствует тому, что они хотят видеть. Это может быть особенно утомительно, если есть только небольшая, но все еще отвлекающая ошибка. Согласно раскрытому коду, функция тонкой настройки Gemini удовлетворит потребность в ограниченных изменениях с помощью двух методов редактирования.

Первый вариант позволит пользователям отправлять подсказку об изображении, сгенерированном ИИ, и запрашивать изменение одного аспекта. Например, если вам понравилось изображение выше, но вы хотите установить его в городе, вы можете оставить робота и птицу, но изменить фон, попросив Gemini переместить их. Второй метод, описанный в коде, представляет собой более интерактивный подход. Пользователи могут обвести часть изображения, которую они хотят изменить, с помощью пальца или стилуса. После выбора области они могут описать желаемые изменения, и Gemini поймет, что инструкции относятся только к обведенному участку.

Успешное редактирование с помощью ИИ

Эти инструменты редактирования могут быть особенно полезны тем, кто работает в таких областях, как графический дизайн, маркетинг и социальные сети, где визуальная точность и быстрое время выполнения имеют решающее значение. Google Gemini может лучше удовлетворить потребности художников, дизайнеров и обычных пользователей, которые стремятся создавать отточенный визуальный контент более эффективно. Хотя точная дата выпуска этих функций остается неопределенной, их появление в коде предполагает, что это не заставит себя долго ждать. Он также хорошо сочетается со связанными функциями, такими как будущая функция поиска изображений Ask Photos.

Google не будет первым, кто внедрит инструменты редактирования для создателей изображений на основе ИИ. Эти методы в значительной степени совпадают с теми, которые доступны в портфолио моделей создания изображений на основе ИИ Dall-E от OpenAI. В ChatGPT пользователи могут запрашивать корректировки уже созданного изображения или выделять его части и отправлять новую текстовую подсказку, корректирующую эту часть изображения. Аналогичные функции есть у многих создателей изображений на основе ИИ, таких как Ideogram.ai и Adobe Firefly. Тем не менее, план Google по внедрению этих инструментов тонкой настройки является техническим скачком для Gemini. Это знаменует собой постоянное стремление Google соответствовать и превосходить своих конкурентов в OpenAI, Meta и других, когда речь идет об инструментах генеративного ИИ.

Вам также может понравиться


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE