Простое руководство по текстовым подсказкам ИИ: сообщите ИИ именно то, что вы хотите увидеть

Простое руководство по текстовым подсказкам ИИ: сообщите ИИ именно то, что вы хотите увидеть

6 февраля 2023 г.

В этом руководстве рассказывается об основах работы с текстовыми подсказками и о том, как их эффективно использовать для визуализации изображений, которые вы себе представляли.

Выводы

  • Подсказки для генераторов изображений ИИ могут быть как текстовыми, так и графическими, а в некоторых случаях – и тем, и другим.

* Общая структура текстовых подсказок для генераторов изображений ИИ одинакова для всех, равно как и количество слов и порядок дескрипторов.

* Различные элементы текстовой подсказки по-разному влияют на визуализацию и усложняют изображение.

Что такое подсказки?

Подсказки для создания изображения ИИ – это текстовые или визуальные команды, определяющие, какое изображение создает платформа ИИ. Как правило, вы найдете два разных типа подсказок для создания изображений: текст и изображение.

Текстовые подсказки

Чтобы указать ИИ, какое изображение отображать, вы должны сначала описать это изображение. Это делается с помощью текстовой подсказки, которая представляет собой список слов, иногда даже грамматически правильное предложение, описывающее то, что должен отобразить ИИ.

The Let’s Enhance Image Generator uses text prompts to render images

Выделенное текстовое поле представляет собой пример текстового приглашения, используемого для рендеринга изображений с помощью ИИ с помощью генератора изображений Let's Enhance. . В зависимости от используемой вами платформы рендеринга одинаковые текстовые подсказки будут иметь разные результаты.

Подсказка изображения

В некоторых случаях, когда текста недостаточно, вы можете загрузить изображения в генератор изображений AI и использовать его в качестве эталона для создания других изображений. В зависимости от типа используемой вами платформы искусственного интеллекта и типа результатов, которые вам нужны, использование графических подсказок может быть даже более эффективным, чем текстовые.

Original: Girl with a Pearl Earring by Johannes VermeerOutpainting by: August Kamp

Например, Outpainting AI от DALL.E может взять существующее изображение и отобразить его продолжение. Изображение выше демонстрирует то, что, по мнению ИИ, является продолжением знаменитой картины Иоганна Вермеера Девушка с жемчужной сережкой

Исходное изображение картины находится внутри квадрата, а все, что его окружает, было отрендерено DALL.E.

Сочетание обоих

Хотя большинство генераторов изображений с искусственным интеллектом, которые вы найдете на рынке сегодня, будут текстовыми с некоторыми вариантами графических подсказок, есть способы использовать сочетание обоих подсказок для рендеринга нужных изображений.

Написание приглашения для создания изображения

Одна очень важная деталь, которую вы должны иметь в виду, – это понимание того, на чем специализируется тот или иной генератор изображений с искусственным интеллектом и как его эффективно использовать. Некоторые генераторы изображений с искусственным интеллектом, такие как серия Dall-E, очень хорошо справляются с визуализацией изображений, имитирующих фотореализм.

С другой стороны, есть Midjourney, который хорошо известен своей эффективностью в цифровом искусстве или форматах иллюстраций.

Наш собственный генератор изображений Let’s Enhance отлично подходит для имитации визуальной эстетики изображений продуктов, а также для рендеринга фотореалистичных изображений, иллюстраций и 3D-моделей.

Количество слов: используйте не менее 3–7 слов

Хотя большинство генераторов изображений с искусственным интеллектом имеют ограничение на количество символов в текстовых подсказках, ограничения на количество слов нет. Это означает, что у вас есть свобода структурировать текстовое приглашение так, как вы хотите.

Однако на данный момент все согласны с тем, что вам нужно 3–7 слов, чтобы написать успешное текстовое приглашение для рендеринга ИИ.

Rendered using Let’s Enhance Image Generator

Вот визуализированные изображения текстовой подсказки в приведенном выше примере. Подсказка «общий план» значительно повлияла на изображения в левом столбце.

Вам не нужно строго соблюдать это правило, и вам разрешено использовать менее 3 или более 7 слов. Но, как вы увидите в приведенных ниже примерах, важно не столько количество слов, сколько то, какие слова вы используете.

Тема: Кто и что

Любой рендеринг изображений с помощью ИИ требует определенного объекта. Это должно быть первое, что вы пишете в текстовой подсказке (в большинстве случаев). Можно просто оставить одну тему в текстовой подсказке, и ИИ сгенерирует что-то более общее.

Однако в большинстве случаев вам понадобится более описательная текстовая подсказка, чтобы создать изображение, максимально близкое к тому, что вы хотели визуализировать.

Темы обычно являются существительными, поэтому лучше всего начать с текстового приглашения, независимо от того, какой ИИ вы используете, — начать с одного.

Описание: что они делают, где и как

Чтобы добавить немного больше нюансов к визуализируемому изображению и помочь ИИ сузить круг изображений, которые можно использовать в качестве эталонов, вам необходимо использовать описания. Это ваши прилагательные, и так же, как вы использовали бы их в любом обычном предложении, они описывают предмет.

Хитрость использования прилагательных в создании изображений ИИ заключается в том, что вы можете комбинировать несколько из них, чтобы добавить больше глубины и сложности изображению.

Помимо прилагательных, описывающих предмет, другим элементом описания являются детали, которые отвечают на такие вопросы, как:

* Что происходит? * Что делает предмет? * Как испытуемый это делает? * Что происходит вокруг этой темы?

Последний вопрос очень важен, так как фон играет ключевую роль в эффективном описании. Вот пример двух похожих текстовых подсказок, дающих совершенно разные результаты. Текстовая подсказка для изображения слева была Енот читает.

Однако текстовое приглашение для правого изображения было немного более подробным; поэтому изображение получилось более четким и сложным: Енот читает книгу на фото в библиотеке крупным планом.

Rendered using Let’s Enhance Image Generator

Как вы можете видеть по результатам, мы ответили на несколько вопросов, и ИИ смог сузить область поиска и отобразить что-то максимально близкое к тому, что мы искали. ИИ смог создать изображение с большей детализацией и меньшим количеством аномалий.

Вот еще один отличный пример того, как генераторы изображений AI работают лучше с более подробными графическими подсказками.

Rendered using Stable Diffusion

Это сгенерированное изображение зяблика демонстрирует, как искусственный интеллект может отображать стандартное, но очень точное изображение даже без дополнительных дескрипторов.

Однако рендеринг справа демонстрирует, как генераторы изображений AI, в данном случае Stable Diffusion, могут работать с большим количеством элементов для визуализации значительно более сложного изображения.

Эстетика и стиль: как это выглядит

Чтобы завершить текстовую подсказку, необходимо добавить еще несколько текстовых подсказок, которые завершат визуализацию вашего изображения. Обратите внимание, как в конце текстовой подсказки выше у нас были такие слова, как «фото» и «крупный план».

Последние слова в вашей подсказке будут определять общую эстетику и стиль вашего изображения.

Вместо «фото» можно было написать «картину маслом», «фреску» или «3D-рендеринг». Чтобы диктовать стиль своего образа, вы также можете использовать художественные направления, такие как импрессионизм, готика, стимпанк и т.д.

Кроме того, если вы хотите воспроизвести работы известного художника, вы даже можете указать одно или несколько известных имен в текстовой подсказке. ИИ будет сочетать в себе влияние различных известных художников, чтобы создать что-то, что сочетает в себе элементы их всех.

Наконец, вы также можете диктовать кадрирование изображения. Такие подсказки, как «крупный план» или «средний план», очень похожие на то, что вы делаете в фотографии, могут помочь ИИ понять, под каким углом вы хотите, чтобы изображение было представлено, и с какого расстояния.

Rendered using Lexica

Вот пример двух изображений карманного компьютера, созданных Lexica. Подсказка слева, хотя и простая, смогла создать старинное устройство, которое даже копирует ЖК-дисплей старой школы.

Однако рендеринг справа, благодаря таким подсказкам, как «эстетика паровой волны» и «фотография продукта», имеет более определенную визуальную эстетику и стиль, о чем свидетельствуют неоновые цвета.

Опыт — лучший учитель

Никакие советы и рекомендации не научат вас писать эффективные подсказки ИИ, кроме опыта. Самое приятное в генераторах изображений AI — это то, что они очень доступны. Все, что вам нужно, это подключение к Интернету, и вы можете выбирать из множества доступных бесплатных платформ.

Так что приступайте к работе и экспериментируйте с подсказками изображений ИИ, чтобы увидеть, что нового и интересного вы можете открыть для себя в развивающейся области создания изображений.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE