Стимпанк встречает ИИ: полное руководство по Arcane Diffusion

Стимпанк встречает ИИ: полное руководство по Arcane Diffusion

5 апреля 2023 г.

Руководство для начинающих по созданию потрясающих изображений с помощью искусственного интеллекта, вдохновленное телешоу «Arcane»

Вы когда-нибудь хотели создавать изображения, отражающие суть Arcane телешоу? Что ж, модель Arcane Diffusion здесь, чтобы воплотить ваши мечты в реальность.

В этом руководстве мы рассмотрим, как эта модель генерации изображений на основе искусственного интеллекта помогает создавать увлекательные визуальные эффекты в культовом стиле Arcane.

В настоящее время эта модель занимает 50-е место в Replicate Codex (базе данных популярных моделей ИИ) с более чем 98 000 запусков. .

Ever wonder what Harry Potter would look like in the world of Arcane? We’ll see how to use AI to produce images just like this one.

В этом руководстве мы узнаем, как использовать Node.js для взаимодействия с моделью через API Replicate и посмотрите, как использовать Replicate Codex, чтобы найти похожие модели и решить, какая из них нам нравится.

Мы также узнаем больше о том, как работает модель, какие входные и выходные данные она ожидает, и обсудим некоторые ее ограничения. Начнем.

О Аркане

Arcane – это анимационный приключенческий телесериал в стиле стимпанк для взрослых, созданный Кристианом Линке и Алексом Йи для Netflix.

Действие Arcane, созданного французской анимационной студией Fortiche под руководством Riot Games, происходит в вымышленной вселенной League of Legends и в основном сосредоточено на сестрах Ви и Джинкс.

Сериал, впервые выпущенный в ноябре 2021 года, получил огромное количество поклонников, что привело к созданию второго сезона.

О модели Arcane Diffusion

Модель Arcane Diffusion — это модель искусственного интеллекта, предназначенная для создания потрясающих изображений на основе текстовых подсказок. Эта модель, обученная на изображениях из телешоу Arcane, идеально подходит для фанатов, которые хотят создать свои собственные визуальные эффекты, вдохновленные Arcane.

Модель была создана tstramer. у которого есть масса других моделей из популярной культуры, таких как waifu-diffusion, elden -ring-diffusion и cyberpunk-anime- распространение.

Понимание входных и выходных данных модели Arcane Diffusion

Входные данные

Модель Arcane Diffusion использует несколько входных данных для создания изображений:

* prompt (string): Основная подсказка ввода, описывающая сцену, которую вы хотите создать. Например, "фотография астронавта верхом на лошади на Марсе".

* negative_prompt (string): Укажите, что вы не хотите видеть в выводе.

* width (integer): ширина выходного изображения. Максимальный размер – 1024 x 768 или 768 x 1024 из-за нехватки памяти.

* height (целое число): высота выходного изображения. Максимальный размер – 1024 x 768 или 768 x 1024 из-за нехватки памяти.

prompt_strength (число): сила запроса при использовании начального изображения. 1.0 соответствует полному уничтожению информации в исходном образе.

* num_outputs (integer): количество изображений для вывода.

* num_inference_steps (integer): количество шагов шумоподавления.

* guidance_scale (число): шкала для навигации без классификатора.

* scheduler (string): выберите планировщик с параметрами, включая DDIM, K_EULER, DPMSolverMultstep, K_EULER_ANCESTRAL, PNDM и KLMS.

* seed (integer): случайное начальное число. Оставьте поле пустым, чтобы рандомизировать начальное число.

Результаты

Вывод модели Arcane Diffusion — это массив URL-адресов изображений, сгенерированных в соответствии с предоставленными входными параметрами. Вот выходной формат:

{
  "type": "array",
  "items": {
    "type": "string",
    "format": "uri"
  },
  "title": "Output"
}

Пошаговое руководство по использованию модели Arcane Diffusion

Если вы не готовы к программированию, вы можете напрямую взаимодействовать с «демо» этой модели в Replicate через их пользовательский интерфейс. Воспользуйтесь этой ссылкой, чтобы взаимодействовать с интерфейсом и попробовать! Это отличный способ поиграть с параметрами модели и быстро получить обратную связь и подтверждение.

Если вы более техничны и хотите создать классный инструмент на основе этой модели, вы можете выполнить эти простые шаги для создания изображений, вдохновленных Arcane, с помощью модели Arcane Diffusion в Replicate.

Обязательно сначала создайте учетную запись Replicate! Для этого проекта вам понадобится ключ API.

Шаг 1. Установите клиент Replicate Node.js

Установите клиент Replicate Node.js, выполнив:

npm install replicate

Шаг 2. Настройте токен API

Скопируйте свой токен API и выполните аутентификацию, установив его в качестве переменной среды:

export REPLICATE_API_TOKEN=[token]

Шаг 3. Запустите модель

Запустите модель, используя следующий код:

import Replicate from "replicate";

const replicate = new Replicate({
  auth: process.env.REPLICATE_API_TOKEN,
});

const output = await replicate.run(
  "tstramer/arcane-diffusion:4cbb3f91f9ba049151efb8922fdecc6703d419ea682b87ff94c5876addabfb19",
   {
      input: {
         prompt: "a photo of an astronaut riding a horse on mars"
      }
   }
);

Вы также можете указать URL-адрес веб-перехватчика, который будет вызываться после завершения прогнозирования. Например:

const prediction = await replicate.predictions.create({
  version: "4cbb3f91f9ba049151efb8922fdecc6703d419ea682b87ff94c5876addabfb19",
  input: {
    prompt: "a photo of an astronaut riding a horse on mars, arcane style"
  },
  webhook: "https://example.com/your-webhook",
  webhook_events_filter: ["completed"]
});

Чтобы узнать больше, ознакомьтесь с документацией по библиотеке Node.js< /сильный>. Важное примечание! Чтобы получить наилучшие результаты, в конце запроса следует указать токен «мистический стиль». В противном случае модель не будет соответствовать предполагаемому художественному стилю.

В нашем примере мы можем передать текстовое приглашение: «волшебная принцесса с золотыми волосами, загадочный стиль», чтобы получить результат, похожий на изображение ниже.

Example Arcane Diffusion AI model output

Пример выходного файла с использованием примера подсказки.

Вот другие настройки, используемые для создания примера изображения — вы можете передать их все в модель как часть входного объекта JSON:

* ширина: 512 * высота: 512 * планировщик: K-LMS * num_outputs: 1 * guidance_scale: 7,5 * prompt_strength: 0,8 * num_inference_steps: 50

Дальше — поиск других моделей генерации изображений с помощью Replicate Codex

Replicate Codex – это фантастический ресурс для поиска моделей ИИ, отвечающих различным творческим потребностям, включая создание изображений, преобразование изображений в изображения и т. д.

Это полностью доступная для поиска, фильтруемая, тегированная база данных всех моделей в Replicate, позволяющая сравнивать модели, сортировать по цене или исследовать по создателю.

Это бесплатно, а также содержит сводку по электронной почте, которая уведомляет вас о выходе новых моделей, чтобы вы могли их опробовать.

Если вам интересно найти модели, похожие на Arcane Diffusion…

Шаг 1. Посетите Replicate Codex

Перейдите на страницу Replicate Codex, чтобы начать поиск похожих модели.

Шаг 2. Используйте панель поиска

Используйте панель поиска в верхней части страницы для поиска моделей по определенным ключевым словам, таким как "генерация изображения", "преобразование текста в изображение" или "аркан". Это покажет вам список моделей, связанных с вашим поисковым запросом. В данном случае я искал по «tstramer», который является создателем этой модели.

Шаг 3. Фильтрация или сортировка результатов

В левой части страницы результатов поиска вы найдете несколько фильтров, которые помогут вам сузить список моделей. Вы можете фильтровать и сортировать модели по типу (преобразование изображения в изображение, преобразование текста в изображение и т. д.), стоимости, популярности или даже по конкретным создателям.

Применяя эти фильтры, вы можете найти модели, которые наилучшим образом соответствуют вашим конкретным потребностям и предпочтениям. Например, если вы ищете модель создания изображений, которая является самой популярной или имеет лучшие отзывы, вы можете просто выполнить поиск, а затем отсортировать по соответствующему показателю.

Viewing additional models by the same creator on Replicate Codex

В моем случае я отсортировал результаты по пробегам — по убыванию, чтобы найти tstramer< /a> самые популярные модели. Если я заинтересован в создании более стилизованного искусства в стиле киберпанк пока работаю с похожей моделью от того же создателя, теперь могу!

Заключение

В этом руководстве мы рассмотрели модель Arcane Diffusion — решение на основе искусственного интеллекта для создания потрясающих изображений, вдохновленных популярным телешоу Arcane.

Мы предоставили пошаговое руководство по использованию модели для создания изображений и продемонстрировали различные входные параметры, которые можно настроить для достижения различных результатов.

Мы также обсудили, как использовать функции поиска и фильтрации в Replicate Codex, чтобы найти похожие модели и сравнить их результаты, что позволит нам расширить наши горизонты в мире создания изображений с помощью ИИ.

Я надеюсь, что это руководство вдохновило вас на изучение творческих возможностей ИИ и воплощение вашего воображения в жизнь. Спасибо за чтение и получайте удовольствие!

Подпишитесь или следите за мной на Twitter, чтобы найти больше подобного контента.


Оригинал