Использование JoJoGAN для стилизации одноразовых фотографий

Использование JoJoGAN для стилизации одноразовых фотографий

19 сентября 2023 г.

Создание потрясающих, персонализированных и стилизованных лиц больше не является задачей опытных художников или графических дизайнеров. С помощью JoJoGAN теперь вы можете преобразовать любое лицо изображение в художественный шедевр одним нажатием кнопки. Это руководство создано, чтобы помочь вам понять функции и возможности JoJoGAN, а также то, как вы можете интегрировать их в свои приложения или творческие проекты.

В этом руководстве вы найдете информацию о вариантах использования JoJoGAN, деталях технической реализации и ограничениях. Мы также рассмотрим конкретные входные и выходные данные, необходимые для модели. И наконец, пошаговое руководство проведет вас через фактическое использование модели с помощью кода.

Случаи использования и целевая аудитория

JoJoGAN — это не просто инструмент для создания захватывающих изображений; это универсальный ресурс для:

* Художественные приложения. Художники могут с легкостью создавать уникальные и визуально привлекательные портреты. * Виртуальные аватары. Разработчики игр и виртуальной реальности могут создавать реалистичных виртуальных персонажей с широкими возможностями настройки. * Фильтры социальных сетей. Платформы социальных сетей могут интегрировать JoJoGAN, чтобы предлагать своим пользователям персонализированные эффекты для изображений профиля. * Реклама и маркетинг. Бренды могут стилизовать лица своих представителей в кампаниях для повышения визуального воздействия.

Гибкость и эффективность JoJoGAN делают его идеальным для художников, разработчиков программного обеспечения, платформ социальных сетей и маркетинговых агентств.

О ДжоДжогане

JoJoGAN – это модель глубокого обучения, предназначенная для однократной стилизации лица. Разработанный mchong6, он работает на основе генеративно-состязательной сети (GAN). Он принимает входное изображение лица человека и генерирует стилизованную версию на основе заданного эталонного изображения. Модель использует сочетание потери восприятия и потери идентичности для получения результатов, которые визуально привлекательны, оставаясь при этом верными личности человека. Более подробную информацию об этом можно найти на странице автора и страница сведений о модели.

Техническая реализация

Модель реализована с использованием графических процессоров Nvidia T4, ее среднее время выполнения составляет 14 секунд на один запуск, а стоимость каждого запуска составляет 0,0077 доллара США. С технической точки зрения модель впечатляет, поскольку она использует архитектуру GAN с сочетанием функций восприятия и потери идентичности. Эта уникальная комбинация гарантирует, что выходные изображения будут эстетически приятными и точными с точки зрения идентичности.

Ограничения

Хотя JoJoGAN предлагает множество возможностей, есть некоторые ограничения, о которых следует знать:

* Ограничено изображениями лиц. Модель специально разработана для стилизации лиц; он не подходит для изображений в полный рост или без лица. * Ограничения стиля: выходные данные ограничиваются стилем предоставленного эталонного изображения. * Ресурсоемкость: для оптимальной производительности требуется мощный графический процессор.

Понимание входных и выходных данных JoJoGAN

Прежде чем углубиться в руководство по использованию, давайте разберемся, что JoJoGAN требует в качестве входных данных и что он предоставляет в качестве выходных данных.

Входные данные

  • input_face: файл, содержащий фотографию человеческого лица, которое вы хотите стилизовать.
  • pretrained: строковый идентификатор предварительно обученного стиля. Допустимые значения: art, arcane_multi, sketch_multi и т. д.
  • От
  • style_img_0 до style_img_3: дополнительные изображения стиля лица. Они не используются, если установлен предварительно обученный стиль.
  • preserve_color: логическое значение, позволяющее решить, сохранять ли цвета исходного изображения.
  • num_iter: целое число, определяющее количество шагов тонкой настройки.

Результаты

  • Модель выводит файл, содержащий стилизованное изображение лица.

Поняв это, давайте перейдем к пошаговому руководству.

Пошаговое руководство по использованию JoJoGAN

Если вы не хотите программировать, вы можете поиграться с демо JoJoGAN на Replication. Однако, если вы умеете программировать, это руководство расскажет вам, как взаимодействовать с JoJoGAN через API Replication.

Шаг 1. Установите зависимости

Сначала вам необходимо установить клиент Node.js для репликации.

npm install replicate

Шаг 2. Установите токен API

Скопируйте свой токен API и подтвердите его подлинность, установив его как переменную среды.

export REPLICATE_API_TOKEN=your_api_token_here

Шаг 3. Запустите модель

Для запуска модели используйте следующий код Node.js.

import Replicate from "replicate";

const replicate = new Replicate({
  auth: process.env.REPLICATE_API_TOKEN,
});

const output = await replicate.run

Model("mchong6/jojogan", {
  input_face: "path/to/your/input/image.jpg",
  pretrained: "art",
});

const stylizedImage = output.files.stylized_face;

Шаг 4. Загрузите и просмотрите результаты

После завершения работы модели выходные данные будут сохранены в stylizedImage. Вы можете просмотреть стилизованное лицо в этом объекте.

Заключение

JoJoGAN предлагает множество возможностей в области художественного редактирования и стилизации изображений. Варианты его использования выходят далеко за рамки мира искусства и включают практические приложения для разработчиков, маркетологов и платформ социальных сетей.

Дополнительная литература

Для тех, кто хочет глубже погрузиться в JoJoGAN, стилизацию изображений и смежные темы, вот тщательно подобранный список ресурсов, которые помогут вам лучше понять и применить:

* Репозиторий JoJoGAN GitHub: официальный репозиторий GitHub для JoJoGAN. Project предоставляет код, предварительно обученные модели и технические пояснения. Ценный ресурс для разработчиков, заинтересованных в более глубоком погружении. * Документ Яна Гудфеллоу о генеративно-состязательных сетях: В этом основополагающем документе представлены концепция генеративно-состязательных сетей (GAN). Эту книгу необходимо прочитать, чтобы понять основополагающие принципы, на которых строится JoJoGAN. * Специализация Coursera GAN: это Курс Coursera предлагает комплексное понимание GAN, от теории до практического применения. Подходит для тех, кто хочет применить GAN в различных областях. * Художественная стилизация в компьютерной графике ACM Paper : В этой научной статье подробно рассматриваются методы стилизации в компьютерной графике, важная концепция JoJoGAN и подобных моделей.

Используя эти ресурсы, вы сможете углубить свое понимание и практическое применение GAN, стилизации изображений и JoJoGAN. Независимо от того, являетесь ли вы разработчиком, основателем или энтузиастом искусственного интеллекта, эти ресурсы найдут что-то для каждого.


Также опубликовано здесь.

н


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE