Использование JoJoGAN для стилизации одноразовых фотографий
19 сентября 2023 г.Создание потрясающих, персонализированных и стилизованных лиц больше не является задачей опытных художников или графических дизайнеров. С помощью JoJoGAN теперь вы можете преобразовать любое лицо изображение в художественный шедевр одним нажатием кнопки. Это руководство создано, чтобы помочь вам понять функции и возможности JoJoGAN, а также то, как вы можете интегрировать их в свои приложения или творческие проекты.
В этом руководстве вы найдете информацию о вариантах использования JoJoGAN, деталях технической реализации и ограничениях. Мы также рассмотрим конкретные входные и выходные данные, необходимые для модели. И наконец, пошаговое руководство проведет вас через фактическое использование модели с помощью кода.
Случаи использования и целевая аудитория
JoJoGAN — это не просто инструмент для создания захватывающих изображений; это универсальный ресурс для:
* Художественные приложения. Художники могут с легкостью создавать уникальные и визуально привлекательные портреты. * Виртуальные аватары. Разработчики игр и виртуальной реальности могут создавать реалистичных виртуальных персонажей с широкими возможностями настройки. * Фильтры социальных сетей. Платформы социальных сетей могут интегрировать JoJoGAN, чтобы предлагать своим пользователям персонализированные эффекты для изображений профиля. * Реклама и маркетинг. Бренды могут стилизовать лица своих представителей в кампаниях для повышения визуального воздействия.
Гибкость и эффективность JoJoGAN делают его идеальным для художников, разработчиков программного обеспечения, платформ социальных сетей и маркетинговых агентств.
О ДжоДжогане
JoJoGAN – это модель глубокого обучения, предназначенная для однократной стилизации лица. Разработанный mchong6, он работает на основе генеративно-состязательной сети (GAN). Он принимает входное изображение лица человека и генерирует стилизованную версию на основе заданного эталонного изображения. Модель использует сочетание потери восприятия и потери идентичности для получения результатов, которые визуально привлекательны, оставаясь при этом верными личности человека. Более подробную информацию об этом можно найти на странице автора и страница сведений о модели.
Техническая реализация
Модель реализована с использованием графических процессоров Nvidia T4, ее среднее время выполнения составляет 14 секунд на один запуск, а стоимость каждого запуска составляет 0,0077 доллара США. С технической точки зрения модель впечатляет, поскольку она использует архитектуру GAN с сочетанием функций восприятия и потери идентичности. Эта уникальная комбинация гарантирует, что выходные изображения будут эстетически приятными и точными с точки зрения идентичности.
Ограничения
Хотя JoJoGAN предлагает множество возможностей, есть некоторые ограничения, о которых следует знать:
* Ограничено изображениями лиц. Модель специально разработана для стилизации лиц; он не подходит для изображений в полный рост или без лица. * Ограничения стиля: выходные данные ограничиваются стилем предоставленного эталонного изображения. * Ресурсоемкость: для оптимальной производительности требуется мощный графический процессор.
Понимание входных и выходных данных JoJoGAN
Прежде чем углубиться в руководство по использованию, давайте разберемся, что JoJoGAN требует в качестве входных данных и что он предоставляет в качестве выходных данных.
Входные данные
input_face
: файл, содержащий фотографию человеческого лица, которое вы хотите стилизовать.pretrained
: строковый идентификатор предварительно обученного стиля. Допустимые значения:art
,arcane_multi
,sketch_multi
и т. д.
От style_img_0
доstyle_img_3
: дополнительные изображения стиля лица. Они не используются, если установлен предварительно обученный стиль.preserve_color
: логическое значение, позволяющее решить, сохранять ли цвета исходного изображения.num_iter
: целое число, определяющее количество шагов тонкой настройки.
Результаты
- Модель выводит файл, содержащий стилизованное изображение лица.
Поняв это, давайте перейдем к пошаговому руководству.
Пошаговое руководство по использованию JoJoGAN
Если вы не хотите программировать, вы можете поиграться с демо JoJoGAN на Replication. Однако, если вы умеете программировать, это руководство расскажет вам, как взаимодействовать с JoJoGAN через API Replication.
Шаг 1. Установите зависимости
Сначала вам необходимо установить клиент Node.js для репликации.
npm install replicate
Шаг 2. Установите токен API
Скопируйте свой токен API и подтвердите его подлинность, установив его как переменную среды.
export REPLICATE_API_TOKEN=your_api_token_here
Шаг 3. Запустите модель
Для запуска модели используйте следующий код Node.js.
import Replicate from "replicate";
const replicate = new Replicate({
auth: process.env.REPLICATE_API_TOKEN,
});
const output = await replicate.run
Model("mchong6/jojogan", {
input_face: "path/to/your/input/image.jpg",
pretrained: "art",
});
const stylizedImage = output.files.stylized_face;
Шаг 4. Загрузите и просмотрите результаты
После завершения работы модели выходные данные будут сохранены в stylizedImage
. Вы можете просмотреть стилизованное лицо в этом объекте.
Заключение
JoJoGAN предлагает множество возможностей в области художественного редактирования и стилизации изображений. Варианты его использования выходят далеко за рамки мира искусства и включают практические приложения для разработчиков, маркетологов и платформ социальных сетей.
Дополнительная литература
Для тех, кто хочет глубже погрузиться в JoJoGAN, стилизацию изображений и смежные темы, вот тщательно подобранный список ресурсов, которые помогут вам лучше понять и применить:
* Репозиторий JoJoGAN GitHub: официальный репозиторий GitHub для JoJoGAN. Project предоставляет код, предварительно обученные модели и технические пояснения. Ценный ресурс для разработчиков, заинтересованных в более глубоком погружении. * Документ Яна Гудфеллоу о генеративно-состязательных сетях: В этом основополагающем документе представлены концепция генеративно-состязательных сетей (GAN). Эту книгу необходимо прочитать, чтобы понять основополагающие принципы, на которых строится JoJoGAN. * Специализация Coursera GAN: это Курс Coursera предлагает комплексное понимание GAN, от теории до практического применения. Подходит для тех, кто хочет применить GAN в различных областях. * Художественная стилизация в компьютерной графике ACM Paper : В этой научной статье подробно рассматриваются методы стилизации в компьютерной графике, важная концепция JoJoGAN и подобных моделей.
Используя эти ресурсы, вы сможете углубить свое понимание и практическое применение GAN, стилизации изображений и JoJoGAN. Независимо от того, являетесь ли вы разработчиком, основателем или энтузиастом искусственного интеллекта, эти ресурсы найдут что-то для каждого.
Также опубликовано здесь.
н
Оригинал