
Typedance превосходит Dall · E 3 и ControlNet в изучении удобства для дизайна логотипа
7 августа 2025 г.Таблица ссылок
Введение
Связанная работа
2.1 Семантический типографский дизайн логотипа
2.2 Генеративная модель для вычислительного дизайна
2.3 Инструмент создания графического дизайна
Формирующее исследование
3.1 Общий рабочий процесс и проблемы
3.2 Беспокойство в вовлечении генеративной модели
3.3 Пространство дизайна семантической типографической работы
Рассмотрение дизайна
Напечатано и 5.1 идея
5.2 Выбор
5.3 поколение
5.4 Оценка
5.5 итерация
Прохождение интерфейса и 6.1 стадия до поколения
6.2 Стадия генерации
6.3 Стадия после поколения
Оценка и 7.1 базовое сравнение
7.2 Изучение пользователя
7.3 Анализ результатов
7.4 Ограничение
Дискуссия
8.1 Персонализированный дизайн: сотрудничество с ИИ
8.2 Включение знаний о дизайне в инструменты поддержки творчества
8.3 Рабочий процесс ориентированного на микс-пользователь, ориентированный на инфекцию,
Заключение и ссылки
7 Оценка
Чтобы проверить эффективность типа, мы провели базовое сравнение и изучение пользователя. Наша основная цель состояла в том, чтобы оценить производительность сгенерированных результатов и удобство использования Typedance, а также изучить, как каждый компонент может потенциально учитывать болевые точки в своих рабочих процессах дизайна. Кроме того, мы углубились в ограничения инструмента и определили возможности для улучшения.
7.1 Базовое сравнение
Мы провели сравнение с семью альтернативными методами: Zhang et al. (M1) [61], обработка (M2) [48], слово как изображение (M3) [23], DS-Fusion (M4) [47], Dexit2image (M5) [34], ControlNet (M6) [63], Dalle 3 (M7) [5]. Для всесторонней оценки мы оценили эти методы как с технических, так и с точки зрения восприятия, как показано на рис. 6. Учитывая, что большинство работ не являются открытым исходным кодом, общее сравнение с использованием того же случая не было осуществимым. Вместо этого мы случайным образом отобрали три случая из каждого метода и использовали Typedance, чтобы воссоздать их с одним и тем же текстовым содержанием и изображениями, проводя сравнение один на один с каждым методом. Полные случаи перечислены в дополнительном материале. Исследование восприятия включало онлайн -анкету с участием 50 человек. Мы перетасовали последовательность внешнего вида
Все логотипы и не давали намеков на оригинальный шрифт или используемые изображения, а оценки были записаны по 5-балльной шкале Лайкерта.
7.1.1 Технология Разница.Художественная типография и лечение работают на основе поиска, который ограничивает их способность обобщать в случаях, значительно отличающиеся от собранных шаблонов. Напротив, другие методы применяют подход, основанный на поколении, предлагая некоторое облегчение этого ограничения. Тем не менее, большинство из них ограничиваются смешиванием на уровне букв, тогда как типиз превосходит, поддерживая смешивание во всех гранулярности шрифта. Что касается взаимодействия для указания изображений, большинство методов полагаются на текст, либо путем извлечения соответствующих шаблонов из корпуса, либо направления генеративной модели. Примечательно, что DS-Fusion и Typedance выделяются, поскольку они поддерживают использование изображений для назначения конкретных визуальных представлений. Стоит отметить, однако, что DS-Fusion требует, чтобы пользователи предоставили небольшой набор данных изображений около 20 изображений для точной настройки модели, процесс, который занимает приблизительно 1,5 часа, используя рабочий стол с NVIDIA GeForce RTX 3090.
7.1.2 Изучение восприятия.Мы использовали два первичных показателя для оценки эффективности этих методов: один сфокусирован на разборчивости шрифтов и изображений, а другой на эстетике. Как показано на рис. 6, Typedance превосходит другие методы как в оценке эстетики, так и в разборчивости изображений. Слово как изображение достигает наивысшей оценки в разборчивости шрифта, но его образы сравнительно сложны для распознавания. Точно так же многие методы демонстрируют этот дисбаланс, превосходящее в одном представлении, одновременно ставя под угрозу другое. Напротив, Typedance поддерживает стабильное представление с похвальным эстетическим признанием.
7.2 Изучение пользователя
7.2.1 Участники.Как дизайнеры, так и общие пользователи (11 женщин и 7 мужчин, в возрасте 19-34 лет) приглашаются для получения различной обратной связи. Девять участников (P1-P9) являются начинающими пользователями, заинтересованными в семантической типографической искусстве без формального дизайнерского обучения. Оставшиеся девять являются графическими дизайнерами (E1-E9) с профессиональным дизайнерским образованием с более чем трехлетним опытом работы в семантических типографских логотипах. Все участники пробовали инструменты ИИ, такие как Midjourney раньше. Они обратились к типам через веб -браузеры, используя комбинацию онлайн -режимов. В знак признательности каждый участник получил подарочную карту в размере 30 долларов США после завершения исследования.
7.2.2 Задачи и процедура.Результат вдохновения из процесса проектирования, изложенного Okada et al. [35], который содержит две основные этапы, а именно имитация и создание, мы соответственно создали две задачи, чтобы соответствовать естественным и прогрессивным задачам дизайна. Комплексная процедура описана следующим образом:
Авторы:
(1) Шиши Сяо, Гонконгский университет науки и технологии (Гуанчжоу), Китай;
(2) Лангвей Ван, Гонконгский университет науки и технологии (Гуанчжоу), Китай;
(3) Xiaojuan MA, Гонконгский университет науки и технологии, Китай;
(4) Вэй Зенг, Гонконгский университет науки и технологии (Гуанчжоу), Китай.
Эта статья есть
Оригинал