
Визуальная гармония в генеративных системах проектирования
7 августа 2025 г.Таблица ссылок
Введение
Связанная работа
2.1 Семантический типографский дизайн логотипа
2.2 Генеративная модель для вычислительного дизайна
2.3 Инструмент создания графического дизайна
Формирующее исследование
3.1 Общий рабочий процесс и проблемы
3.2 Беспокойство в вовлечении генеративной модели
3.3 Пространство дизайна семантической типографической работы
Рассмотрение дизайна
Напечатано и 5.1 идея
5.2 Выбор
5.3 поколение
5.4 Оценка
5.5 итерация
Прохождение интерфейса и 6.1 стадия до поколения
6.2 Стадия генерации
6.3 Стадия после поколения
Оценка и 7.1 базовое сравнение
7.2 Изучение пользователя
7.3 Анализ результатов
7.4 Ограничение
Дискуссия
8.1 Персонализированный дизайн: сотрудничество с ИИ
8.2 Включение знаний о дизайне в инструменты поддержки творчества
8.3 Рабочий процесс ориентированного на микс-пользователь, ориентированный на инфекцию,
Заключение и ссылки
7.3 Анализ результатов
7.3.1 Удовлетворение сгенерированного результата.Все участники обнаружили, что сгенерированный результат эффективно смешивает как информацию выбранного шрифта, так и изображений (𝑀𝐸𝐴𝑁 = 4,78, 𝑆𝐷 = 0,43), и большинство из них (𝑀𝐸𝐴𝑁 = 4,17, 𝑆𝐷 = 0,62) согласны с тем, что результат может достичь визуально -гармоничного эффекта. Кроме того, более половины участников (𝑀𝐸𝐴𝑁 = 4,06, 𝑆𝐷 = 0,73) признали, что сгенерированные результаты были разнообразными. Их обратная связь подтверждает, что Typedance способен достичь естественной смеси и обеспечить различные результаты, что соответствует второму дизайну (D2), определенным в Sect. 4
• Сохранение.Большинство участников (11/18) выразили, что сгенерированные результаты были«Помимо их ожидания»и "инновационный ».Они обнаружили, что Typedance способен получить разумные результаты, которые эффективно объединили как шрифт, так и изображения. Как упоминалось P3, «я изначально не видел никакой связи между лебедью и буквой« E », но результат показал, что они могут быть объединены таким образом, что визуально приятно (P3, рис. 7)».
• ГармонияПолем Участники (16/18) согласились с тем, что сгенерированные результаты демонстрировали эстетическую гармонию. Typedance успешно поддерживал разборчивость шрифта, улучшая визуальную привлекательность, включив изображения, которые «выровнялись со скелетом текста (P1, P4, рис. 7)».
• РазнообразиеПолем Более половины участников согласились с тем, что сгенерированные результаты были разнообразными (14/18). Некоторые участники (n = 4) подчеркнули важность получения альтернативных дизайнов на практике, прокомментировали, что«Хотя я достиг удовлетворительного результата, я все еще хочу регенерировать, чтобы увидеть более интересные результаты (P2, рис. 8; E7, рис. 9)».
С точки зрениясохранение, общие пользователи демонстрировали более низкую чувствительность, чем дизайнеры, распознавая шрифт и изображения. Напротив, дизайнеры могут быстро воспринимать контент и продемонстрировать тенденцию экспортировать потенциальные конструкции в передовые инструменты для дальнейшего улучшения сохранения. Несмотря на различные уровни опыта дизайна, как начинающие пользователи, так и дизайнеры продемонстрировали аналогичные оценки с точки зрениягармонияиразнообразиеиз сгенерированных результатов. Помимо гармонии восприятия, дизайнеры определили более художественные эффекты. Как прокомментировал E1,«Я никогда не думал, что ИИ может понять и производить негативное пространство (рис. 7)».В этом случае Typedance интегрировал собаку в шрифт, заполнив пустое пространство
в письмеЭн». В процессе создания все участники экспериментировали с различными комбинациями дизайнерских априоров для достижения более диверсифицированных результатов. Интересно, что цвет использовался чаще, чем форма, в то время как семантика была последовательно выбрана без указания текстовой подсказки.
7.3.2 Юзабелизацию системы.Пользовательский исследование показало, что большинство участников (𝑀𝐸𝐴𝑁 = 4,39, 𝑆𝐷 = 0,67) обнаружили типиз для поддержания целостности рабочего процесса в процессе проектирования. Кроме того, большинство (𝑀𝐸𝐴𝑁 = 4,33, 𝑆𝐷 = 0,77) выражало удовлетворение гибкостью смешивания различных гранулярности шрифтов и изображений. С точки зрения управляемости во время процесса генерации и редактируемости сгенерированного результата, более половины участников (n = 12) согласились с тем, что Typedance обеспечивает удовлетворительное управление и параметры редактируемости. Эти функции соответствуют конструктивным соображениям настройки и пост-редакции (D3 и D4), определенных в разд. 4
• Честность.Большинство участников (n = 10) полностью согласились, что полный рабочий процесс был создан в пределах Typedance. Участник подчеркнул,«Мне не нужно переключаться между разными платформами, чтобы закончить дизайн (E2, рис. 8)».
• ГибкостьПолем Половина участников (n = 9) полностью согласилась с гибкостью, предоставленной Typedance для персонализации своих дизайнов. Большинство участников (n = 15) экспериментировали с более чем двумя типами гранулярности шрифтов в своих конструкциях. E2 отметил,«Я могу легко выбрать один ход, который перекрывается с другими ударами в шрифте».
• УправляемостьПолем Более половины участников (n = 12) согласились с тем, что Typedance обеспечивает высокий уровень управляемости. Они обнаружили, что сгенерированные результаты смогли точно«Отражите выбранные образы»и«Придерживаться выбранной формы».
• РедактируемостьПолем Поступимость типданса была полностью согласована половиной участников (n = 8). Несколько участников (n = 3) выразили свое стремление к генеративному инструменту, который не только генерирует конструкции один раз, но также дает возможность вносить коррективы и исправлять результаты.
Все участники широко признали рабочий процессчестностьтипичного, с разными взглядами от дизайнеров и общих пользователей. Дизайнеры ценили его за интеграцию основных функциональных возможностей, которые обычно требуют переключения между различными платформами в традиционном рабочем процессе, в то время как общие пользователи хвалили Typedance за то, что они позволили им последовательно следовать компонентам в интерфейсе, чтобы закончить дизайн. Логотип требует высокой настройки со своей специальной собственностью
раскрывающей идентичности. Вариант выбора изображений с личных фотографий добавляет персонализированный прикосновение, превосходя ресурсы, доступные в общем сообществе. Как дизайнеры, так и новички подчеркнули способностьконтрольи нарисуйте вдохновение из реального мира с указанным визуальным представлением, цветом и формой. Эта функция особенно важна в некоторых сценариях,Например, «Проектирование городского логотипа».
Разрыв между гибкостью и редактируемостью демонстрирует различные ожидания от дизайнеров и общих пользователей. Общие пользователи продемонстрировали меньший интерес к экспериментам с различными гранулирующими средствами шрифта, преимущественно используя смешивание на уровне букв. Дизайнеры, с другой стороны, высоко оценили эту функцию, поскольку она позволяет им сегментировать различные части шрифта или даже объединяться по разным гранулированию. После получения сгенерированных результатов общие пользователи выражают удовлетворение изменением цвета или удаления элементов (P4 & P6, рис. 8). Дизайнеры находят восторг в функции уточнения, как заметки E5«Он имитирует реальный процесс проектирования, в котором изображения постепенно упрощаются или детали добавляются к шрифту (E5, рис. 9)». Они также выразили стремление к более продвинутым функциям редактирования, таким как кривые Безера, для тонких форм ».
7.3.3 Полезность отдельных функций.Участники также провели оценки для каждого компонента в системе типиз. Компоненты отбора и генерации получили единогласное соглашение от всех участников с высокими и сопоставимыми оценками. Когерентность между выбором шрифта и изображений и рассмотрением факторов проектирования, таких как подготовка проектных материалов, оказала прямое влияние на оценки компонентов выбора и генерации. E3 заявил,«Это экономит много времени для меня, чтобы выбрать желаемый шрифт и отрегулировать кривые Безера, чтобы создать фигуры, напоминающие определенные объекты, как собака».Они также оценили разнообразные результаты, предлагаемые системой, которые они нашли решающим для процесса проектирования (n = 3). Для предварительного поколения, с точки зрения идеи, более половины участников (n = 11) согласились с тем, что концепции, предоставленные на этапе до поколения«Полезно расширять воображение»н.д.«Объяснение имеет смысл для меня»Полем На стадии после поколения баллы для оценки и уточнения были сопоставимы из-за сплоченной природы операций. Некоторые участники (n = 4, включая E1, E3 и E4), выразили особое удовлетворение с этими двумя компонентами, так как Typedance достигает«Распознавание сходства между шрифтом и изображениями»и«Более мелкозернистая корректировка, которая не зависит от поколения»Полем Эти инструменты после поколения«Особенно подходит для семантического дизайна типографии»,сказал E1.
7.4 Ограничение
В ответ на проблемы, с которыми сталкиваются пользователи при использовании Typedance, мы определили основные ограничения текущей системы из трех измерений.
7.4.1 Проверьте и ошибку при выборе шрифта и изображений.Хотя текущий тип, позволяющий создателям гибко выбирать и смешивать, облегчая быстрое генерацию, обратная связь участников предполагает, что проб и ошибка с гетерогенным картированием между шрифтом и изображениями может продлить процесс создания. Например, E9 достиг окончательного дизайна после трех попыток, экспериментируя с различными гранулированием шрифтов, включая «Бия”, одинокий«эн" и "а", и "ею«Участники отметили, что, кроме того, что попробовать разные части шрифта на основе выбранных изображений, также было бы сложно найти подходящие изображения на основе выбранного шрифта».
7.4.2 Обмен между разнообразием образов и последовательности стиля результатов.На рис. 11 показано это ограничение, где использование одного и того же изображения для «Гонконга» дает стилистически согласованный результат, в то время как различные изображения приводит к заметному несоответствию. E1, заметил,«Эти элементы выглядят хорошо индивидуально, но в сочетании они кажутся несоответствующими».Это несоответствие возникает в результате передачи изображений и стиля из ссылок на изображение на сгенерированный результат, что приводит к различным стилям при использовании нескольких ссылок. Хотя добавление текстовой подсказки является частичным решением для облегчения этой проблемы, в нем отсутствует точный контроль. Включение нескольких воображений в одном шрифте является общим и значимым форматом для семантических типографских логотипов. Таким образом, достижение точного контроля над разнообразием изображений и последовательности стиля результатов остается важной областью для дальнейшего исследования.
Авторы:
(1) Шиши Сяо, Гонконгский университет науки и технологии (Гуанчжоу), Китай;
(2) Лангвей Ван, Гонконгский университет науки и технологии (Гуанчжоу), Китай;
(3) Xiaojuan MA, Гонконгский университет науки и технологии, Китай;
(4) Вэй Зенг, Гонконгский университет науки и технологии (Гуанчжоу), Китай.
Эта статья есть
Оригинал