Типография стала умнее (и намного более выразительна)
7 августа 2025 г.Таблица ссылок
Введение
Связанная работа
2.1 Семантический типографский дизайн логотипа
2.2 Генеративная модель для вычислительного дизайна
2.3 Инструмент создания графического дизайна
Формирующее исследование
3.1 Общий рабочий процесс и проблемы
3.2 Беспокойство в вовлечении генеративной модели
3.3 Пространство дизайна семантической типографической работы
Рассмотрение дизайна
Напечатано и 5.1 идея
5.2 Выбор
5.3 поколение
5.4 Оценка
5.5 итерация
Прохождение интерфейса и 6.1 стадия до поколения
6.2 Стадия генерации
6.3 Стадия после поколения
Оценка и 7.1 базовое сравнение
7.2 Изучение пользователя
7.3 Анализ результатов
7.4 Ограничение
Дискуссия
8.1 Персонализированный дизайн: сотрудничество с ИИ
8.2 Включение знаний о дизайне в инструменты поддержки творчества
8.3 Рабочий процесс ориентированного на микс-пользователь, ориентированный на инфекцию,
Заключение и ссылки
5.4 Оценка
После того, как дизайн генерируется, оценка соответствия дизайна признанным принципам визуального дизайна имеет решающее значение для его завершения [9, 37]. Семантические типографские логотипы требуют баланса между читаемости шрифта и выразительностью изображений, что представляет сложный компромисс. Дизайнеры часто полагаются на отзывы участников, чтобы подтвердить свои проекты. Typdance предлагает мгновенную оценку, управляемую данными, перед сбором реакций участников.
Чтобы помочь пользователям в определении позиции их текущей работы по типовому-эмантическому спектру, Typedance использует предварительно обученную модель клипа [39], которая предоставляет объективное суждение, поддерживаемое данными. Отстаивая знания из обширного набора данных из 400 миллионов пар с изображением модели клипа, типеданс может количественно оценить сходство между шрифтом и изображениями в масштабе в диапазоне от [0, 1], причем сумма, равная 1. Для улучшения интуитивного понимания тип, переводит нейтральные точки от 0,5 до 0 и нормализует расстояние между нейтральными и нейтральными. результат. Значение 0 означает нейтралитет, указывая на то, что сгенерированный результат способствует как шрифт, так и изображения. И наоборот, более высокие значения указывают на большую степень дивергенции в отношении шрифта или изображений, в зависимости от конкретного направления.
5.5 итерация
Хотя итерация на протяжении всего процесса, мы определили три основных моделя итерации.
5.5.1 Регенерация для нового дизайна.Предыдущие инструменты часто позволяют создателям удалять неудовлетворительные результаты, но лишь немногие стремятся улучшить регенерированную производительность, чтобы удовлетворить намерения создателей. Чтобы решить эту проблему, Typedance использует как неявную, так и явную обратную связь человека, чтобы вывести пользовательские предпочтения. Вдохновленный Fabric [49], мы используем реакцию пользователей на сгенерированные результаты в качестве подсказки на предпочтения пользователя. Анализируя положительную обратную связь от сохранившихся результатов и отрицательной обратной связи от удалений, генеративная модель в типинсе динамически регулирует веса в слое самопристывания. Это итеративное включение обратной связи человека позволяет уточнить генеративную модель с течением времени. Кроме того, Typedance предоставляет пользователям более явные способы внесения корректировок, включая текстовую подсказку и слайдер, который позволяет пользователям контролировать баланс между шрифтом и изображениями.
5.5.2 Уточнение в спектре типов.Typedance обеспечивает утонченный подход к итеративному уточнению их конструкций вдоль спектра типовой эмбийты. В дополнение к количественной метрике, идентифицированной в компоненте оценки, Typedance позволяет создателям вносить точные корректировки с использованием того же слайдера. Как показано на рис. 5 (c), мы делим расстояние между нейтральной точкой и шрифтом и изображениями на 20 равных интервалов, каждый представляет 0,05. Эти небольшие интерполяции сохраняют общую структуру и обеспечивают дополнительные корректировки. Перетаскивая слайдер, создатели могут установить желаемую точку значения между шрифтом и изображениями, достигая сбалансированной эстетики.
В частности, для расстановки приоритетов изображений мы начинаем с текущей конструкции в качестве начального изображения и внедряют его в диффузионную модель с установлением силы в нужную точку значения. Этот процесс продвигает сгенерированное изображение к концу изображений, что приводит к более семантически богатому дизайну. И наоборот, чтобы подчеркнуть шрифт, мы используем карту значимости шрифта в пиксельном пространстве, чтобы отфильтровать соответствующие области изображения. Это модифицированное изображение подается в генеративную модель, чтобы обеспечить плавный переход к концу шрифта.
5.5.3 Редактируемость для элементов в окончательном дизайне.Для внесения нюансированных изменений требуется более мелкозернистая корректировка, например, удаление элемента в сгенерированном результате. Чтобы достичь этого уровня редактируемости, мы преобразуем изображение из Pixel в векторное пространство. Следовательно, создатели получают способность манипулировать каждым отдельным элементом в своей конструкции, позволяя им удалять, масштабировать, вращать и менять цвета по мере необходимости.
Авторы:
(1) Шиши Сяо, Гонконгский университет науки и технологии (Гуанчжоу), Китай;
(2) Лангвей Ван, Гонконгский университет науки и технологии (Гуанчжоу), Китай;
(3) Xiaojuan MA, Гонконгский университет науки и технологии, Китай;
(4) Вэй Зенг, Гонконгский университет науки и технологии (Гуанчжоу), Китай.
Эта статья есть
Оригинал