Typedance: генеративный инструмент для семантической типографии и творческого рабочего процесса

Typedance: генеративный инструмент для семантической типографии и творческого рабочего процесса

8 августа 2025 г.
  1. Введение

  2. Связанная работа

    2.1 Семантический типографский дизайн логотипа

    2.2 Генеративная модель для вычислительного дизайна

    2.3 Инструмент создания графического дизайна

  3. Формирующее исследование

    3.1 Общий рабочий процесс и проблемы

    3.2 Беспокойство в вовлечении генеративной модели

    3.3 Пространство дизайна семантической типографической работы

  4. Рассмотрение дизайна

  5. Напечатано и 5.1 идея

    5.2 Выбор

    5.3 поколение

    5.4 Оценка

    5.5 итерация

  6. Прохождение интерфейса и 6.1 стадия до поколения

    6.2 Стадия генерации

    6.3 Стадия после поколения

  7. Оценка и 7.1 базовое сравнение

    7.2 Изучение пользователя

    7.3 Анализ результатов

    7.4 Ограничение

  8. Дискуссия

    8.1 Персонализированный дизайн: сотрудничество с ИИ

    8.2 Включение знаний о дизайне в инструменты поддержки творчества

    8.3 Рабочий процесс ориентированного на микс-пользователь, ориентированный на инфекцию,

  9. Заключение и ссылки

8.3 Рабочий процесс ориентированного на микс-пользователь, ориентированный на инфекцию,

С целью разработки инструмента с «низким порогом» для новичков, чтобы управлять генерацией и «высоким потолком» для экспертов для достижения более продвинутых эффектов, Typedance объединяет моделируемый рабочий процесс дизайна. Инструменты поддержки креативности по своей природе предназначены для обеспечения комплексного опыта авторизации, обращаясь к общим и уникальным акцентам от различных пользователей [57, 58, 65]. Как показано на рисунке 10, эксперты и дизайнеры разделяют как сходные, так и различные предпочтения. Функции с общими предпочтениями, такими как выбор и генерация, могут считаться центральными для рабочего процесса и требуют более глубокого расследования. Примечательно, что существуют функции с различными предпочтениями, основанными на опыте. Эксперты, как правило, определять приоритеты в оценке и уточнении, тогда как новички могут рассматривать их как необязательные. Однако, с меньшим количеством опыта дизайна, новички считают идею полезными, чем эксперты. Функции с разными предпочтениями действуют как «широкая стена »,приспосабливание дополнительных требований пользователя. Хотя это и не обязательно, как центральные функции, опуская их, ставя под угрозу общую целостность рабочего процесса.

9 Заключение

Это исследование изготавливает знания дизайна из реальных примеров, суммирует обобщаемые шаблоны проектирования и моделируемый рабочий процесс дизайна и исследует создание семантических типографических логотипов путем смешивания шрифтов и изображений при сохранении разборчивости. Мы вводим Typedance, инструмент для авторизации, основанный на генеративной модели, которая поддерживает персонализированный рабочий процесс дизайна, включая идеи, выбор, генерацию, оценку и итерацию. С помощью Typedance создатели могут гибко выбирать шрифты на разных уровнях детализации и смешивать их с конкретными изображениями, используя комбинируемые коэффициенты проектирования. Typedance также позволяет пользователям регулировать сгенерированные результаты в соответствии с спектром моментов шрифтов и предлагает после редактирования отдельные элементы. Обратная связь от общих пользователей и экспертов подтверждает эффективность Typedance и предоставляет ценную информацию для будущих возможностей. Мы рады улучшить функциональность типиз для комплексного рабочего процесса и изучить новые методы и взаимодействия для повышения творчества человека.

Ссылки

[1] Салима Амерши, Дэн Уэлд, Михаэла Ворвореану, Адам Фурни, Бесмира Нуши, Пенни Коллиссон, Джина Су, Шамси Икбал, Пол Н. Беннетт, Кори Инкпен и др. 2019. Руководящие принципы для взаимодействия с человеком с АИ. В материалах CHI Conference 2019 по человеческим факторам в вычислительных системах. 1–13.

[2] Apple. 2021. Руководство по интерфейсу человека. https://developer.apple.com/design/human-interface-guidelines/, последний доступ к 2023-12-13.

[3] Грегори Эшворт и Михалис Каваратцис. 2009. Помимо логотипа: управление брендом для городов. Журнал управления брендом 16 (2009), 520–531.

[4] Даниэль Берио, Фредерик Фол Леймари, Пол Асенте и Хосе Эчеваррия. 2022. Строкстайл: сегментация на основе инсульта и стилизация шрифтов. Транзакции ACM на графике 41, 3, статья 28 (2022), 21 страница.

[5] Джеймс Беткер, Габриэль Го, Ли Цзин, Тим Брукс, Цзянфенг Ванг, Линджи Ли, Лонг Оян, Хунтанг Чжуан, Джойс Ли, Юфэй Го и др. 2023. Улучшение генерации изображений с лучшими подписями. Информатика. https: // cdn. Openai. com/papers/dall-e-3. PDF (2023).

[6] Иин Цао, Джейн Л. Е., Чжутин Чен и Хайджун Ся. 2023. DataParticles: на основе блоков и языковой, ориентированной на анимированные визуализации единиц. В материалах конференции Чи 2023 года по человеческим факторам в вычислительных системах. 1–15.

[7] Терри Л Чилдерс и Джеффри Джасс. 2002. Все одеты с чем -то, что можно сказать: влияние семантических ассоциаций шрифтов на восприятие бренда и память потребителей. Журнал потребительской психологии 12, 2 (2002), 93–106.

[8] Лидия Б. Чилтон, Экеназ Джен Озмен, Сэм Х Росс и Вивиан Лю. 2021. Visifit: структурирование итерационного улучшения для начинающих дизайнеров. В материалах конференции Чи по человеческим факторам в вычислительных системах. Ассоциация вычислительной техники, 1–14.

[9] Лидия Б. Чилтон, Саввас Петридис и Манеш Агралала. 2019. Visiblends: гибкий рабочий процесс для визуальных смесей. В материалах конференции Чи по человеческим факторам в вычислительных системах. Ассоциация вычислительной техники, 1–14.

[10] Джон Джун Янг Чунг и Эйтан Адар. 2023. romptypaint: рулевое управление генерацией текста к изображению через средние взаимодействия. В материалах 36 -го годового симпозиума ACM по программному обеспечению и технологии пользовательского интерфейса. 1–17.

[11] Джон Джун Янг Чунг, Воосок Ким, Кан Мин Ю, Хваран Ли, Эйтан Адар и Минсук Чанг. 2022. Talebrush: наброски историй с генеративными предварительно проведенными языковыми моделями. В материалах конференции Чи 2022 года по человеческим факторам в вычислительных системах. 1–19.

[12] Weiwei Cui, Xiaoyu Zhang, Yun Wang, He Huang, Bei Chen, Lei Fang, Haidong Zhang, Jian-Guan Lou и Dongmei Zhang. 2019. Текст-квизой: автоматическая генерация инфографики из операций с естественным языком, связанными с пропорциями. Транзакции IEEE по визуализации и компьютерной графике 26, 1 (2019), 906–916.

[13] Жоао М. Кунха, Нуно Луренсо, Педро Мартинс и пенис Мачадо. 2020. Визуальное смешивание для представления концепции: тематическое исследование по генерации смайликов. Новое поколение Computing 38, 4 (2020), 739–771.

[14] Лаура Девендорф и Кимико Риокай. 2013. Anytype: провоцирование размышлений и исследования с эстетическим взаимодействием. В материалах конференции Сигчи по человеческим факторам в вычислительных системах. 1041–1050.

[15] Райан Дью, Асим Ансари и Оливье Тубия. 2022. Позволяет логотипам говорить: использование многовидного представления обучения для брендинга, управляемого данными и дизайна логотипа. Маркетинговая наука 41, 2 (2022), 401–425.

[16] Эвелин Фикс и Джозеф Лоусон Ходжес. 1989. Дискриминационный анализ. Непараметрическая дискриминация: свойства согласованности. Международный статистический обзор/Revue Internationale de Statistique 57, 3 (1989), 238–247.

[17] Ринон Гал, Юваль Алалуф, Юваль Азмон или Паташник, Амит Х. Бермано, Гал Чечик и Даниэль Коэн-или. 2022. Изображение стоит одного слова: персонализация генерации текста к изображению с использованием текстовой инверсии. Arxiv: 2208.01618

[18] Ринон Гал, или Паташник, Хаггай Марон, Амит Хермано, Гал Чехик и Даниэль Коэн-Ор. 2022. Стильган-Нада: Адаптация домена с клиентом. Адаптация генераторов изображений. Транзакции ACM на графике 41, 4, статья 141 (2022), 13 страниц.

[19] Google. 2019. People + Guidebook. https://pair.withgoogle.com/, последний доступ к 2023-12-13.

[20] Памела В. Хендерсон и Джозеф А. Кот. 1998. Руководство по выбору или изменению логотипов. Журнал маркетинга 62, 2 (1998), 14–30.

[21] Вы потеряете Германто. 2023. Семантическая интерпретация в экспериментальной типографической создании. Kne Social Sciences 8, 15 (2023), 252–257.

[22] Кай-Вэнь Сяо, Юн-Лян Ян, Юнг-Чих Чиу, Мин-Чун Ху, Чи-Юань Яо и Хун-Куо Чу. 2023. Img2logo: генерирование логотипов золотого соотношения из изображений. В компьютерном графическом форуме, вып. 42. Wiley Online Library, 37–49.

[23] Шир Илуз, Яэль Винкер, Амир Херц, Даниэль Берио, Даниэль Коэн-Ор и Ариэль Шамир. 2023. Слово-изображение для семантической типографии. Транзакции ACM на графике 42, 4, статья 151 (2023), 11 страниц.

[24] Youwen Kang, Zhida Sun, Sitong Wang, Zeyu Huang, Ziming Wu и Xiaojuan Ma. 2021. Metamap: поддержка идеи визуальной метафоры посредством многомерного исследования на основе примеров. В материалах конференции Чи по человеческим факторам в вычислительных системах. Ассоциация вычислительной техники, статья 427, 15 страниц.

[25] Александр Кириллов, Эрик Минтун, Нихила Рави, Ханзи Мао, Хлоя Ролланд, Лора Густафсон, Тет Сяо, Спенсер Уайтхед, Александр С. Берг, Ван-Йен Ло, Пиот-Доллр и Росс Гиршик. 2023. Сегмент что угодно. Arxiv: 2304.02643

[26] Джанин Кох, Андрес Лусеро, Лена Хегеманн и Анти Уласвирта. 2019. МОЖЕТ ИИ? Дизайн идеи с кооперативными контекстуальными бандитами. В материалах конференции Чи по человеческим факторам в вычислительных системах. Ассоциация вычислительной техники, 1–12.

[27] Юки Кояма, Дайсуке Сакамото и Такео Игараши. 2014. Анализ параметров толпы для исследования визуального дизайна. В материалах 27 -го ежегодного симпозиума ACM по программному обеспечению и технологии пользовательского интерфейса. 65–74.

[28] Jieun Lee, Eunju Ko и Carol M Megehee. 2015. Социальные преимущества логотипов брендов в представлении «Самоуров» и того же гендерного влияния. Журнал бизнес -исследований 68, 6 (2015), 1341–1349.

[29] Junnan Li, Dongxu Li, Caiming Xiong и Steven Hoi. 2022. Blip: начальная загрузка языкового изображения перед тренировкой для объединенного понимания и поколения на языке зрения. В материалах Международной конференции по машинному обучению, вып. 162. PMLR, 12888–12900.

[30] Yi-Na Li, Kang Zhang и Dong-Jin Li. 2017. Автоматическая генерация логотипов на основе правил. Леонардо 50, 2 (2017), 177–181.

[31] Джорджия Лупи и Стефани Посавек. 2018. Соблюдайте, собирайте, нарисуйте!: Визуальный журнал: Откройте для себя шаблоны в своей повседневной жизни. Принстонская архитектурная пресса.

[32] О Матаев и Х Матаев. 2006. Галерея Ольги. Джузеппе Армиболдо. [33] Марк Мейер, Алан Барр, Хайонг Ли и Матье Десбрун. 2002. Генерализованные барицентрические координаты на нерегулярных многоугольниках. Журнал графических инструментов 1 (2002), 13–22.

[34] Чонг Моу, Ксинтао Ван, Лянбин Си, Цзянь Чжан, Чжунганг Ци, Ю -Шан и Сяоху Ци. 2023. T2I-Adapter: Обучающие адаптеры для выкола более контролируемой способности для диффузионных моделей текста до изображения. Arxiv: 2302.08453

[35] Такеши Окада и Кентаро Исибаши. 2017. Имитация, вдохновение и творение: когнитивный процесс творческого рисунка, копируя другие произведения искусства. Когнитивная наука 41, 7 (2017), 1804–1837.

[36] Long Ouyang, Jeffrey Wu, Xu Jiang, Diogo Almeida, Carroll Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, et al. 2022. Достижения в системах обработки нейронной информации 35 (2022), 27730–27744.

[37] Хелен Петри, Фрейзер Гамильтон и Нил Кинг. 2004. Натяжение, какое напряжение? Доступность веб -сайта и визуальный дизайн. В материалах международного междисциплинарного семинара по доступности веб-сайта, Vol. 63.

[38] Huy Quoc Phan, Hongbo Fu и Antoni B Chan. 2015. FlexyFont: Правила передачи обучения для гибкого синтеза шрифтов. В компьютерном графическом форуме, вып. 34. Wiley Online Library, 245–256.

[39] Алек Рэдфорд, Чон Вук Ким, Крис Халласи, Адитья Рамеш, Габриэль Го, Сандхини Агарвал, Гириш Састри, Аманда Аскалл, Памела Мишкин, Джек Кларк и др. 2021. В материалах Международной конференции по машинному обучению, вып. 139. PMLR, 8748–8763.

[40] Адитья Рамеш, Прафулла Дхаривал, Алекс Никол, Кейси Чу и Марк Чен. 2022. Иерархическое создание текстовых кондиционированных изображений с задержками клипа. Arxiv: 2204.06125

[41] Адитья Рамеш, Михаил Павлов, Габриэль Го, Скотт Грей, Челси Восс, Алек Рэдфорд, Марк Чен и Илья Сатскевер. 2021. НЕОБРАЖЕНИЕ ТЕКСТРАТИВНОГО ДОСТАВКА. В материалах Международной конференции по машинному обучению, вып. 139. PMLR, 8821–8831.

[42] Робин Ромбач, Андреас Блаттманн, Доминик Лоренц, Патрик Эссер и Бьорн Оммер. 2022. Синтез изображения высокого разрешения с скрытыми диффузионными моделями. В материалах конференции IEEE/CVF по компьютерному зрению и распознаванию шаблонов. IEEE, 10684–10695.

[43] Субхадип Рой и Реха Атри. 2022. Physimorphic и типографический логотипы в маркетинге назначения: интеграция знакомства с пунктом назначения и характеристик потребителей. Управление туризмом 92 (2022), 104544.

[44] Пэтсорн Санклой, Виттават Джиткритм, Дийи Ян и Джеймс Хейс. 2022. Эскиз стоит тысячи слов: поиск изображения с текстом и эскизом. В материалах Европейской конференции по компьютерному видению. Springer, 251–267.

[45] Ян Ши, Пей Лю, Сиджи Чен, Менгди Сан и Нан Цао. 2022. Поддержка выразительного и верного дизайна изобразительной визуализации с переносом визуального стиля. IEEE транзакции по визуализации и компьютерной графике 29, 1 (2022), 236–246.

[46] Бен Шнайдерман. 2007. Инструменты поддержки творчества: ускорение открытия и инноваций. Общение ACM 50, 12 (2007), 20–32.

[47] Махам Танвир, Йижи Ван, Али Махдави-Амири и Хао Чжан. 2023. DS-Fusion: художественная типография посредством дискриминационной и стилизованной диффузии. В материалах Международной конференции по компьютерному видению. IEEE.

[48] Пурва Тендулкар, Калпеш Кришна, Рампрасаат Р. Сельвараджу и Деви Парих. 2019. Трюк или угощение: тематическое подкрепление для художественной типографии. Arxiv: 1903.07820

[49] Дмитрий фон Рютт, Элизабетта Феделе, Джонатан Томм и Лукас Вольф. 2023. Ткань: персонализирующие диффузионные модели с итеративной обратной связью. Arxiv: 2307.10159

[50] Йижи Ван, Юэ Гао и Чжухуи Лиан. 2020. ATTRIBUTE2FONT: Создание шрифтов, которые вы хотите из атрибутов. Транзакции ACM на графике 39, 4, статья 69 (2020), 15 страниц. [

51] Юн Ван, Чжитао Хоу, Лейксиан Шен, Тонгшуанг Ву, Цзяки Ван, Хуанг, Хайдонг Чжан и Дунмей Чжан. 2022. На пути к авторизации визуализации на основе естественного языка. Транзакции IEEE по визуализации и компьютерной графике 29, 1 (2022), 1222–1232.

[52] Йижи Ван, Го Пу, Венхан Луо, Йексин Ван, Пенгфей Сионг, Хонгвен Кан и Чжухуи Лиан. 2022. Эстетический текстовый синтез логотипа через вывод с контентом. В материалах конференции IEEE/CVF по компьютерному зрению и распознаванию шаблонов. IEEE, 2436–2445.

[53] Джейсон Вей, Сюежи Ван, Дейл Шуурманс, Мартен Босма, Фей Ся, Эд Чи, Кук В. Лей, Денни Чжоу и др. 2022. Появление цепочки мыслей вызывает рассуждения в моделях крупных языков. Достижения в системах обработки нейронной информации 35 (2022), 24824–24837.

[54] Шиши Сяо, Суйзи Хуанг, Юэ Лин, Йилин Йе и Вэй Цзэн. 2023. Пусть диаграмма Spark: внедрить семантический контекст в диаграмму с генеративной моделью текста до изображения. Arxiv: 2304.14630

[55] Цзе Сюй и Крейг С. Каплан. 2007. Каллиграфическая упаковка. В материалах графического интерфейса. Ассоциация вычислительной техники, 43–50.

[56] Xiaotong Xu, Rosaleen Xiong, Boyang Wang, David Min и Steven P Dow. 2021. IdeaTerelate: галерея примеров, которая помогает создателям исследовать идеи по отношению к их собственным. Материалы ACM по взаимодействию человека с компьютером 5, CSCW2, статья 352 (2021), 18 страниц.

[57] Чуан Ян, Джон Джун Янг Чунг, Юн Кихон, Йотам Гингольд, Эйтан Адар и Сунсу Рэй Хонг. 2022. Flatmagic: улучшение раскраски плоской, управляемой искусственным интеллектом для дизайна для цифровых комиксов. В материалах конференции Чи 2022 года по человеческим факторам в вычислительных системах. 1–17.

[58] Зихан Ян, Чанксу Ян, Цихао Лян и Сянтони Чен. 2023. Xcreation: инструмент поддержки Crossmodal Generative Crowntial Protectial на основе графиков. В материалах 36 -го годового симпозиума ACM по программному обеспечению и технологии пользовательского интерфейса. 1–15.

[59] Шуай Ян, Цзяинг Лю, Чжухуи Лиан и Зонминг Го. 2017. Потрясающая типография: статистическая передача текстовых эффектов на основе статистики. В материалах конференции IEEE/CVF по компьютерному зрению и распознаванию шаблонов. IEEE, 7464–7473.

[60] Enhao Zhang и Nikola Banovic. 2021. Метод изучения генеративных состязательных сетей (GANS) через автоматически сгенерированные галереи изображений. В материалах конференции Чи 2021 года по человеческим факторам в вычислительных системах. 1–15.

[61] Джунсонг Чжан, Ю Ван, Вейи Сяо и Чженшан Луо. 2017. Синтезирование декоративных шрифтов. В компьютерном графическом форуме, вып. 36. Wiley Online Library, 64–75.

[62] Цзяйи Эрис Чжан, Николь Султанум, Анастасия Безезеанос и Фанни Шевалье. 2020. DataQuilt: извлечение визуальных элементов из изображений в изобразительные визуализации ремесленника. В материалах конференции Чи по человеческим факторам в вычислительных системах. Ассоциация вычислительной техники, 1–13.

[63] Lvmin Zhang и Maneesh Agrawala. 2023. Добавление условного управления в диффузионные модели текста до изображения. Arxiv: 2302.05543

[64] Нанксуан Чжао, Нам Вук Ким, Лора Мария Херман, Ханспетр Пфистер, Ринсон В.С. Лау, Хосе Эчеваррия и Зоя Билинский. 2020. ICONATE: Автоматическое создание составных значков и идеи. В материалах конференции Чи по человеческим факторам в вычислительных системах. Ассоциация вычислительной техники, 1–13.

[65] Тонгю Чжоу, Конни Лю, Джошуа Конг Ян и Джефф Хуанг. 2023. Отфильтрован. Чернила: Создание динамических иллюстраций с помощью фильтров SVG. В материалах конференции Чи 2023 года по человеческим факторам в вычислительных системах. 1–15.

[66] Чанцинг Зу, Джунджи Цао, Варуника Ранавера, Ибрагим Алхашим, Пинг Тан, Алла Шеффер и Хао Чжан. 2016. Разработанные компактные каллиграммы. Транзакции ACM на графике 35, 4, статья 122 (2016), 12 страниц.

Авторы:

(1) Шиши Сяо, Гонконгский университет науки и технологии (Гуанчжоу), Китай;

(2) Лангвей Ван, Гонконгский университет науки и технологии (Гуанчжоу), Китай;

(3) Xiaojuan MA, Гонконгский университет науки и технологии, Китай;

(4) Вэй Зенг, Гонконгский университет науки и технологии (Гуанчжоу), Китай.


Эта статья естьДоступно на ArxivПод атрибуцией-некоммерческими показателями 4.0 Международная лицензия.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE