Может ли AI оживить логотипы лучше, чем человек?

Может ли AI оживить логотипы лучше, чем человек?

17 июня 2025 г.

Аннотация и 1 введение

2 Связанная работа

2.1 Синтез программы

2.2 Инструменты поддержки творчества для анимации

2.3 Денежные инструменты для проектирования

3 Формирующие шаги

4 Система логовой и 4.1 вход

4.2 Предварительная визуальная информация

4.3 Визуально обоснованный синтез кода

5 Оценки

5.1 Оценка: ремонт программы

5.2 Методология

5.3 Выводы

6 Оценка с новичками

7 Обсуждение и 7.1. Отрываны от шаблонов

7.2 Создание кода вокруг визуальных эффектов

7.3 Ограничения

8 Заключение и ссылки

5 Оценки

Мы провели три оценки, чтобы понять качество нашей системы LLM: 1) сравнительное исследование по отраслевым стандартам и базовым информировано профессиональным дизайнером анимированного логотипа 2) эмпирический анализ программного ремонта тестирования различных экспериментальных настроек, 3) оценка с новичками для понимания способности Logomotion для настройки. Эти оценки сосредоточены на следующих вопросах исследования:

RQ1: В целом широкого спектра дизайнов, в какой степени логомовая анимация поддерживает контент-анимацию?

RQ2Каковы общие сильные стороны и слабые стороны логотики в анимации?

RQ3Какие ошибки имеют тенденцию делать логовое?

RQ4Насколько могла визуально обоснованная отладка программных программ, таких ошибок и какие настройки эффективности ремонта программы?

RQ5В какой степени взаимодействие с пользователем может улучшить качество автоматически сгенерированных анимационных логотипов?

Первая оценка-это сравнительное исследование, сравнивающее анимации логовой с магией Animate [4], которое автоматически рекомендует анимации всем элементам на странице после того, как пользователь выбирает стиль уровня страницы (например, «жирный», «профессионал», «элегантный»). Кроме того, мы сравниваем логовое с аблятированной версией нашей системы (которую мы будем называть как логовоодвижение). Мы подняли части нашей системы, которые 1) концептуально сгруппировали HTML и 2), предложили концепцию дизайна, чтобы увидеть, как эти операторы LLM более высокого уровня повлияли на осведомленность о контенте. Наши точные гипотезы для RQ1 были следующими.

H1AПо сравнению с другими условиями, логовая будет создавать анимации, которая была более с учетом контента.

H1BПо сравнению с другими условиями логовая будет улучшена с точки зрения секвенирования.

H1CПо сравнению с другими условиями, логотью будет лучше с точки зрения качества исполнения.

Figure 4: Visually-Grounded Program Repair identifies bugs in animation code by checking the bounding boxes between elements in the target layout and elements in the last frame of the animation. If errors are identified, the LLM is triggered to perform self-refinement with the visual description of the bug. A code fix is generated and merged back into the original code, provided if it fixes the error.

5.0.1 Методология.Сначала мы собрали тестовый набор из 23 шаблонов, которые охватывали различные категории объектов (одушечных и неодушевленных), слоев и вариантов использования. Вопросы использования включали праздничные поздравления, школьные клубы, рекламу и брендинг. Все шаблоны были получены из Adobe Express и Canva и доступны в Интернете.

Каждый шаблон экспортировался в виде PDF, а затем преобразован в HTML -представление с использованием методов, упомянутых в подразделе 4.2. Мы запустили Logomotion, чтобы получить четыре анимации для каждого шаблона. Затем мы запустили Logomotion, чтобы получить еще четыре анимации для каждого шаблона. В целом, генерирование набора из четырех выходов с логовой/ логовой, абфицированные в логовой, заняла приблизительно 12 минут. Чтобы иметь отраслевой стандарт для сравнения, мы также собрали четыре варианта от Magic Animate, который является инструментом AI для автоматической анимации, которая является одной из премиальных функций Canva Pro. Их предустановки на уровне страниц концептуально похожи на шаблоны (например, все элементы исчезают с одной стороны холста, элементы стерели на место). Сначала мы взяли их рекомендуемые предварительные устройства для анимации для макета, а затем заставили внешний дизайнер выбрать следующие три лучших пресета, гарантируя, что у нас есть сильный базовый уровень для сравнения.

Чтобы оценить анимацию, три профессиональных дизайнера были набраны для оценки 276 анимаций (23 шаблона x 12 прогонов на шаблон), охватывающие три условия. Дизайнеры были представлены для этой задачи с удаленным вызовом, откалиброванным с хорошими и плохими примерами, чтобы понять рубрику, и компенсировали их время. Каждая анимация была представлена ​​в рандомизированном порядке и оценена по шкале 1-5 для каждого из следующих измерений: 1) релевантность, 2) секвенирование и 3) качество выполнения. Актуальность описывает, насколько актуальна анимация для предмета логотипа. Это мера того, насколько содержит контент, подход анимации. Секвенирование была мерой того, насколько хорошо анимация была секвенирована с точки зрения координации и времени между элементами. Качество исполнения оценило анимацию за то, насколько хорошо она была выполнена, и если у него были какие -либо недостатки.

5.0.2 H1A. Актуальность.Мы усреднились по рейтингам трех специалистов по дизайну. Логовая была оценена как значительная более актуальность для предмета анимированного логотипа, чем как анимат магии, так и его аблятированную версию (H1A, Logomotion-Full: M = 3,05, 𝜎 = 0,64; логомоция, аббифицированная: M = 2,68, 𝜎 = 0,58; Волшебное оживление: M = 2,33, 𝜎 = 0,33, ≤ 0,001). Из этого мы подтверждаем H1A; Logomotion-Full была главным условием с точки зрения анимации с учетом контента.

При сортировке по средней актуальности по оценкам, анимации с максимальным номиналом имеют тенденцию поступать из логовой (15 из топ -20) или Logomotionabledabled (5 из топ -20). Анимации логовой, которые были оценены с высокой оценкой, чтобы показать движение, которое было архетипическим по их теме. На видео для этой статьи показывают примеры фонарей, дующих, как будто при небольшом ветре, крабов ползают зигзагу по экрану, и катания на лыжах катания на лыжах вниз по диагонали. Кадры из примеров изображены на рисунке 5. В первом ряду черный рыцарь переводится в холст в L-подобном движении, как шахматный кусок, установленную, когда епископский кусок масштабируется. В последнем ряду мы видим воздушный шар, медленно поднимаясь над горами, после чего заголовок логотипа исчезает в письме.

5.0.3 H1B. Секвенирование.С точки зрения секвенирования, Logomotion-Full значительно не отличалась от двух других условий (H1B,

Figure 5: Examples of LogoMotion-generated logo animations. These animations show how LogoMotion is able to create motion that is characteristic of the design elements, layout-aware, and logically sequenced.

Logomotion-full: M = 3,15, 𝜎 = 0,55; Логовая, абранная: M = 3,18, 𝜎 = 0,41; Волшебная оживленная: M = 3,12, 𝜎 = 0,43).

Качественно, логотья и логомоция, аббифицированные, были способны реализовать логическое секвенирование раскрытия логотипа. Они могли бы время первичных элементов перед вторичными элементами или наоборот, но обычно всегда ставят текст последним. Логовая также была способна обрабатывать сложные текстовые секвенирования, такие как Arced Text и буква буквы за пишущей машинкой (см. Рисунок 5).

Логовая, как правило, секвенировала слои внизу внизу, хотя анимации оцениваются ниже для секвенирования, как правило, имели ошибки при упорядочении слоя. Фоновые элементы также могут быть эффективно использованы в анимации. Например, в сопровождающем видео газеты мы показываем, что в анимированном логотипе для клуба боевых искусств силуэт удара персонажа каратэ появляется слева. Когда это «приземляется» на место, фон качается, как будто от воздействия их удара. Эта дополнительная размерность была с этапа концепции дизайна, который предложил,«Для дополнительного воздействия вы можете рассмотреть краткий экранный коктейль или эффект вибрации, когда силуэт« приземляется », чтобы привлечь еще больше внимания к моменту героя основного элемента».

Логовая также была способна генерировать анимации, которая отражала гештальт -свойства, такие как симметрия. Например, симметричные элементы примера цирка на рис. 5 анимировались в то же время, и музыкальные ноты в примере акапеллы над ним анимировались контралатеральным, но симметричным образом. Логовая также может создать синхронизацию путем отображения и ошеломляющих функций анимации с группами схожих объектов. Так реализовала текстовую анимацию, но она также может сделать это для элементов

Table 1: Relevance, Sequencing, Execution Quality. We took the top-2 from each condition within a template. Ratings were averaged across design professionals.) (** = 𝑝 ≤ 0.001)

Figure 6: We report the average top-2 relevance across conditions. LogoMotion was rated to be significantly better in terms of relevance.

В пределах вторичной группы (например, картирование мерцающего действия с группой звезд).

5.0.4 H1C. Качество исполнения.С точки зрения качества выполнения, полный конвейер логомоции не отличался значительно иначе, чем другие условия (H1B, Logomotion-Full: M = 3,25, 𝜎 = 0,54; логомоция, абранная: M = 3,38, 𝜎 = 0,46; волшебство: M = 3,22, 𝜎 = 0,39).

Логоемная подготовка набрала самое высокое по качеству выполнения. Многие анимации для этого состояния имели тенденцию быть концептуально схожими (все элементы исчезают или переводятся на место с небольшого смещения) и, таким образом, были минимальными в сложности анимации и легко выполняются. Одним из факторов, который повлиял на качество исполнения, было то, что логовая иногда может создавать визуальные недостатки, которые наш контрольный контроль с ограничивающим ящиком не смог поймать. Например, логовая иногда может предложить анимационный код, который нацелен на атрибуты, такие как цвет фона или внешнее свечение. Они пройдут на нашем этапе ремонта программы (который не проверял эти свойства) и снизит рейтинги качества выполнения.

Авторы:

(1) Вивиан Лю, Колумбийский университет (vivian@cs.columbia.edu);

(2) Rubaiat Habib Kazi, Adobe Research (rhabib@adobe.com);

(3) Li-Yi Wei, Adobe Research (lwei@adobe.com);

(4) Мэтью Фишер, Adobe Research (matfishe@adobe.com);

(5) Тимоти Ланглуа, Adobe Research (tlangloi@adobe.com);

(6) Сет Уокер, Adobe Research (swalker@adobe.com);

(7) Лидия Чилтон, Колумбийский университет (chilton@cs.columbia.edu).


Эта статья естьДоступно на ArxivПод CC BY-NC-ND 4.0 Лицензия.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE