Новый инструмент преобразования текста в аудио от Stability AI похож на Midjourney для музыкальных сэмплов.

Новый инструмент преобразования текста в аудио от Stability AI похож на Midjourney для музыкальных сэмплов.

14 сентября 2023 г.

Stability AI внедряет свою генеративную технологию искусственного интеллекта в мир музыки, поскольку разработчик запустил новый движок преобразования текста в аудио под названием Stable Audio.

Аналогично < u>Модель Stable Diffusion, Stable Audio может создавать короткие звуковые фрагменты на основе простой текстовой подсказки. Компания объясняет это в своем объявлении< /a> что ИИ обучался на контенте из музыкальной онлайн-библиотеки AudioSparx. Компания даже утверждает, что модель способна создавать «высококачественную музыку с частотой 44,1 кГц для коммерческого использования». Для сравнения: 44,1 кГц считается Звук CD-качества. Так что это неплохо, но не самое лучшее.

Пользовательский интерфейс стабильного звука

(Изображение предоставлено: Стабильность ИИ)

В настоящее время общедоступна бесплатная версия Stable Audio, в которой вы можете создавать и загружать 20 отдельных треки месяц. Продолжительность каждого звукового фрагмента составляет 45 секунд, поэтому они не будут очень длинными.

Подсказка музыки

Вводимые вами текстовые подсказки могут быть простыми входными данными. Если прослушать сэмплы, предоставленные Stability AI, «Car Passing By» звучит именно так, как следует из названия – проезжающая вдалеке машина, хотя и немного приглушенно. И наоборот, вы также можете сосредоточиться на деталях. В одном конкретном сэмпле есть подсказка, включающая Ambient Techno, драм-машину 808, хлопки, синтезатор, слово «ethereal», 122 BPM и «Скандинавский лес» (что бы это ни значило). Результатом этого словосочетания является эмбиентный лоу-файный хип-хоп бит.

Мы быстро протестировали Stable Audio. Нам удалось ввести одну подсказку с просьбой к ИИ создать динамичную гаражную рок-песню начала 2000-х, и это вроде как достигло цели. Сгенерированный трек соответствовал стилю, хотя и звучал очень грязно.

Персональный стабильный аудиовход

(Изображение предоставлено: Future )

К сожалению, мы не смогли пойти дальше, кроме единственного входа. На момент написания этой статьи Stable Audio наблюдает огромный приток трафика от людей, спешащих опробовать модель. Разработчик рекомендует повторить попытку позже или на следующий день, если вы не увидите ничего, кроме пустого экрана.

С бесплатной версией есть одна загвоздка: она предназначена только для некоммерческого использования. Если вы хотите использовать контент в коммерческих целях, вам придется приобрести ежемесячный план Stable Audio Professional за 12 долларов. Он также предлагает 500 поколений треков в месяц, каждый продолжительностью до 90 секунд. Также существует план Enterprise для индивидуальной продолжительности звука и ежемесячной генерации. Однако вам сначала придется связаться со Stability AI, чтобы составить план.

Несовершенный инструмент

Имейте в виду, что технология не идеальна. По большей части контент звучит нормально, однако некоторые аспекты могут показаться неприятными. Микс в упомянутой ранее песне Ambient Techno, на наш взгляд, не очень хорош. Это было похоже на борьбу баса и синтезатора за то, какой звук будет доминирующим, в результате чего получался просто шум. Кроме того, похоже, что ИИ не умеет петь. Он исполняет только инструменталы.

Stable Audio, безусловно, интересен, но не то, на что следует полностью полагаться. Следует отметить, что компания просит пользователей высказать свое мнение о том, как улучшить ИИ. Контактный адрес электронной почты можно найти на официальной странице объявления.

Если вы планируете использовать эту технологию в своих целях, мы рекомендуем проверить список лучших аудиоредакторов для 2023, чтобы исправить любые недостатки, с которыми вы можете столкнуться.

ВАМ ТАКЖЕ МОЖЕТ ПОНРАВИТЬСЯ


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE