Spotify использует ИИ для перевода подкастеров на другие языки, используя их собственные голоса

Spotify использует ИИ для перевода подкастеров на другие языки, используя их собственные голоса

25 сентября 2023 г.

Вы когда-нибудь задумывались, как будет звучать ваш любимый подкаст на китайском или испанском языке? Итак, Spotify тестирует новую функцию на базе искусственного интеллекта, которая сделает именно это. Голосовой перевод — это новая функция, которая внедряется сегодня (25 сентября), которая позволит вам слушать определенные эпизоды подкастов на другом языке, но собственным голосом говорящего… или, по крайней мере, его факсимиле.

Инструмент, разработанный Spotify с помощью системы автоматического распознавания речи (ASR) OpenAI Whisper, использует генеративную модель искусственного интеллекта для преобразования речи в текст для перевода аудиофайлов и модель репликации голоса для соответствия исходному динамику. стиль.

Первыми докладчиками этой новой функции станут Дакс Шепард, Моника Пэдман, Лекс Фридман, Билл Симмонс и Стивен Бартлетт. Однако не все выпуски соответствующих подкастов будут сразу доступны на нескольких языках. Вместо этого следите за «Интервью с Ювалем Ноем Харари». эпизод подкаста Лекса Фридмана «Кристен Белл, по милости Божией, возвращается»; о «Эксперте в кресле» и «Интервью с доктором Минди Пельц». о «Дневнике генерального директора» со Стивеном Бартлеттом, которые теперь будут доступны на испанском языке.

Spotify сообщает, что в ближайшие дни и недели будут доступны новые эпизоды, а затем появятся переводы на французский и немецкий языки. Вы сможете найти их в представлении «Сейчас исполняется» в своем мобильном или настольном приложении, а дополнительные эпизоды с голосовым переводом будут добавлены в специальный Голосовой перевод.

Мнение: более разумное использование ИИ

лучшие сервисы потоковой передачи музыки быстро перешли на золото генеративного ИИ. спешите после шумихи вокруг OpenAI ChatGPT. Хотя они уже использовали машинное обучение для выявления закономерностей и тенденций в ваших привычках прослушивания музыки, чтобы лучше рекомендовать новые песни (подумайте: ваш плейлист Discover Weekly), появилось несколько новых способов применения этой технологии.

ИИ Spotify DJ, который рекомендует новые треки с помощью голоса, сгенерированного искусственным интеллектом, — лишь один из них. Также есть Universal Music' ;мы сотрудничаем с Endel для создания окружающего звука, такого как шум леса и текущей воды, с использованием искусственного интеллекта, а также бесчисленных музыкальных генераторов, в том числе таких, как Мета и Google. Но, несомненно, самой страшной была идея использовать генеративный искусственный интеллект для создания подкастов с нуля.

В результате экспериментов в этой области появилось несколько подкастов о генеративном искусственном интеллекте, в том числе The Joe Rogan AI Experience и Hackers News Recap , и это лишь некоторые из них. Помимо опасений по поводу авторских прав и конфиденциальности, самой большой негативной реакцией по этому поводу было отсутствие живого разговора, на котором построены лучшие подкасты.

Скорее всего, именно поэтому они на самом деле не стали популярными, но идея использования генеративного искусственного интеллекта для перевода подкастов — это именно тот вариант использования, который я могу поддержать. В конце концов, машинное обучение — это инструмент, поэтому увидеть, как с его помощью делают интересные шоу более широко доступными, — это отличная польза, если предположить, что темп и живость разговоров действительно меняются. Теперь мне нужно найти все подкасты на иностранных языках, которые я пропустил, и получить их на английском языке.

Вам также может понравиться


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE