Новый синтезатор голоса OpenAI может скопировать ваш голос всего из 15 секунд аудио

Новый синтезатор голоса OpenAI может скопировать ваш голос всего из 15 секунд аудио

31 марта 2024 г.

OpenAI быстро разрабатывает своего генеративного чат-бота ChatGPT и Сора Создатель видео с искусственным интеллектом за последний год, и это&apos Теперь у нас есть новый инструмент искусственного интеллекта: Voice Generation, который может создавать синтетические голоса всего из 15 секунд звука.

В a сообщение в блоге (через The Verge), OpenAI сообщает, что запускает "небольшую предварительную версию" Voice Engine, который находится в разработке с конца 2022 года. Фактически он уже используется. в функция чтения вслух в приложении ChatGPT, которая (как следует из названия) зачитывает вам ответы.

После того, как вы натренировали голос по 15-секундному образцу, вы сможете заставить его читать любой текст, который вам нравится, «эмоциональным и реалистичным» способом. OpenAI утверждает, что его можно использовать в образовательных целях, для перевода подкастов на новые языки, для охвата отдаленных сообществ и для поддержки невербальных людей.

Это не то, что каждый может использовать прямо сейчас, но вы можете пойти и послушайте образцы, созданные Voice Engine. Клипы, опубликованные OpenAI, звучат довольно впечатляюще, хотя в них есть легкая роботизированность и неестественность.

Безопасность превыше всего

ChatGPT Android app

Voice Engine уже используется в ChatGPT Функция чтения вслух (Изображение предоставлено OpenAI)

Беспокойство по поводу неправильного использования является основной причиной, по которой Voice Engine на данный момент находится только в ограниченной предварительной версии: OpenAI заявляет, что хочет провести дополнительные исследования того, как можно защитить подобные инструменты от использования для распространения дезинформации и копирования голосов без согласия.

«Мы надеемся начать диалог об ответственном использовании синтетических голосов и о том, как общество может адаптироваться к этим новым возможностям», говорит OpenAI. «Основываясь на этих разговорах и результатах этих небольших испытаний, мы примем более обоснованное решение о том, стоит ли и как развертывать эту технологию в больших масштабах».

В связи с тем, что в этом году в США и Великобритании должны состояться крупные выборы, а инструменты генеративного ИИ постоянно совершенствуются, это становится проблемой для всех типов ИИ-контента – аудио, текста и видео – и становится все труднее его контролировать. знать, чему доверять.

Как указывает сама OpenAI, это может вызвать проблемы с мерами голосовой аутентификации и мошенничество, когда вы можете не знать, с кем разговариваете по телефону или кто оставил вам голосовое сообщение. Эти проблемы нелегко решить, но нам придется найти способы справиться с ними.

Вам также может понравиться


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE