Новый синтезатор голоса OpenAI может скопировать ваш голос всего из 15 секунд аудио

OpenAI быстро разрабатывает своего генеративного чат-бота ChatGPT и Сора Создатель видео с искусственным интеллектом за последний год, и это&apos Теперь у нас есть новый инструмент искусственного интеллекта: Voice Generation, который может создавать синтетические голоса всего из 15 секунд звука.

В a сообщение в блоге (через The Verge), OpenAI сообщает, что запускает "небольшую предварительную версию" Voice Engine, который находится в разработке с конца 2022 года. Фактически он уже используется. в функция чтения вслух в приложении ChatGPT, которая (как следует из названия) зачитывает вам ответы.

После того, как вы натренировали голос по 15-секундному образцу, вы сможете заставить его читать любой текст, который вам нравится, «эмоциональным и реалистичным» способом. OpenAI утверждает, что его можно использовать в образовательных целях, для перевода подкастов на новые языки, для охвата отдаленных сообществ и для поддержки невербальных людей.

Это не то, что каждый может использовать прямо сейчас, но вы можете пойти и послушайте образцы, созданные Voice Engine. Клипы, опубликованные OpenAI, звучат довольно впечатляюще, хотя в них есть легкая роботизированность и неестественность.

Безопасность превыше всего

ChatGPT Android app — Voice Engine уже используется в ChatGPT Функция чтения вслух (Изображение предоставлено OpenAI)

Беспокойство по поводу неправильного использования является основной причиной, по которой Voice Engine на данный момент находится только в ограниченной предварительной версии: OpenAI заявляет, что хочет провести дополнительные исследования того, как можно защитить подобные инструменты от использования для распространения дезинформации и копирования голосов без согласия.

«Мы надеемся начать диалог об ответственном использовании синтетических голосов и о том, как общество может адаптироваться к этим новым возможностям», говорит OpenAI. «Основываясь на этих разговорах и результатах этих небольших испытаний, мы примем более обоснованное решение о том, стоит ли и как развертывать эту технологию в больших масштабах».

В связи с тем, что в этом году в США и Великобритании должны состояться крупные выборы, а инструменты генеративного ИИ постоянно совершенствуются, это становится проблемой для всех типов ИИ-контента – аудио, текста и видео – и становится все труднее его контролировать. знать, чему доверять.

Как указывает сама OpenAI, это может вызвать проблемы с мерами голосовой аутентификации и мошенничество, когда вы можете не знать, с кем разговариваете по телефону или кто оставил вам голосовое сообщение. Эти проблемы нелегко решить, но нам придется найти способы справиться с ними.

Новый синтезатор голоса OpenAI может скопировать ваш голос всего из 15 секунд аудио

Безопасность превыше всего

Вам также может понравиться