Новый синтезатор голоса OpenAI может скопировать ваш голос всего из 15 секунд аудио
31 марта 2024 г.OpenAI быстро разрабатывает своего генеративного чат-бота ChatGPT и Сора Создатель видео с искусственным интеллектом за последний год, и это&apos Теперь у нас есть новый инструмент искусственного интеллекта: Voice Generation, который может создавать синтетические голоса всего из 15 секунд звука.
В a сообщение в блоге (через The Verge), OpenAI сообщает, что запускает "небольшую предварительную версию" Voice Engine, который находится в разработке с конца 2022 года. Фактически он уже используется. в функция чтения вслух в приложении ChatGPT, которая (как следует из названия) зачитывает вам ответы.
После того, как вы натренировали голос по 15-секундному образцу, вы сможете заставить его читать любой текст, который вам нравится, «эмоциональным и реалистичным» способом. OpenAI утверждает, что его можно использовать в образовательных целях, для перевода подкастов на новые языки, для охвата отдаленных сообществ и для поддержки невербальных людей.
Это не то, что каждый может использовать прямо сейчас, но вы можете пойти и послушайте образцы, созданные Voice Engine. Клипы, опубликованные OpenAI, звучат довольно впечатляюще, хотя в них есть легкая роботизированность и неестественность.
Безопасность превыше всего
Беспокойство по поводу неправильного использования является основной причиной, по которой Voice Engine на данный момент находится только в ограниченной предварительной версии: OpenAI заявляет, что хочет провести дополнительные исследования того, как можно защитить подобные инструменты от использования для распространения дезинформации и копирования голосов без согласия.
«Мы надеемся начать диалог об ответственном использовании синтетических голосов и о том, как общество может адаптироваться к этим новым возможностям», говорит OpenAI. «Основываясь на этих разговорах и результатах этих небольших испытаний, мы примем более обоснованное решение о том, стоит ли и как развертывать эту технологию в больших масштабах».
В связи с тем, что в этом году в США и Великобритании должны состояться крупные выборы, а инструменты генеративного ИИ постоянно совершенствуются, это становится проблемой для всех типов ИИ-контента – аудио, текста и видео – и становится все труднее его контролировать. знать, чему доверять.
Как указывает сама OpenAI, это может вызвать проблемы с мерами голосовой аутентификации и мошенничество, когда вы можете не знать, с кем разговариваете по телефону или кто оставил вам голосовое сообщение. Эти проблемы нелегко решить, но нам придется найти способы справиться с ними.
Вам также может понравиться
- По слухам, Google-конкурент OpenAI вскоре может изменить способ поиска
- Сора страннее и мощнее, чем мы думали
- OpenAI стремится создать гигантскую империю чипов искусственного интеллекта для поддержки своих инструментов
Оригинал