Meta говорит, что ее новый инструмент искусственного интеллекта, генерирующий речь, слишком опасен для выпуска

Meta говорит, что ее новый инструмент искусственного интеллекта, генерирующий речь, слишком опасен для выпуска

20 июня 2023 г.

Meta представила новый инструмент искусственного интеллекта, получивший название «Voicebox», который, по ее утверждению, представляет собой прорыв в генерации речи с помощью искусственного интеллекта. Тем не менее, компания пока не будет обнародовать его для публики, потому что это может иметь катастрофические последствия.

В настоящее время Voicebox может воспроизводить аудиоклипы речи на шести языках (все они европейского происхождения) и, согласно сообщение в блоге от Meta — это первая в своем роде модель ИИ, способная выполнять задачи, выходящие за рамки того, для чего она была «специально обучена». Meta утверждает, что Voicebox легко превосходит конкурирующие ИИ для генерации речи практически во всех областях.

Так на что именно он способен? Ну, во-первых, он может извергать достаточно точные реплики голоса человека из текста в речь, используя образец аудиофайла всего за две секунды, кажущаяся безобидной способность, которая имеет огромный разрушительный потенциал в чужих руках.

Сомнительная сила ИИ

Даже если оставить в стороне хитрые вещи< /u>, которые ползают по Интернету с помощью ChatGPT и другие инструменты искусственного интеллекта (Voicebox, безусловно, звучит так, как будто он может быть благом для любого, кто делает поддельное порно мести), это своего рода технология, которая может буквально начать войну.

В конце концов, у большинства крупных общественных деятелей, включая политиков, есть множество аудиозаписей, гуляющих по Интернету. Было бы несложно сопоставить несколько фрагментов речи действующего политического лидера и использовать Voicebox для создания поразительно реалистичной реплики его голоса — что-то, что затем можно было бы использовать в гнусных целях.

Марк Цукерберг

Большой Цук (извините, «генеральный директор Meta Марк Цукерберг») уже много лет вкладывает значительные средства в разработку ИИ в Meta. (Изображение предоставлено Facebook)

Такие инструменты, конечно, уже существуют, но они менее убедительны; возможно, вы видели забавные видеоролики в социальных сетях, в которых Джо Байден, Дональд Трамп и Барак Обама якобы вместе играют в Fortnite. Это хорошо для смеха, но звук вряд ли убедителен. Он имитирует манеры каждого президента-геймера в достаточной степени, чтобы их можно было узнать, но не настолько хорошо, чтобы любой человек с мозгами действительно поверил, что это они.

Meta явно считает, что ее новый инструмент достаточно хорош, чтобы обмануть, по крайней мере, большинство людей, поскольку она явно не выпускает Voicebox для публики, а вместо этого публикует исследовательская работа с подробным описанием инструмента классификатора, который может отличить сгенерированную Voicebox речь от реальной человеческой речи . Мета описывает классификатор как «высокоэффективный», хотя и не идеально эффективный.

Говорящие машины

Конечно, хотя Meta стремится подчеркнуть, что признает «потенциал неправомерного использования и непреднамеренного вреда», окружающий такие инструменты, как Voicebox, важно не упускать из виду потенциальные преимущества генерации речи ИИ, которые могут быть в будущем.

Voicebox — как и подобает своему названию — может обеспечить гораздо более натуралистическую речь для людей, которые немые или не могут общаться по другим причинам, устраняя некоторые барьеры для взаимодействия, вызванные существующим преобразованием текста в речь «голосом робота», прославленным физиком Стивеном Хокингом. Он также может выполнять перевод в реальном времени, приближая нас на один шаг к своего рода «универсальным переводчикам», которые в настоящее время существуют только в научной фантастике.

Логотип приложения Instagram на iOS

Instagram — принадлежит Meta - может оказаться успешным домом для Voicebox, улучшая и переводя видео для более широкой аудитории. (Изображение предоставлено Shutterstock)

Есть и другие приложения; меньше, но не менее полезно. Meta объясняет в своем блоге, что Voicebox можно использовать для редактирования и улучшения записанной речи. Если вы записали какой-то звук, но неправильно произнесли слово или были прерваны фоновым шумом, Voicebox может изолировать оскорбительный сегмент и «перезаписать» фрагмент речи, используя ваш голос. Впечатляет и лишь слегка пугает.

В любом случае, приятно видеть, что Мета проявляет здесь серьезный и взвешенный подход. Безумное стремление Microsoft протолкнуть Использование искусственного интеллекта во всем имеет попадал в горячую воду более одного раза, а OpenAI, высвобождающий ChatGPT в мире, привел к всевозможным странностям за последний год. Мы находимся в золотой лихорадке ИИ, и эти инструменты проникают в каждую часть нашей жизни.

Немного осторожности, терпения и уважения к масштабам этой технологии — это долгожданное зрелище, хотя я сомневаюсь, что Meta будет сидеть на Voicebox слишком долго, поскольку акционеры, несомненно, будут задаваться вопросом, сколько денег это принесет. может сделать их…


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE