100 дней искусственного интеллекта, день 1: от информационного бюллетеня до подкаста, использование искусственного интеллекта для преобразования звука

100 дней искусственного интеллекта, день 1: от информационного бюллетеня до подкаста, использование искусственного интеллекта для преобразования звука

5 января 2024 г.

Если вы не знаете, я пишу информационный бюллетень под названием «Выше среднего», где рассказываю об идеях второго порядка, стоящих за всем, что происходит в больших технологиях. Если вы разбираетесь в технологиях и хотите достичь уровня выше среднего, подпишитесь на нее.

Я всегда восхищался информационным бюллетенем Скотта Галлоуэя «Нет пощады, нет злобы». Уникальная вещь, которую Скотт делает со своим информационным бюллетенем, заключается в том, что он нанял своего друга Джорджа Хана для преобразования информационного бюллетеня в подкаст, который публикуется каждую неделю в его ленте подкастов здесь.

У меня нет такого друга, как Джордж Хан, но я знаю, что благодаря недавним достижениям голоса ИИ стали очень реалистичными. Поэтому я подумал, а почему бы не преобразовать мой информационный бюллетень в подкаст?

Итак, я поигрался и написал сценарий, который использует API преобразования текста в речь Open AI для преобразования моего сообщения в информационном бюллетене в его аудиоверсию.

Чтобы следовать этому сценарию и использовать его, вам потребуются кредиты Open AI и секретный ключ Open AI.

Вот код, который я использовал.

from openai import OpenAI


client = OpenAI()
client.api_key = 'YOUR SECRET KEY'
txt = """1/ Google is the dark horse in AI

Only Google can mess up a good thing multiple times. Google has struggled to play the perception game that has turned against it after the launch of ChatGPT and with Sathya’s offense on all things AI.

Google released an impressive Gemini AI preview series and the success lasted for two days. Before media started to observe that the demo is not so much as a demo but series of well constructed prompts. Or a series of good demos complied to one great demo.

This is obviously putting Google back again in the perception wars of AI. The keyword here is perception.

If everything is perception & marketing than nothing in the world will be a surprise. In case of Google in AI, don’t let the perception confuse you. Google is still the dark horse in AI. Google was talking about AI in every Pixel device launch since last 5 years while the tech industry and VCs were saying that Crypto is the next big thing.

The day to day news cycle exists to take your attention and make you click & confuse you. AI is a continuous innovation not a discontinuous one. Google has strong fundamentals in AI and the AI cycle is much longer than 12 months of ChatGPT. Google has shipped more AI products via Gmail, Google Search, Ads and most importantly Google Pixel than any other company. So just because Google has failed to market itself doesn’t mean its a loser in AI.

Google is still a dark horse in AI."""

response = client.audio.speech.create(
    model="tts-1",
    voice="onyx",
    input=txt,
)

response.stream_to_file("output.mp3")

Сообщение в информационном бюллетене, которое я взял в этом примере, взято из это издание. Вот результат, сгенерированный результат.

Результат оказался не таким хорошим, как у Джорджа Хана, но намного лучше, чем у большинства существующих аудиокниг.

ПРЕДУПРЕЖДЕНИЕ О ПРОДУКТЕ AI: Эту идею можно расширить и создать продукт, который при публикации принимает новый информационный бюллетень, автоматически преобразует его в подкаст и публикует в ленте подкастов. Джордж Хан как услуга.

Вот и все, что касается первого дня AI.

Следуйте за мной в Twitter, чтобы быть в курсе последних новостей о 100 днях искусственного интеллекта или добавить эту страницу в закладки.


Также опубликовано здесь.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE