Google Cloud Next ’23: новые генеративные сервисы на базе искусственного интеллекта
30 августа 2023 г.Google представила широкий спектр новых генеративных сервисов на базе искусственного интеллекта на своей конференции Google Cloud Next 2023 в Сан-Франциско 29 августа. На предварительном брифинге мы впервые познакомились с новыми виртуальными машинами Google Cloud TPU и A4 на базе NVIDIA H100. Графические процессоры и многое другое.
Перейти к:
- Vertex AI увеличивает производительность и добавляет другие улучшения
Обновления BigQuery и AlloyDB готовы к предварительной версии
Представлены суперкомпьютеры виртуальной машины A3 с NVIDIA для обучения ИИ
Cloud TPU v5E оптимизирован для генеративного вывода ИИ
Представляем версию Google Kubernetes Engine Enterprise
Vertex AI увеличивает производительность и добавляет другие улучшения
Джун Ян, вице-президент по облачному искусственному интеллекту и отраслевым решениям Google Cloud, объявила об улучшениях Vertex AI, генеративной платформы искусственного интеллекта компании, которая помогает предприятиям обучать свои собственные модели искусственного интеллекта и машинного обучения.
По словам Яна, клиенты запросили возможность вводить большие объемы контента в PaLM, базовую модель платформы Vertex AI, что побудило Google увеличить свою емкость с 4000 токенов до 32 000 токенов.
Клиенты также попросили поддерживать больше языков в Vertex AI. На конференции Next ’23 Ян объявил, что PaLM, который находится на платформе Vertex AI, теперь доступен на арабском, китайском, японском, немецком, испанском и других языках. Всего это 38 языков для публичного использования; 100 дополнительных языков теперь доступны в частной предварительной версии.
ПОСМОТРЕТЬ: В марте Google открыла свою большую языковую модель PaLM с API. (Техреспублик)
Vertex AI Search, который позволяет пользователям создавать поисковую систему внутри своих приложений на базе искусственного интеллекта, доступен уже сегодня. «Думайте об этом как о поиске в Google для ваших бизнес-данных», — сказал Ян.
Сегодня также доступен Vertex AI Conversation — инструмент для создания чат-ботов. Ранее поиск и конверсия были доступны под разными названиями продуктов в Google App Builder.
Улучшения базовой модели Коди
Codey, модель преобразования текста в код внутри Vertex AI, получает обновление. Хотя подробности об этом обновлении скудны, Ян сказал, что разработчики смогут более эффективно работать над генерацией кода и обменом кодом.
«Используя нашу базовую модель Codey, такие партнеры, как GitLab, помогают разработчикам оставаться в потоке, прогнозируя и завершая строки кода, генерируя тестовые примеры, объясняя код и многие другие варианты использования», — отметил Ян.
Подберите художественный стиль своего бизнеса с помощью искусственного интеллекта для преобразования текста в изображение
Модель преобразования текста в изображение Vertex теперь сможет выполнять настройку стиля или соответствовать бренду компании и креативным принципам. Организациям необходимо предоставить всего 10 эталонных изображений, чтобы Vertex начал работать в своем стиле.
Новые дополнения к Model Garden, библиотеке моделей Vertex AI.
Google Cloud добавил Llama 2 от Meta и Claude 2 от Anthropic в библиотеку моделей Vertex AI. Решение добавить Llama 2 и Claude 2 в Google Cloud AI Model Garden «соответствует нашему стремлению развивать открытую экосистему», — сказал Ян.
«Благодаря этим дополнениям по сравнению с другими гиперскейлерами Google Cloud теперь предоставляет на выбор самый широкий выбор моделей: наши собственные модели Google, сторонние модели от партнеров, а также модели с открытым исходным кодом на единой платформе», — Ян. сказал. «Благодаря доступу к более чем 100 моделям Vertex AI клиенты теперь могут выбирать модели на основе модальности, размера, задержки производительности и стоимости».
Обновления BigQuery и AlloyDB готовы к предварительной версии
Google BigQuery Studio — рабочая платформа для пользователей, работающих с данными и искусственным интеллектом — и AlloyDB имеют обновления, доступные в предварительной версии.
BigQuery Studio добавлена в предварительную версию облачного хранилища данных
Предварительная версия BigQuery Studio будет развернута в облачном хранилище данных Google BigQuery на этой неделе. BigQuery Studio помогает анализировать и изучать данные и интегрируется с Vertex AI. BigQuery Studio призвана объединить разработку данных, аналитику и прогнозный анализ, сокращая время, которое специалисты по аналитике данных тратят на переключение между инструментами.
Пользователи BigQuery также могут добавить Duet AI, помощника Google по искусственному интеллекту, начиная с этого момента.
AlloyDB дополнен генеративным искусственным интеллектом
Энди Гудман, вице-президент и генеральный менеджер по базам данных Google, на предварительном брифинге объявил о добавлении возможностей генеративного искусственного интеллекта в AlloyDB — PostgreSQL-совместимую базу данных Google для высокопроизводительных корпоративных рабочих нагрузок. По словам Гудмана, AlloyDB включает в себя возможности для организаций, создающих корпоративные приложения искусственного интеллекта, такие как возможности векторного поиска до 10 раз быстрее, чем стандартный PostgreSQL. Разработчики могут создавать векторные вложения в базе данных, чтобы упростить свою работу. AlloyDB AI интегрируется с Vertex AI и экосистемами инструментов с открытым исходным кодом, такими как LangChain.
«Базы данных лежат в основе инноваций поколения ИИ, поскольку они помогают преодолеть разрыв между LLM и приложениями ИИ корпоративного поколения, обеспечивая точный, актуальный и контекстуальный опыт», — сказал Гудман.
AlloyDB AI теперь доступен в предварительной версии через AlloyDB Omni.
Представлены суперкомпьютеры виртуальной машины A3 с NVIDIA для обучения ИИ
Общая доступность виртуальных машин A3, работающих на графическом процессоре NVIDIA H100, в качестве суперкомпьютера с графическим процессором откроется в следующем месяце, объявил Марк Ломейер, вице-президент, генеральный менеджер по инфраструктуре вычислений и машинного обучения в Google Cloud, во время предварительного брифинга.
Специально созданная инфраструктура виртуальных машин суперкомпьютеров A3 со скоростью 200 Гбит/с обеспечивает передачу данных между графическими процессорами, что позволяет обходить хост-процессор. Данные между графическими процессорами передают возможности обучения, настройки и масштабирования искусственного интеллекта с пропускной способностью до 10 раз большей, чем у предыдущего поколения A2. По словам Ломейера, обучение пройдет в три раза быстрее.
NVIDIA «позволяет нам предлагать самый полный портфель инфраструктуры искусственного интеллекта среди всех облаков», — сказал Ломейер.
Cloud TPU v5e оптимизирован для генеративного вывода ИИ
Google представила Cloud TPU v5e, пятое поколение облачных TPU, оптимизированное для генеративного вывода ИИ. TPU, или тензорный процессор, — это ускоритель машинного обучения, размещенный в облаке Google. TPU обрабатывает огромные объемы данных, необходимые для вывода, который представляет собой логический процесс, помогающий системам искусственного интеллекта делать прогнозы.
По словам Ломейера, Cloud TPU v5e может похвастаться вдвое более высокой производительностью на доллар для обучения и в 2,5 раза большей производительностью на доллар для вывода по сравнению с TPU предыдущего поколения.
«(Благодаря волшебству этого программного и аппаратного обеспечения, работающего вместе с новыми программными технологиями, такими как мультисрезирование, мы даем нашим клиентам возможность легко масштабировать свои [генеративные] модели искусственного интеллекта за пределы физических границ одного модуля TPU или одного TPU. кластер», — сказал Ломейер. «Другими словами, одна большая рабочая нагрузка ИИ теперь может охватывать несколько физических кластеров TPU, масштабируясь буквально до десятков тысяч чипов и делая это очень экономически эффективно».
Новый TPU, как правило, доступен в предварительной версии, начиная с этой недели.
Представляем версию Google Kubernetes Engine Enterprise
Google Kubernetes Engineer, который многие клиенты используют для рабочих нагрузок ИИ, получает дальнейшее развитие. Версия GKE Enterprise будет включать в себя многокластерное горизонтальное масштабирование и существующие сервисы GKE, работающие как на облачных графических процессорах, так и на облачных TPU. По данным Google, первые отчеты клиентов показали рост производительности до 45% и сокращение времени развертывания программного обеспечения более чем на 70%.
GKE Enterprise Edition будет доступен в сентябре.
Оригинал