Google представляет Gemini, свою долгожданную модель большого языка

7 декабря 2023 г.
Gemini уже доступен потребителям в Bard или Pixel 8 Pro, а корпоративная модель появится 13 декабря.

Google представила Gemini, свою модель большого языка, о которой давно ходят слухи, и конкурента GPT-4. Глобальные пользователи Google Bard и Pixel 8 Pro смогут запускать Gemini уже сейчас; корпоративный продукт Gemini Pro появится 13 декабря. Разработчики могут подписаться на раннюю предварительную версию Android AICore уже сейчас.

Перейти к:

    Что такое Близнецы? Есть ли у Gemini корпоративный продукт? Выбор времени для Gemini по сравнению с другими популярными программами LLM

Что такое Близнецы?

Gemini — это большая языковая модель, на которой работают приложения генеративного искусственного интеллекта; он может обобщать текст, создавать изображения и отвечать на вопросы. Gemini прошли обучение на Google Tensor Processing Units v4 и v5e.

Google Bard — это генеративный искусственный интеллект, основанный на режиме большого языка PaLM. Согласно пресс-релизу Google, начиная с сегодняшнего дня, Gemini будет использоваться для того, чтобы дать Барду «более продвинутые рассуждения, планирование, понимание и многое другое».

SEE: Microsoft инвестировала 3,2 миллиарда долларов в искусственный интеллект в Великобритании. (Техреспублик)

Варианты размера Близнецов

Gemini выпускается в трех размерах модели: Ultra, Pro и Nano. Ultra — самый производительный, Nano — самый маленький и эффективный, а Pro находится посередине для общих задач. Версия Nano — это то, что Google использует в Pixel, а Бард — Pro. Google заявляет, что планирует провести «обширные проверки доверия и безопасности», прежде чем выпустить Gemini Ultra для избранных групп.

Близнецы для кодирования

Gemini может писать код на Python, Java, C++, Go и других популярных языках программирования. Google использовала Gemini для обновления системы генерации кода Google на базе искусственного интеллекта AlphaCode.

Gemini будет добавлен в другие продукты Google

Далее Google планирует внедрить Gemini в Ads, Chrome и Duet AI. В будущем Gemini будет использоваться и в поиске Google.

Конкуренты Близнецам

Gemini и продукты, созданные на его основе, такие как чат-боты, будут конкурировать с GPT-4 от OpenAI, Copilot от Microsoft (основанным на GPT-4 от OpenAI), Claude AI от Anthropic, Llama 2 от Meta и другими. Google утверждает, что Gemini Ultra превосходит GPT-4 в нескольких тестах, включая масштабный многозадачный тест на понимание языка и генерацию кода Python.

Есть ли у Gemini корпоративный продукт?

Начиная с 13 декабря корпоративные клиенты и разработчики смогут получить доступ к Gemini Pro через Gemini API в Google Vertex AI или Google AI Studio.

Google ожидает, что Gemini Nano станет общедоступным для разработчиков и корпоративных клиентов в начале 2024 года. Разработчики Android могут использовать этот LLM для создания приложений Gemini на устройстве с помощью AndroidAICore.

Возможные варианты корпоративного использования Gemini

Особый интерес для корпоративных сценариев использования может представлять способность Gemini «понимать и рассуждать о намерениях пользователей», — сказал Палаш Нэнди, технический директор Google, в демонстрационном видео. Gemini генерирует индивидуальный пользовательский интерфейс в зависимости от того, ищет ли пользователь изображения или текст. В том же пользовательском интерфейсе Gemini будет отмечать области, в которых недостаточно информации, и запрашивать разъяснения. Благодаря специально разработанному пользовательскому интерфейсу пользователь может более детально изучить другие варианты.

Gemini с самого начала обучались мультимодальному контенту, вместо того, чтобы начинать с текста и позже расширять его до аудио, изображений и видео, что позволяет Gemini анализировать письменную или визуальную информацию с одинаковой остротой. Одним из примеров того, как это может быть полезно для бизнеса, является запрос Google: «Может ли Gemini помочь сделать демо-версию на основе этого видео?» в котором ИИ преобразует видеоконтент в оригинальную анимацию.

Выбор времени для Gemini по сравнению с другими популярными программами LLM

Ходят горячие слухи о Gemini, поскольку Google пытается конкурировать с OpenAI. The New York Times сообщила, что руководители Google были «потрясены» технологией OpenAI в январе 2023 года. Совсем недавно Google предположительно боролся с выпуском Gemini на других языках, кроме английского, что привело к задержке личного запуска.

Однако выпуск собственной большой языковой модели Google после того, как ChatGPT в течение почти года получал постепенные обновления на основе GPT-4, означает, что у Google есть преимущество, позволяющее обойти последний год разработки ИИ. Например, Gemini является мультимодальным (т. е. может работать с текстом, видео, речью и кодом) и изначально работает на Google Pixel 8. Пользователи могут получить доступ к Gemini на своем Google Pixel 8 без подключения к Интернету, в отличие от ChatGPT, который изначально создавался. в браузере.

Подпишитесь на новостную рассылку Innovation Insider Узнайте о последних технологических инновациях, которые меняют мир, включая Интернет вещей, 5G, последние новости о телефонах, безопасности, умных городах, искусственном интеллекте, робототехнике и многом другом. Доставка по вторникам и пятницам Адрес электронной почты Подписываясь на нашу рассылку, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности. Вы можете отписаться в любое время. Подписаться
Подпишитесь на новостную рассылку Innovation Insider Узнайте о последних технологических инновациях, которые меняют мир, включая Интернет вещей, 5G, последние новости о телефонах, безопасности, умных городах, искусственном интеллекте, робототехнике и многом другом. Доставка по вторникам и пятницам Адрес электронной почты Подписываясь на нашу рассылку, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности. Вы можете отписаться в любое время. Подписаться

Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE