Gemini AI от Google теперь может обрабатывать более крупные запросы благодаря обновлению следующего поколения

Gemini AI от Google теперь может обрабатывать более крупные запросы благодаря обновлению следующего поколения

16 февраля 2024 г.

Google Gemini AI на момент написания этой статьи существует всего два месяца, и компания уже запускает модель следующего поколения, получившую название Gemini 1.5.

анонс подробно описывает все улучшения ИИ. Все это довольно технический вопрос, но главный вывод заключается в том, что Gemini 1.5 обеспечит «значительно повышенную производительность». Это было достигнуто за счет реализации «архитектуры смешанных экспертов» (или сокращенно MoE), которая предполагает совместную работу нескольких моделей ИИ. Внедрение этой структуры облегчило обучение Близнецов, а также позволило им быстрее усваивать сложные задачи, чем раньше.

Планируется внедрить обновление для всех трех основных версий AI, но единственная версия, выпущенная сегодня для раннего тестирования, — это Gemini 1.5 Pro.

Уникальность модели в том, что она имеет «контекстное окно до 1 миллиона токенов». Токены , поскольку они относятся к генеративному ИИ, представляют собой мельчайшие фрагменты данных, которые LLM (большие языковые модели) используют «для обработки и генерации текста». Большие контекстные окна позволяют ИИ обрабатывать больше информации одновременно. А миллион токенов огромен, намного превосходя возможности GPT-4 Turbo. Движок OpenAI для сравнения имеет ограничение контекстного окна размером 128 000 токенов.

Gemini Pro в действии

Учитывая все эти цифры, возникает вопрос: как выглядит Gemini 1.5 Pro в действии? Google снял несколько видеороликов, демонстрирующих способности ИИ. Надо признать, это довольно интересные вещи, поскольку они показывают, как обновленная модель может анализировать и суммировать большие объемы текста по подсказке.

В одном примере они дали Gemini 1.5. Про более чем 400-страничную расшифровку лунной миссии Аполлона-11. Это показало, что ИИ может «понимать, рассуждать и идентифицировать» определенные детали в документе. Суфлер просит ИИ найти «комичные моменты» во время миссии. Через 30 секунд Gemini 1.5 Pro удалось найти несколько шуток, которые астронавты отпускали в космосе, включая тех, кто их рассказал, и объяснил все сделанные ссылки.

Эти навыки анализа можно использовать и для других методов. В другой демонстрации команда разработчиков предоставила ИИ 44-минутный фильм Бастера Китона. Они загрузили черновой набросок фонтанирующей водонапорной башни, а затем попросили указать время сцены с водонапорной башней. И действительно, через десять минут после начала фильма он нашел точную часть. Имейте в виду, что это было сделано без каких-либо объяснений относительно самого рисунка или любого другого текста, кроме вопроса. Gemini 1.5 Pro без посторонней помощи понял, что это водонапорная башня.

Экспериментальная технология

На данный момент модель недоступна для широкой публики. В настоящее время он предлагается в качестве ранней предварительной версии «разработчикам и корпоративным клиентам» через Google AI Studio и Платформы Vertex AI бесплатно. Компания предупреждает тестировщиков, что у них могут возникнуть длительные задержки, поскольку это все еще экспериментальный вариант. Однако есть планы по повышению скорости в дальнейшем.

Мы обратились к Google с просьбой предоставить информацию о том, когда люди могут ожидать запуска Gemini 1.5 и Gemini 1.5 Ultra, а также более широкого выпуска этих моделей искусственного интеллекта следующего поколения. Эта история будет обновлена ​​позже. А пока ознакомьтесь с обзором лучшие генераторы контента с использованием искусственного интеллекта на 2024 год.

Вам также может понравиться


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE