
Xai's Grok 4 обещает власть - но сколько он может доставить?
17 июля 2025 г.Ранее в этом месяце XAI обнародовал Grok 4 с основателем Элоном Маск, утверждая, что это «самый умный ИИ в мире».
Но это?
Нет никаких сомнений в том, что Grok 4 является грозным претендентом в ландшафте ИИ наряду с O3 Openai и Google Gemini 2.5 Pro. Благодаря расширенным рассуждениям, мультимодальным возможностям и новой многоагентной системе, Grok 4 стремится переопределить производительность ИИ.
Вопрос в том, имеет ли Grok 4 возможности и инновационные функции, чтобы соответствовать требованиям Маск.
Легко увидеть, что Grok 4 пытается установить новые стандарты в производительности искусственного интеллекта, с лучшими показателями по нескольким академическим и решающим критериям.
На «Последнем экзамене человечества», строгого теста на 2500 вопросов, охватывающих математику, гуманитарные науки и естественные науки, Grok 4 набрал 25,4%без внешних инструментов, опередив Google Gemini 2,5 Pro (21,6%) и O3 Openai (21%). Благодаря включению инструментов, его расширенный вариант, Grok 4 Heavy, достиг впечатляющих 44,4%.
Кроме того, Grok 4 получил 15,9% балл на тесте Arc-Agi-2, эталон распознавания образцов, почти удвоив предыдущий коммерческий современный балл Claude Opus 4.
GROK 4 также превосходит в индексе интеллекта искусственного анализа, превосходящего OPE O3 и Gemini 2.5 Pro и превосходит кодирование и математику.
Это сильная демонстрация силы Грока 4 в сложных рассуждениях и академических задачах - краеугольным камнем его дизайна. Способность модели «мыслить» в течение секунд до минут, исправлять ошибки и исследовать альтернативы, отражает человеческое решение проблем.
По словам XAI, Grok 4 «Использовал Colossus, наш кластер 200 000 графических процессоров, для проведения обучения подкреплению обучения, которое усовершенствовает способности Грока в предварительном масштабе».
Он использует инновации «включая новую инфраструктуру и алгоритмическую работу, которая повышала эффективность вычислительной эффективности нашего обучения в 6x, а также массовые усилия по сбору данных, где мы значительно расширили наши проверенные данные об обучении из в основном данных по математике и кодированию до многих других доменов».
Grok 4 представляет надежную мультимодальную поддержку, обработку текста и изображения с планами видео и аудио интеграции к концу 2025 года.
Компания заявляет, что будет «продолжать масштабировать подкрепление обучения до беспрецедентных уровней, опираясь на достижения Grok 4, чтобы раздвинуть границы искусственного интеллекта».
Там также также планирует «расширить объем, которые можно проверить вознаграждения в контролируемых доменах, до решения сложных реальных проблем, где модели могут учиться и адаптироваться в динамических средах» с мультимодальными возможностями, интегрирующими зрение, аудио и большее значение для постоянных улучшений «для более интуитивных взаимодействий».
Grok 4 Heavy, доступный через Supergrok Supergrok Supergrok за 300 долларов в месяц, использует уникальный подход, порождающий несколько агентов искусственного интеллекта для совместной решения проблем, сродни «исследовательской группе», сравнивая решения для оптимальных результатов.
Голосовой режим Grok 4, в котором участвует британский помощник по имени EVE, предлагает естественные разговоры в реальном времени, улучшение доступности и вовлечение пользователей.
Несмотря на впечатляющие сильные стороны, Grok 4 не без проблем и ограничений, как отмечает Data Science Dojo.
Во -первых, есть проблема скорости. Особенно для многоагентной «тяжелой» модели задержка может быть заметной. Во -вторых, его визуальные рассуждения все еще не хватает. В то время как он поддерживает изображения, возможности Vision Grok 4 по -прежнему отстают от выделенных моделей, таких как Gemini или Claude Opus. В -третьих, XAI еще есть работа с точки зрения масштабируемости. Управление совместными агентами в масштабе (в Grok 4 Heavy) является сложным и все еще развивающимся.
Несмотря на это, Xai продвигается вперед и имеет большие планы.
Мы можем ожидать специализированных моделей, таких как подход Openai, с целенаправленными версиями для кодирования, мультимодального поколения и даже видео -рассуждений. Также вероятность того, что меньшие варианты Grok могут быть открыты для поддержки исследований и прозрачности (так же, как Маск с Hyperloop). Маск также рассматривает Грока как шаг к AGI, с человеческим взаимодействием, способным объединить ИИ с людьми для решения жестких научных и социальных проблем.
Запуск Grok 4 был омрачен спорами, окружающими его предшественника, Grok 3, который разместил антисемитный содержание и похвалил Адольфа Гитлера за X. Эти инциденты, связанные с чрезмерным содействием Гроком с подсказками пользователей и системой, поощряющими «политически неправильные» ответы, вызвало серьезные опасения по поводу его безопасности и оправдания. С тех пор XAI работал над исправлением проблемы и внедрила меры по запрету ненависти к речи, но отсутствие прозрачности привело к большому скептицизму в настоящее время, тем более что модель все еще уязвима для манипуляций и галлюцинаций.
Премиальные цены GROK 4, в частности, SuperGrok SuperGrok SuperGrok, ограничивая доступность для небольших организаций и отдельных исследователей. Если это не изменится, платформа останется недоступной для многих из тех, кто в ней больше всего нуждается.
Grok 4 по-прежнему борется с рассуждениями за здравый смысл и реальным применением в отношении решения проблем. Несмотря на то, что платформа невероятно впечатляет, все еще есть место для улучшения, и потребители продолжают рассчитывать на последовательные модели, которые нарушают новые границы и открывают новые возможности. Вопрос заключается в том, какая компания зарекомендовала себя как лидер отрасли.
Оригинал