Китайская модель искусственного интеллекта обещает Gemini 2,5 Pro Level Performance на четверть от стоимости

Китайская модель искусственного интеллекта обещает Gemini 2,5 Pro Level Performance на четверть от стоимости

23 июня 2025 г.

Привет, энтузиасты ИИ!

Добро пожаловать в двадцать четвертое издание"На этой неделе в области искусственного интеллекта"!

На этой неделе Spotlight сияет на Minimax, китайском стартапе искусственного интеллекта, который только что выпустил модель рассуждений с открытым весом на границе, Minimax-M1, с некоторыми потрясающими тестами. Мы также видели, как Google представила новый вариант Flash-Lite, который быстрее и дешевле. Между тем, Kimi-DEV-72B появляется как одна из самых сильных моделей кодирования с открытым исходным кодом, нацеленной на реальную отладку рабочих процессов с архитектурой с двумя агентами.

Как всегда, мы завершим вещи с помощью инструментов и релизов, которые заслуживают вашего внимания.


Minimax-M1 безумен

Китайский стартап MinimaxВернулся в центре внимания с их новой моделью рассуждений с открытым весом, Minimax-M1, и это не что иное, как впечатляющий. M1 поддерживает контекстное окно в 1 миллион токена, ставя его в тот же класс, что и Gemini 2.5 Pro. Но вот кикер: благодаря своей гибридной архитектуре смеси экспертов и механизму внимания молнии он достигает того же качества рассуждений, что и DeepSeek R1, всего 25% от затрат на вычисление. И да, это полностью открытый.

  • Варианты и тесты
    Minimax-M1 поставляется в двух вариантах: M1-40K и M1-80K, ссылаясь на их выходные возможности токена. Оба построены на основе параметра 456B Minimax-Text-01, а всего 45,9b активировано на токен. Эта архитектура MOE делает вывод дешевле и быстрее.
  • На AIME 2024, M1-80K забил86,0%точность. Он также зарегистрировался:
    • 65,0%на Livecodebench
    • 56,0%На Swe-Bench проверился
    • 62,8%на Тау-Бенке
    • 73,4%On Openai MRCR (версия 4-needle)
  • Эти результаты ставят его впереди QWEN3-235B и DeepSeek R1 на задачах рассуждений с длинным контекстом и программным обеспечением.

Стоимость обучения

  • Наиболее шокирующая деталь - это обучение на сумму всего 534 700 долларов, используя 512 графических процессоров NVIDIA H800 в течение трех недель. Сравните это с трубопроводами Deepseek в размере 5,6 млн. Долл. США или конвейера Openai на сто миллионов долларов, и вы понимаете, насколько агрессивно оптимизируется минимакс для экономической эффективности без ущерба для производительности.

Открытый доступ и функции разработчика

  • Minimax-M1 включает в себя структурированную функцию вызова, чат-боты с поддержкой поиска, генерацию изображений/видео и клонирование голоса через API. Для развертывания он поддерживает VLLM и Backends на основе Transformers для готовой к предприятию.
  • Это огромная победа для пограничных моделей с открытым доступом, особенно для рабочих процессов с длинным контекстом и разработки агентов.

Минимакс еще не сделан: встретить Hailuo 02

  • Сразу после сброса M1 они также выпустилиHALUO 02их самая продвинутая модель текста к видео и модели изображения к Video, и она поворачивает головы.
  • Благодаря 6-секундным клипам в 768P и нативной поддержкой подробных подсказок, Hailuo обеспечивает физически последовательные, визуально острые и исторические результаты, которые конкурируют даже VEO 3 Google.
  • Что действительно отличает его, так это реалистичное движение и управление камерой. Подумайте о точной гравитации, столкновениях, жидкости. И цены тоже конкурентоспособны. При $ 0,25 за 6S клип или 0,52 долл. США за 10 с, он дешевле, чем большинство закрытых моделей с этим уровнем верности.
  • Minimax также отправляет API с Hailuo, что облегчает интеграцию разработчиков. Если вы создаете для VFX, кинематографического контента или интерактивных историй, это стоит тестового прогона.

Gemini 2.5 Flash-lite: самый дешевый Google

Google официально сделалGemini 2.5 Pro и FlashОбычно доступно для производственного использования. Эти модели гибридных рассуждений уже были развернуты такими партнерами, как Snap, Rooms и SmartBear. Но настоящей мощностью является новый флэш-лит Gemini 2.5, который теперь находится в предварительном просмотре. Это самая быстрая и самая дешевая модель в семье 2.5. Несмотря на это, он превосходит Flash-Lite Gemini 2.0 в кодировании, математике, рассуждениях, науке и мультимодальных критериях.

Поддержка флэш-лита:

  • Использование инструмента с помощью выполнения кода и поиска Google
  • Мультимодальный ввод (текст, изображения, аудио)
  • Длина контекста в 1 миллион
  • Высокопроизводительные задачи с низкой задержкой, такие как классификация, перевод и извлечение данных
  • Модель сейчас живет в Google AI Studio, Vertex AI и в приложении Gemini. Ранние демонстрации включают преобразование PDF в интерактивные панели мониторинга и автоматизацию аналитических отчетов из неструктурированного текста.
  • Flash-Lite Gemini 2.5 является сильным претендентом для помощников ИИ в режиме реального времени и широкого внутреннего инструмента.

Лучшая открытая модель кодирования еще?

Moonshot AI новый Kimi-Dev-72BПросто нажмите на 60,4% по проверке SWE-Bench, что делает его самой сильной моделью кодирования с открытым весом прямо сейчас. Что отличает Кими-дев, так это его настройка с двойным агентом. Модель использует два специализированных агента:

  • Bugfixer, который идентифицирует и исправляет неисправный код
  • Тест, который генерирует модульные тесты для подтверждения и предотвращения регрессий
  • Оба агента выполняют 2-ступенчатую подпрограмму локализации файлов и точных кодовых изменений. Модель обучена более 150B токенам реальных проблем Github и PR, а затем настраивается с помощью обучения подкрепления и механизма самостоятельного использования для выполнения сложных задач отладки.
  • Что выделяется, так это его система вознаграждения на основе результатов и тренировочный трубопровод в стиле учебного плана, который повышает показатели успеха за счет фильтрации слабых подсказок и усиления правильных решений.
  • Он доступен на GitHub и обнимающемся лице с весами модели, исходным кодом и полным техническим отчетом. Если вы создаете автоматический обзор кода, отладку или инструменты агента разработчиков, это серьезный претендент.

ВИДЕО AI становится диким: Kling & Midjourney

  • Если вы думали, что видео ИИ не может стать больше кинематографического, подождите, пока вы это увидите. Китайский стартап Klingaiсбросил студийную в стиле Ghibli Short, в комплекте с нарисованными вручную текстур, мечтательными движениями. Они также поделились некоторыми видео ASMR. Время, ритм, SFX идеально соответствует.
  • Тем временем Midjourney только что открыл свойV1 Video Model, превращение любого изображения в стилизованную анимацию. Вы можете управлять интенсивностью движения, выбираете «низкое» или «высокое» движение и даже настраиваете темп. Единственный улов - это в 8 раз больше кредитов, чем обычное изображение Gen. Но для создателей, которые уже любят эстетику Мидюрни, это может стоить цены.

Инструменты и релизы, о которых вы должны знать

Платформа единорогаявляется AI-Pirst Builder, адаптированным для инди-создателей, стартапов и основателей SaaS. Он поставляется с шаблонами перетаскивания, копирайтингом с AI и встроенным переводом, оптимизированными для быстрого развертывания. Платформа также включает в себя SSL, CDN, SEO -инструменты и интеграции для форм и информационных бюллетеней. Бесплатный план включает в себя один живой сайт, в то время как платные планы разблокируют функции команды и несколько проектов.

CodingFleet'S Python Code Generator оптимизирует разработку, превращая инструкции естественного языка в готовый к производству код через интуитивно понятный интерфейс. Инструмент поддерживает более 60 языков программирования и фреймворков. Пользователи просто описывают свои требования на простом английском языке, и CodingFleet обеспечивает чистые, документированные фрагменты кода с руководством по реализации. Это создано для разработчиков, которые хотят быстрых, точных выходов в стеках.

**Aircodum** Позволяет разработчикам беспрепятственно взаимодействовать со своей средой кодирования, используя команды Touch, Voice и пользовательские клавиатуры. С помощью Aircodum пользователи могут передавать файлы, изображения и фрагменты кода между их мобильными устройствами и без усилий VS.


И это завершает этот вопрос "На этой неделе в искусственном интеллекте."

Спасибо за настройку! Обязательно поделитесь этим информационным бюллетенем со своими коллегами -энтузиастами искусственного интеллекта и следите за тем, как для более еженедельных обновлений.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE