
Китайская модель искусственного интеллекта обещает Gemini 2,5 Pro Level Performance на четверть от стоимости
23 июня 2025 г.Привет, энтузиасты ИИ!
Добро пожаловать в двадцать четвертое издание"На этой неделе в области искусственного интеллекта"!
На этой неделе Spotlight сияет на Minimax, китайском стартапе искусственного интеллекта, который только что выпустил модель рассуждений с открытым весом на границе, Minimax-M1, с некоторыми потрясающими тестами. Мы также видели, как Google представила новый вариант Flash-Lite, который быстрее и дешевле. Между тем, Kimi-DEV-72B появляется как одна из самых сильных моделей кодирования с открытым исходным кодом, нацеленной на реальную отладку рабочих процессов с архитектурой с двумя агентами.
Как всегда, мы завершим вещи с помощью инструментов и релизов, которые заслуживают вашего внимания.
Minimax-M1 безумен
Китайский стартап MinimaxВернулся в центре внимания с их новой моделью рассуждений с открытым весом, Minimax-M1, и это не что иное, как впечатляющий. M1 поддерживает контекстное окно в 1 миллион токена, ставя его в тот же класс, что и Gemini 2.5 Pro. Но вот кикер: благодаря своей гибридной архитектуре смеси экспертов и механизму внимания молнии он достигает того же качества рассуждений, что и DeepSeek R1, всего 25% от затрат на вычисление. И да, это полностью открытый.
- Варианты и тесты
Minimax-M1 поставляется в двух вариантах: M1-40K и M1-80K, ссылаясь на их выходные возможности токена. Оба построены на основе параметра 456B Minimax-Text-01, а всего 45,9b активировано на токен. Эта архитектура MOE делает вывод дешевле и быстрее. - На AIME 2024, M1-80K забил86,0%точность. Он также зарегистрировался:
- 65,0%на Livecodebench
- 56,0%На Swe-Bench проверился
- 62,8%на Тау-Бенке
- 73,4%On Openai MRCR (версия 4-needle)
- Эти результаты ставят его впереди QWEN3-235B и DeepSeek R1 на задачах рассуждений с длинным контекстом и программным обеспечением.
Стоимость обучения
- Наиболее шокирующая деталь - это обучение на сумму всего 534 700 долларов, используя 512 графических процессоров NVIDIA H800 в течение трех недель. Сравните это с трубопроводами Deepseek в размере 5,6 млн. Долл. США или конвейера Openai на сто миллионов долларов, и вы понимаете, насколько агрессивно оптимизируется минимакс для экономической эффективности без ущерба для производительности.
Открытый доступ и функции разработчика
- Minimax-M1 включает в себя структурированную функцию вызова, чат-боты с поддержкой поиска, генерацию изображений/видео и клонирование голоса через API. Для развертывания он поддерживает VLLM и Backends на основе Transformers для готовой к предприятию.
- Это огромная победа для пограничных моделей с открытым доступом, особенно для рабочих процессов с длинным контекстом и разработки агентов.
Минимакс еще не сделан: встретить Hailuo 02
- Сразу после сброса M1 они также выпустилиHALUO 02их самая продвинутая модель текста к видео и модели изображения к Video, и она поворачивает головы.
- Благодаря 6-секундным клипам в 768P и нативной поддержкой подробных подсказок, Hailuo обеспечивает физически последовательные, визуально острые и исторические результаты, которые конкурируют даже VEO 3 Google.
- Что действительно отличает его, так это реалистичное движение и управление камерой. Подумайте о точной гравитации, столкновениях, жидкости. И цены тоже конкурентоспособны. При $ 0,25 за 6S клип или 0,52 долл. США за 10 с, он дешевле, чем большинство закрытых моделей с этим уровнем верности.
- Minimax также отправляет API с Hailuo, что облегчает интеграцию разработчиков. Если вы создаете для VFX, кинематографического контента или интерактивных историй, это стоит тестового прогона.
Gemini 2.5 Flash-lite: самый дешевый Google
Google официально сделалGemini 2.5 Pro и FlashОбычно доступно для производственного использования. Эти модели гибридных рассуждений уже были развернуты такими партнерами, как Snap, Rooms и SmartBear. Но настоящей мощностью является новый флэш-лит Gemini 2.5, который теперь находится в предварительном просмотре. Это самая быстрая и самая дешевая модель в семье 2.5. Несмотря на это, он превосходит Flash-Lite Gemini 2.0 в кодировании, математике, рассуждениях, науке и мультимодальных критериях.
Поддержка флэш-лита:
- Использование инструмента с помощью выполнения кода и поиска Google
- Мультимодальный ввод (текст, изображения, аудио)
- Длина контекста в 1 миллион
- Высокопроизводительные задачи с низкой задержкой, такие как классификация, перевод и извлечение данных
- Модель сейчас живет в Google AI Studio, Vertex AI и в приложении Gemini. Ранние демонстрации включают преобразование PDF в интерактивные панели мониторинга и автоматизацию аналитических отчетов из неструктурированного текста.
- Flash-Lite Gemini 2.5 является сильным претендентом для помощников ИИ в режиме реального времени и широкого внутреннего инструмента.
Лучшая открытая модель кодирования еще?
Moonshot AI новый Kimi-Dev-72BПросто нажмите на 60,4% по проверке SWE-Bench, что делает его самой сильной моделью кодирования с открытым весом прямо сейчас. Что отличает Кими-дев, так это его настройка с двойным агентом. Модель использует два специализированных агента:
- Bugfixer, который идентифицирует и исправляет неисправный код
- Тест, который генерирует модульные тесты для подтверждения и предотвращения регрессий
- Оба агента выполняют 2-ступенчатую подпрограмму локализации файлов и точных кодовых изменений. Модель обучена более 150B токенам реальных проблем Github и PR, а затем настраивается с помощью обучения подкрепления и механизма самостоятельного использования для выполнения сложных задач отладки.
- Что выделяется, так это его система вознаграждения на основе результатов и тренировочный трубопровод в стиле учебного плана, который повышает показатели успеха за счет фильтрации слабых подсказок и усиления правильных решений.
- Он доступен на GitHub и обнимающемся лице с весами модели, исходным кодом и полным техническим отчетом. Если вы создаете автоматический обзор кода, отладку или инструменты агента разработчиков, это серьезный претендент.
ВИДЕО AI становится диким: Kling & Midjourney
- Если вы думали, что видео ИИ не может стать больше кинематографического, подождите, пока вы это увидите. Китайский стартап Klingaiсбросил студийную в стиле Ghibli Short, в комплекте с нарисованными вручную текстур, мечтательными движениями. Они также поделились некоторыми видео ASMR. Время, ритм, SFX идеально соответствует.
- Тем временем Midjourney только что открыл свойV1 Video Model, превращение любого изображения в стилизованную анимацию. Вы можете управлять интенсивностью движения, выбираете «низкое» или «высокое» движение и даже настраиваете темп. Единственный улов - это в 8 раз больше кредитов, чем обычное изображение Gen. Но для создателей, которые уже любят эстетику Мидюрни, это может стоить цены.
Инструменты и релизы, о которых вы должны знать
Платформа единорогаявляется AI-Pirst Builder, адаптированным для инди-создателей, стартапов и основателей SaaS. Он поставляется с шаблонами перетаскивания, копирайтингом с AI и встроенным переводом, оптимизированными для быстрого развертывания. Платформа также включает в себя SSL, CDN, SEO -инструменты и интеграции для форм и информационных бюллетеней. Бесплатный план включает в себя один живой сайт, в то время как платные планы разблокируют функции команды и несколько проектов.
CodingFleet'S Python Code Generator оптимизирует разработку, превращая инструкции естественного языка в готовый к производству код через интуитивно понятный интерфейс. Инструмент поддерживает более 60 языков программирования и фреймворков. Пользователи просто описывают свои требования на простом английском языке, и CodingFleet обеспечивает чистые, документированные фрагменты кода с руководством по реализации. Это создано для разработчиков, которые хотят быстрых, точных выходов в стеках.
**Aircodum** Позволяет разработчикам беспрепятственно взаимодействовать со своей средой кодирования, используя команды Touch, Voice и пользовательские клавиатуры. С помощью Aircodum пользователи могут передавать файлы, изображения и фрагменты кода между их мобильными устройствами и без усилий VS.
И это завершает этот вопрос "На этой неделе в искусственном интеллекте."
Спасибо за настройку! Обязательно поделитесь этим информационным бюллетенем со своими коллегами -энтузиастами искусственного интеллекта и следите за тем, как для более еженедельных обновлений.
Оригинал