hackernoon-top-story artificial-intelligence machine-learning ai-models ai-coding-assistant ai-video-generation google-gemini minimax gemini-2.5-pro-alternatives

Китайская модель искусственного интеллекта обещает Gemini 2,5 Pro Level Performance на четверть от стоимости

23 июня 2025 г.

Привет, энтузиасты ИИ!

Добро пожаловать в двадцать четвертое издание"На этой неделе в области искусственного интеллекта"!

На этой неделе Spotlight сияет на Minimax, китайском стартапе искусственного интеллекта, который только что выпустил модель рассуждений с открытым весом на границе, Minimax-M1, с некоторыми потрясающими тестами. Мы также видели, как Google представила новый вариант Flash-Lite, который быстрее и дешевле. Между тем, Kimi-DEV-72B появляется как одна из самых сильных моделей кодирования с открытым исходным кодом, нацеленной на реальную отладку рабочих процессов с архитектурой с двумя агентами.

Как всегда, мы завершим вещи с помощью инструментов и релизов, которые заслуживают вашего внимания.

Minimax-M1 безумен

Китайский стартап MinimaxВернулся в центре внимания с их новой моделью рассуждений с открытым весом, Minimax-M1, и это не что иное, как впечатляющий. M1 поддерживает контекстное окно в 1 миллион токена, ставя его в тот же класс, что и Gemini 2.5 Pro. Но вот кикер: благодаря своей гибридной архитектуре смеси экспертов и механизму внимания молнии он достигает того же качества рассуждений, что и DeepSeek R1, всего 25% от затрат на вычисление. И да, это полностью открытый.

Варианты и тесты
Minimax-M1 поставляется в двух вариантах: M1-40K и M1-80K, ссылаясь на их выходные возможности токена. Оба построены на основе параметра 456B Minimax-Text-01, а всего 45,9b активировано на токен. Эта архитектура MOE делает вывод дешевле и быстрее.
На AIME 2024, M1-80K забил86,0%точность. Он также зарегистрировался:
- 65,0%на Livecodebench
- 56,0%На Swe-Bench проверился
- 62,8%на Тау-Бенке
- 73,4%On Openai MRCR (версия 4-needle)
Эти результаты ставят его впереди QWEN3-235B и DeepSeek R1 на задачах рассуждений с длинным контекстом и программным обеспечением.

Стоимость обучения

Наиболее шокирующая деталь - это обучение на сумму всего 534 700 долларов, используя 512 графических процессоров NVIDIA H800 в течение трех недель. Сравните это с трубопроводами Deepseek в размере 5,6 млн. Долл. США или конвейера Openai на сто миллионов долларов, и вы понимаете, насколько агрессивно оптимизируется минимакс для экономической эффективности без ущерба для производительности.

Открытый доступ и функции разработчика

Minimax-M1 включает в себя структурированную функцию вызова, чат-боты с поддержкой поиска, генерацию изображений/видео и клонирование голоса через API. Для развертывания он поддерживает VLLM и Backends на основе Transformers для готовой к предприятию.
Это огромная победа для пограничных моделей с открытым доступом, особенно для рабочих процессов с длинным контекстом и разработки агентов.

Минимакс еще не сделан: встретить Hailuo 02

Сразу после сброса M1 они также выпустилиHALUO 02их самая продвинутая модель текста к видео и модели изображения к Video, и она поворачивает головы.
Благодаря 6-секундным клипам в 768P и нативной поддержкой подробных подсказок, Hailuo обеспечивает физически последовательные, визуально острые и исторические результаты, которые конкурируют даже VEO 3 Google.
Что действительно отличает его, так это реалистичное движение и управление камерой. Подумайте о точной гравитации, столкновениях, жидкости. И цены тоже конкурентоспособны. При $ 0,25 за 6S клип или 0,52 долл. США за 10 с, он дешевле, чем большинство закрытых моделей с этим уровнем верности.
Minimax также отправляет API с Hailuo, что облегчает интеграцию разработчиков. Если вы создаете для VFX, кинематографического контента или интерактивных историй, это стоит тестового прогона.

Gemini 2.5 Flash-lite: самый дешевый Google

Google официально сделалGemini 2.5 Pro и FlashОбычно доступно для производственного использования. Эти модели гибридных рассуждений уже были развернуты такими партнерами, как Snap, Rooms и SmartBear. Но настоящей мощностью является новый флэш-лит Gemini 2.5, который теперь находится в предварительном просмотре. Это самая быстрая и самая дешевая модель в семье 2.5. Несмотря на это, он превосходит Flash-Lite Gemini 2.0 в кодировании, математике, рассуждениях, науке и мультимодальных критериях.

Поддержка флэш-лита:

Использование инструмента с помощью выполнения кода и поиска Google
Мультимодальный ввод (текст, изображения, аудио)
Длина контекста в 1 миллион
Высокопроизводительные задачи с низкой задержкой, такие как классификация, перевод и извлечение данных
Модель сейчас живет в Google AI Studio, Vertex AI и в приложении Gemini. Ранние демонстрации включают преобразование PDF в интерактивные панели мониторинга и автоматизацию аналитических отчетов из неструктурированного текста.
Flash-Lite Gemini 2.5 является сильным претендентом для помощников ИИ в режиме реального времени и широкого внутреннего инструмента.

Лучшая открытая модель кодирования еще?

Moonshot AI новый Kimi-Dev-72BПросто нажмите на 60,4% по проверке SWE-Bench, что делает его самой сильной моделью кодирования с открытым весом прямо сейчас. Что отличает Кими-дев, так это его настройка с двойным агентом. Модель использует два специализированных агента:

Bugfixer, который идентифицирует и исправляет неисправный код
Тест, который генерирует модульные тесты для подтверждения и предотвращения регрессий
Оба агента выполняют 2-ступенчатую подпрограмму локализации файлов и точных кодовых изменений. Модель обучена более 150B токенам реальных проблем Github и PR, а затем настраивается с помощью обучения подкрепления и механизма самостоятельного использования для выполнения сложных задач отладки.
Что выделяется, так это его система вознаграждения на основе результатов и тренировочный трубопровод в стиле учебного плана, который повышает показатели успеха за счет фильтрации слабых подсказок и усиления правильных решений.
Он доступен на GitHub и обнимающемся лице с весами модели, исходным кодом и полным техническим отчетом. Если вы создаете автоматический обзор кода, отладку или инструменты агента разработчиков, это серьезный претендент.

ВИДЕО AI становится диким: Kling & Midjourney

Если вы думали, что видео ИИ не может стать больше кинематографического, подождите, пока вы это увидите. Китайский стартап Klingaiсбросил студийную в стиле Ghibli Short, в комплекте с нарисованными вручную текстур, мечтательными движениями. Они также поделились некоторыми видео ASMR. Время, ритм, SFX идеально соответствует.
Тем временем Midjourney только что открыл свойV1 Video Model, превращение любого изображения в стилизованную анимацию. Вы можете управлять интенсивностью движения, выбираете «низкое» или «высокое» движение и даже настраиваете темп. Единственный улов - это в 8 раз больше кредитов, чем обычное изображение Gen. Но для создателей, которые уже любят эстетику Мидюрни, это может стоить цены.

Инструменты и релизы, о которых вы должны знать

Платформа единорогаявляется AI-Pirst Builder, адаптированным для инди-создателей, стартапов и основателей SaaS. Он поставляется с шаблонами перетаскивания, копирайтингом с AI и встроенным переводом, оптимизированными для быстрого развертывания. Платформа также включает в себя SSL, CDN, SEO -инструменты и интеграции для форм и информационных бюллетеней. Бесплатный план включает в себя один живой сайт, в то время как платные планы разблокируют функции команды и несколько проектов.

CodingFleet'S Python Code Generator оптимизирует разработку, превращая инструкции естественного языка в готовый к производству код через интуитивно понятный интерфейс. Инструмент поддерживает более 60 языков программирования и фреймворков. Пользователи просто описывают свои требования на простом английском языке, и CodingFleet обеспечивает чистые, документированные фрагменты кода с руководством по реализации. Это создано для разработчиков, которые хотят быстрых, точных выходов в стеках.

**Aircodum** Позволяет разработчикам беспрепятственно взаимодействовать со своей средой кодирования, используя команды Touch, Voice и пользовательские клавиатуры. С помощью Aircodum пользователи могут передавать файлы, изображения и фрагменты кода между их мобильными устройствами и без усилий VS.

И это завершает этот вопрос "На этой неделе в искусственном интеллекте."

Спасибо за настройку! Обязательно поделитесь этим информационным бюллетенем со своими коллегами -энтузиастами искусственного интеллекта и следите за тем, как для более еженедельных обновлений.

Оригинал

Китайская модель искусственного интеллекта обещает Gemini 2,5 Pro Level Performance на четверть от стоимости

Minimax-M1 безумен

Минимакс еще не сделан: встретить Hailuo 02

Gemini 2.5 Flash-lite: самый дешевый Google

Лучшая открытая модель кодирования еще?

ВИДЕО AI становится диким: Kling & Midjourney

Инструменты и релизы, о которых вы должны знать

Recent Post

Когда ИИ становится посредником в семейных спорах о наследстве

Конец общей аннотации в здравоохранении: визуализация сердца показывает, почему

Действительно ли запрет крипто банкоматов о защите людей - или защите банков?

5 Рабочие процессы агента AI для повторяемого успеха (включен код)

Почему OCR борется со страницами с несколькими колоннами

Categories