Прощайте, GPT-3.5, новая мини-модель искусственного интеллекта OpenAI GPT-4o — это компактная мощность

Прощайте, GPT-3.5, новая мини-модель искусственного интеллекта OpenAI GPT-4o — это компактная мощность

20 июля 2024 г.

В OpenAI добавлена ​​новая модель большого языка (LLM) под названием GPT-4o. mini в ChatGPT и его API. Как следует из названия, модель GPT-4o Mini представляет собой уменьшенную версию GPT-4o, представленная в мае. Мини-модель разработана, чтобы сбалансировать мощность GPT-4o с более экономичным подходом.

GPT-4o mini имеет большую часть функциональности своего более крупного брата, хотя API на данный момент поддерживает только текст и изображение, а входы и выходы изображений, видео и аудио все еще находятся в разработке. Как и GPT-4o, новая модель имеет контекстное окно на 128 000 токенов, что в восемь раз больше, чем у GPT-3.5 Turbo. Новая модель также оснащена улучшенными функциями безопасности. Помимо тех, которые уже встроены в GPT-4o, в GPT-4o mini добавлены новые методы, которые делают его более устойчивым к взломам и неправильным быстрым инъекциям, а также к другим проблемам, касающимся разработчиков, стремящихся широко развернуть AI API.

Готов к более масштабным работам

OpenAI предполагает, что большее контекстное окно и другие обновления, такие как улучшенное понимание неанглоязычного текста, сделают GPT-4o mini особенно полезным для обработки больших документов или связывания нескольких взаимодействий с моделью искусственного интеллекта. Например, он может предоставлять более качественные рекомендации в интернет-магазинах, ускорять текстовые ответы в режиме реального времени для службы поддержки клиентов и давать точные и подробные ответы студентам, готовящимся к экзамену, быстрее, чем другие модели. У OpenAI есть видение GPT-4o для автоматизации и оптимизации бизнес-процессов благодаря его способности получать данные и выполнять действия с внешними системами. Для предприятий, использующих API, стоимость значительно снижается до чуть более половины цены за токен GPT-3.5 Turbo.

«OpenAI стремится сделать интеллект максимально доступным», OpenAI объяснено в своем объявлении. «Мы ожидаем, что GPT-4o mini значительно расширит спектр приложений, созданных с помощью искусственного интеллекта, сделав интеллект намного более доступным».

GPT-4o mini является частью недавней волны более мелких LLM, таких как Gemini Flash от Google и Claude Haiku от Anthropic. Однако, по мнению OpenAI, GPT-4o mini превосходит их во многих стандартных тестах. Модель набрала 82% в тесте Massive Multitask Language Analysis (MMLU) по сравнению с 77,9% и 73,8% у Gemini Flash и Haiku соответственно. То же самое касается тестов MGSM и Human Eval, где GPT-4o Mini набрал 87% и 87,2%, Gemini Flash — 75,5% и 71,5%, а Haiku — 71,7% и 75,9%. Другими словами, GPT-4o Mini выигрывает в понимании текста, а также в математических задачах и задачах кодирования, как видно на графике ниже. 

 GPT-4o Mini Eval

(Изображение предоставлено OpenAI)

Основные планы мини-модели

По мнению OpenAI, внедрение GPT-4o Mini представляет собой значительный шаг на пути к тому, чтобы сделать продвинутый искусственный интеллект более доступным и доступным. Снижение затрат и повышение производительности, вероятно, помогут внедрить искусственный интеллект в повседневные приложения. То же самое касается пользователей ChatGPT, которые смогут получить доступ к модели начиная с этой недели. OpenAI также планирует реализовать возможности тонкой настройки GPT-4o Mini в API.

Более широкая картина показывает еще один шаг в развитии услуг ChatGPT. Поскольку OpenAI постепенно отказывается от GPT-3.5 для ChatGPT, фокус смещается на следующий этап предоставления более мощных моделей. OpenAI Генеральный директор Сэм Альтман уже давно намекал на как GPT-5 "существенно улучшит" существующие модели. В то же время утекла информация об OpenAI Вам также может понравиться...


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE