Обзор OpenAI: модель o3 завершает 12 дней анонсов
27 декабря 2024 г.Следующим шагом для моделей рассуждений OpenAI является o3, анонсированная 20 декабря модель. o3 и ее младший брат o3-mini превзошли o1 в тестах на кодирование, математику, науку и «концептуальное рассуждение», разработанных для оценки человеческого интеллекта и исследовательских приложений. «Рассуждение» включает в себя функцию безопасности, называемую делиберативным выравниванием, в которой модель использует «цепочку мыслей», чтобы не дать пользователям взломать ее или обмануть, чтобы обойти меры безопасности.
Между тем, экспериментальная модель Gemini 2.0 Flash Thinking от Google имеет схожие возможности с рассуждениями OpenAI o1.
«12 дней OpenAI» представляет новые инструменты и новые функции генеративного ИИ
Анонс o3 пришелся на конец кампании OpenAI «12 дней OpenAI», праздничной серии обновлений продуктов. Эти анонсы, с 5 по 20 декабря (исключая выходные), демонстрировали новые функции для инструментов генеративного ИИ OpenAI, некоторые из которых уже доступны, а другие все еще тестируются.
День 1: обновления ChatGPT Pro и o1 за 200 долларов
5 декабря OpenAI представила новый уровень подписки для ChatGPT: план Pro. За $200 в месяц подписка Pro добавляет OpenAI o1, o1-mini, GPT-4o и Advanced Voice в ChatGPT. Она также позволяет получить доступ к режиму o1 pro, более ресурсоемкой версии, разработанной для сложных задач, с которыми сталкиваются профессиональные инженеры и исследователи.
В тот же день OpenAI анонсировала обновленную, более подробную системную карту для долгожданной модели o1.
День 2: Исследовательская программа тонкой настройки подкрепления
С программой исследований тонкой настройки подкрепления OpenAI представила новый инструмент для разработчиков и инженеров машинного обучения, позволяющий создавать индивидуальные модели для конкретных задач. Ожидается, что он будет запущен публично в альфа-тестировании в начале 2025 года.
День 3: Генератор видео Sora
Фотореалистичный видеогенератор OpenAI, анонсированный в начале прошлого года, теперь доступен для пользователей ChatGPT Pro. Хотя создание видео с помощью ИИ стало проще, чем когда-либо, такие модели, как Sora, все еще испытывают трудности со сложными, быстро движущимися объектами и часто могут быть идентифицированы по слишком идеальной глянцевитости. Видео Sora будут помечены водяными знаками в соответствии со стандартами C2PA, чтобы идентифицировать их как сгенерированные с помощью ИИ.
СМ.: Изучите основы генеративного ИИ с помощью некоторых из многочисленных бесплатных курсов, доступных от Microsoft и LinkedIn, обновленных по состоянию на 2024 год.
День 4: Холст
Canvas, интерфейс кодирования, представленный в бета-версии в октябре, стал общедоступным в декабре. Текущая версия Canvas понимает и пишет на Python и интегрируется с пользовательскими GPT, позволяя разработчикам подключаться к своим приложениям. Он также позволяет пользователям просматривать подсказки и выходные данные бок о бок для более удобного использования.
День 5: ИИ на устройствах Apple с ChatGPT
Apple Intelligence получил ожидаемое обновление ChatGPT в течение 12 дней OpenAI. Теперь Apple Intelligence на устройстве может получать доступ к серверам ChatGPT для более сложных запросов, которые встроенный чип не может обработать.
День 6: Расширенный голос с видео
Расширенный голосовой режим, доступный подписчикам ChatGPT, теперь может обсуждать изображения на экране компьютера или через камеру. Режим добавляет более естественную речь и гибкие ответы в аудиоверсию чат-бота.
День 7: Проекты
С 13 декабря пользователи ChatGPT Plus, Pro и Team могут организовывать свои чаты в Projects или отдельные экземпляры. Projects позволяют пользователям назначать конкретные инструкции, которые применяются только в Project, и соответствующие ресурсы могут храниться вместе с ним. Эта функция будет доступна пользователям Enterprise и Edu в январе.
День 8: Обновления поиска ChatGPT
Поиск ChatGPT получил несколько улучшений после декабрьского релиза, включая новый интерфейс карт, более быстрое время отклика на мобильных устройствах и больше функций для Advanced Voice, чтобы повысить скорость поиска до уровня остальных платных голосовых предложений. Поиск теперь доступен пользователям бесплатного уровня, если они входят в систему с адресом электронной почты.
День 9: Новые функции, опции и обновления для разработчиков
Девятый день был полностью посвящен разработчикам и включал ряд объявлений:
- Разработчики теперь могут получить доступ к OpenAI o1 в API.
Были выпущены различные обновления для API, включая более простую интеграцию WebRTC, снижение цены на аудио GPT-4o на 60% и поддержку GPT-4o mini на одной десятой от предыдущих скоростей аудио.
Тонкая настройка предпочтений позволяет улучшить настройку.
Go и Java SDK теперь доступны в бета-версии.
День 10: 1-800-CHATGPT
Взяв пример с классического голосового поиска Google, OpenAI открыла телефонную линию и линию WhatsApp для своего генеративного ИИ. Пользователи могут задавать вопросы на естественном языке, а чат-бот будет отвечать бесплатно. OpenAI считает эту функцию экспериментальной, отмечая, что ее доступность и ограничения могут измениться.
День 11: Больше возможностей для приложений
День 11 принес длинный список подключений ChatGPT к большему количеству приложений и инструментов для кодирования, включая форки VS Code, IDE Jetbrains, дополнительные приложения Terminal и многое другое. (Изначально он поддерживал iTerm 2, Terminal, TextEdit, VS Code и Xcode.) Появились три новых интеграции приложений, подключающие ChatGPT к Apple Notes, Notion и Quip. Расширенный голосовой режим теперь может работать с различными другими настольными приложениями по выбору пользователя.
OpenAI отмечает, что ChatGPT не будет взаимодействовать с настольными приложениями без разрешения пользователя.
Кроме того, пользователи Pro, Team, Enterprise и Edu могут использовать новые интеграции приложений.
День 12: o3 и o3-mini
OpenAI оставила самую большую новость напоследок: o1 больше не является передовой моделью компании. Вместо этого o3 — теперь в раннем доступе для исследователей безопасности — улучшает производительность кодирования, математики и науки. Компания также разработала новую технику, называемую совещательным выравниванием, которая используется для поддержания o3 на задании. Исследователи безопасности могут подать заявку на тестирование o3 здесь.
Оригинал