Обзор OpenAI: модель o3 завершает 12 дней анонсов

27 декабря 2024 г.

Следующим шагом для моделей рассуждений OpenAI является o3, анонсированная 20 декабря модель. o3 и ее младший брат o3-mini превзошли o1 в тестах на кодирование, математику, науку и «концептуальное рассуждение», разработанных для оценки человеческого интеллекта и исследовательских приложений. «Рассуждение» включает в себя функцию безопасности, называемую делиберативным выравниванием, в которой модель использует «цепочку мыслей», чтобы не дать пользователям взломать ее или обмануть, чтобы обойти меры безопасности.

Между тем, экспериментальная модель Gemini 2.0 Flash Thinking от Google имеет схожие возможности с рассуждениями OpenAI o1.

«12 дней OpenAI» представляет новые инструменты и новые функции генеративного ИИ

Анонс o3 пришелся на конец кампании OpenAI «12 дней OpenAI», праздничной серии обновлений продуктов. Эти анонсы, с 5 по 20 декабря (исключая выходные), демонстрировали новые функции для инструментов генеративного ИИ OpenAI, некоторые из которых уже доступны, а другие все еще тестируются.

День 1: обновления ChatGPT Pro и o1 за 200 долларов

5 декабря OpenAI представила новый уровень подписки для ChatGPT: план Pro. За $200 в месяц подписка Pro добавляет OpenAI o1, o1-mini, GPT-4o и Advanced Voice в ChatGPT. Она также позволяет получить доступ к режиму o1 pro, более ресурсоемкой версии, разработанной для сложных задач, с которыми сталкиваются профессиональные инженеры и исследователи.

В тот же день OpenAI анонсировала обновленную, более подробную системную карту для долгожданной модели o1.

День 2: Исследовательская программа тонкой настройки подкрепления

С программой исследований тонкой настройки подкрепления OpenAI представила новый инструмент для разработчиков и инженеров машинного обучения, позволяющий создавать индивидуальные модели для конкретных задач. Ожидается, что он будет запущен публично в альфа-тестировании в начале 2025 года.

День 3: Генератор видео Sora

Фотореалистичный видеогенератор OpenAI, анонсированный в начале прошлого года, теперь доступен для пользователей ChatGPT Pro. Хотя создание видео с помощью ИИ стало проще, чем когда-либо, такие модели, как Sora, все еще испытывают трудности со сложными, быстро движущимися объектами и часто могут быть идентифицированы по слишком идеальной глянцевитости. Видео Sora будут помечены водяными знаками в соответствии со стандартами C2PA, чтобы идентифицировать их как сгенерированные с помощью ИИ.

СМ.: Изучите основы генеративного ИИ с помощью некоторых из многочисленных бесплатных курсов, доступных от Microsoft и LinkedIn, обновленных по состоянию на 2024 год.

День 4: Холст

Canvas, интерфейс кодирования, представленный в бета-версии в октябре, стал общедоступным в декабре. Текущая версия Canvas понимает и пишет на Python и интегрируется с пользовательскими GPT, позволяя разработчикам подключаться к своим приложениям. Он также позволяет пользователям просматривать подсказки и выходные данные бок о бок для более удобного использования.

День 5: ИИ на устройствах Apple с ChatGPT

Apple Intelligence получил ожидаемое обновление ChatGPT в течение 12 дней OpenAI. Теперь Apple Intelligence на устройстве может получать доступ к серверам ChatGPT для более сложных запросов, которые встроенный чип не может обработать.

День 6: Расширенный голос с видео

Расширенный голосовой режим, доступный подписчикам ChatGPT, теперь может обсуждать изображения на экране компьютера или через камеру. Режим добавляет более естественную речь и гибкие ответы в аудиоверсию чат-бота.

День 7: Проекты

С 13 декабря пользователи ChatGPT Plus, Pro и Team могут организовывать свои чаты в Projects или отдельные экземпляры. Projects позволяют пользователям назначать конкретные инструкции, которые применяются только в Project, и соответствующие ресурсы могут храниться вместе с ним. Эта функция будет доступна пользователям Enterprise и Edu в январе.

День 8: Обновления поиска ChatGPT

Поиск ChatGPT получил несколько улучшений после декабрьского релиза, включая новый интерфейс карт, более быстрое время отклика на мобильных устройствах и больше функций для Advanced Voice, чтобы повысить скорость поиска до уровня остальных платных голосовых предложений. Поиск теперь доступен пользователям бесплатного уровня, если они входят в систему с адресом электронной почты.

День 9: Новые функции, опции и обновления для разработчиков

Девятый день был полностью посвящен разработчикам и включал ряд объявлений:

Разработчики теперь могут получить доступ к OpenAI o1 в API. Были выпущены различные обновления для API, включая более простую интеграцию WebRTC, снижение цены на аудио GPT-4o на 60% и поддержку GPT-4o mini на одной десятой от предыдущих скоростей аудио. Тонкая настройка предпочтений позволяет улучшить настройку. Go и Java SDK теперь доступны в бета-версии.

День 10: 1-800-CHATGPT

Взяв пример с классического голосового поиска Google, OpenAI открыла телефонную линию и линию WhatsApp для своего генеративного ИИ. Пользователи могут задавать вопросы на естественном языке, а чат-бот будет отвечать бесплатно. OpenAI считает эту функцию экспериментальной, отмечая, что ее доступность и ограничения могут измениться.

День 11: Больше возможностей для приложений

День 11 принес длинный список подключений ChatGPT к большему количеству приложений и инструментов для кодирования, включая форки VS Code, IDE Jetbrains, дополнительные приложения Terminal и многое другое. (Изначально он поддерживал iTerm 2, Terminal, TextEdit, VS Code и Xcode.) Появились три новых интеграции приложений, подключающие ChatGPT к Apple Notes, Notion и Quip. Расширенный голосовой режим теперь может работать с различными другими настольными приложениями по выбору пользователя.

OpenAI отмечает, что ChatGPT не будет взаимодействовать с настольными приложениями без разрешения пользователя.

Кроме того, пользователи Pro, Team, Enterprise и Edu могут использовать новые интеграции приложений.

День 12: o3 и o3-mini

OpenAI оставила самую большую новость напоследок: o1 больше не является передовой моделью компании. Вместо этого o3 — теперь в раннем доступе для исследователей безопасности — улучшает производительность кодирования, математики и науки. Компания также разработала новую технику, называемую совещательным выравниванием, которая используется для поддержания o3 на задании. Исследователи безопасности могут подать заявку на тестирование o3 здесь.

Подпишитесь на рассылку Innovation Insider Узнайте о последних технологических инновациях, которые меняют мир, включая IoT, 5G, последние новости о телефонах, безопасности, умных городах, ИИ, робототехнике и многом другом. Доставка по вторникам и пятницам Адрес электронной почты Подписываясь на нашу рассылку, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности. Вы можете отписаться в любое время. Подписаться

Оригинал