Чат-бот DeepSeek обошел OpenAI в рейтинге App Store
28 января 2025 г.На выходных китайская компания DeepSeek, занимающаяся разработкой искусственного интеллекта, выпустила приложение для чата на основе искусственного интеллекта, включающее в себя модель «рассуждения» искусственного интеллекта, сопоставимую с моделью o1 от OpenAI, что вызвало переполох среди американских компаний, занимающихся разработкой искусственного интеллекта, поскольку DeepSeek поднялся на вершину App Store компании Apple.
DeepSeek — это компания из Ханчжоу, Китай, предоставляющая генеративные модели ИИ и интеграцию ИИ. Ее первые продукты, которые произвели фурор на американском рынке, — это GPT-4-подобные DeepSeek-V3 и R1, усовершенствованная «модель рассуждения». Как и ChatGPT, DeepSeek-V3 и R1 быстро отвечают на подсказки на естественном языке.
Акции NVIDIA и Microsoft упали в понедельник после шумного дебюта. В целом фондовый рынок отразил внезапное падение доверия к американским производителям ИИ. Успех DeepSeek вызвал разговоры о том, ограничивают ли или поощряют конкуренцию ограничения США на доступ Китая к чипам ИИ.
Для технических специалистов DeepSeek предлагает еще один вариант написания кода или повышения эффективности повседневных задач. Помимо того, что модель DeepSeek R1 может объяснить свои рассуждения, она основана на семействе моделей с открытым исходным кодом, к которым можно получить доступ на GitHub.
Чем примечателен DeepSeek?
Как и o1 от OpenAI (ранее известный как Strawberry), модель рассуждений замедляет свои возможности прогнозирования, чтобы «продумать» свою работу, что помогает ей давать более точные ответы. В частности, модели рассуждений показали хорошие результаты в тестах по математике и кодированию.
DeepSeek сообщил, что DeepSeek-V3 показал более высокие результаты, чем GPT-4o, на тестах MMLU и HumanEval — двух из серии оценок, сравнивающих ответы ИИ.
DeepSeek заявила, что обучение одной из ее моделей обошлось в 5,6 млн долларов, что составляет лишь малую часть тех денег, которые часто тратятся на аналогичные проекты в Кремниевой долине.
DeepSeek-V3 и R1 доступны через App Store или в браузере. Посетители сайта DeepSeek могут выбрать модель R1 для более медленных ответов на более сложные вопросы. При выборе модели R1 создаются длинные ответы, которые в разговорном стиле объясняют, как она пришла к своим выводам.
По состоянию на утро понедельника сайт чата DeepSeek предупредил о возможных сбоях в работе сервиса, хотя чат-бот функционировал нормально.
DeepSeek также предлагает APII, который работает через OpenAI SDK или программное обеспечение, совместимое с OpenAI SDK.
SEE: OpenAI анонсировала Operator — ИИ-агента, который может выполнять многошаговые действия в веб-браузере, например, выбирать рейсы.
Что означает запуск DeepSeek V3 и R1 для индустрии ИИ?
«Мы вполне можем ожидать, что экосистема приложений будет построена на R1, а также несколько глобальных поставщиков облачных услуг предложат свои модели в качестве потребляемого API», — сказал выдающийся вице-президент Gartner, аналитик Арун Чандрасекаран в электронном письме TechRepublic. «Будущий успех Deepseek основан на его способности постоянно внедрять инновации (а не быть разовым успехом), создавать экосистему разработчиков на основе своих продуктов и преодолевать культурные барьеры, учитывая страну его происхождения».
Чандрасекаран отметил, что низкая стоимость DeepSeek, эффективность, результаты тестов и открытые веса делают его выдающимся.
DeepSeek-V3 обучался на 2048 графических процессорах NVIDIA H800. Производителям из США, согласно правилам экспорта, установленным администрацией Байдена, не разрешается продавать высокопроизводительные чипы для обучения ИИ компаниям, базирующимся в Китае.
«Потенциальная мощь и низкая стоимость разработки DeepSeek ставят под сомнение сотни миллиардов долларов, вложенных в США», — сказал Иван Файнсет, аналитик рынка из Tigress Financial, согласно записке для клиентов, полученной ABC News.
DeepSeek еще больше отличается тем, что является проектом с открытым исходным кодом, ориентированным на исследования, в то время как OpenAI все больше фокусируется на коммерческих проектах.
«Deepseek R1 — одно из самых удивительных и впечатляющих достижений, которые я когда-либо видел, а с точки зрения открытого исходного кода — это ценный подарок миру», — написал в пятницу на X инсайдер из Кремниевой долины и венчурный капиталист Марк Андрессен.
Gartner прогнозирует, что глобальная индустрия полупроводников ИИ достигнет 114 048 долларов США в 2025 году. Gartner прогнозирует, что к 2027 году мощность, необходимая центрам обработки данных для работы новых серверов ИИ, достигнет 500 тераватт-часов.
DeepSeek представляет мультимодальные модели
В понедельник DeepSeek продолжил свой успех, представив еще один сюрприз: семейство мультимодальных моделей Janus-Pro. Эти модели могут анализировать и генерировать изображения.
Оригинал