Llama 2 от Meta — конкурент ChatGPT с открытым исходным кодом
21 июля 2023 г.Meta делает свою крупноязыковую модель Llama 2 с открытым исходным кодом, сообщила материнская компания Facebook 18 июля. Обновление модели, которая была выпущена как LLaMA первого поколения (также стилизованная под Llama 1) в феврале 2023 года, впервые была представлена на мероприятии Microsoft Inspire. Microsoft будет предпочтительным партнером Meta для Llama 2.
Перейти к:
- Что такое Лама 2?
Где доступна Лама 2?
Что Llama 2 говорит о конкуренции в бизнес-пространстве генеративного ИИ?
Что такое Лама 2?
Llama 2 — это большая языковая модель, которую можно использовать для создания генеративных и диалоговых моделей ИИ. Проще говоря, Llama 2, как и GPT-4, можно использовать для создания чат-ботов и помощников ИИ для коммерческих или исследовательских целей.
Он работает на наборе предварительно обученных и точно настроенных генеративных текстовых моделей, масштаб которых варьируется от 7 до 70 миллиардов параметров, и на его предварительное обучение ушло 2 триллиона токенов данных из общедоступных источников. В целом, это на 40% больше жетонов, чем было использовано для обучения оригинальной ламы.
ПОСМОТРЕТЬ: Набор для найма: инженер-подсказчик (TechRepublic Premium)
Где доступна Лама 2?
Llama 2 можно скачать для исследований и коммерческого использования с сайта Meta здесь. Доступные ресурсы с открытым исходным кодом включают веса моделей и начальный код для предварительно обученной модели, а также доработанные версии диалогового ИИ.
«Открытие доступа к сегодняшним моделям ИИ означает, что поколение разработчиков и исследователей может проводить их стресс-тестирование, быстро выявляя и решая проблемы, как сообщество», — написала Meta в своем блоге о Llama 2. «Увидев, как эти инструменты используются другими, наши собственные команды могут учиться у них, улучшать эти инструменты и устранять уязвимости».
Разработчики, у которых уже есть учетные записи в каталоге моделей Microsoft Azure AI, смогут получить оттуда доступ к Llama 2. Его можно найти на Amazon Web Services, Hugging Face и других торговых площадках AI. Клиентам AWS следует искать его на рынке машинного обучения SageMaker.
«Объявление Meta о том, что модель доступна в AWS и Microsoft Azure, является для них огромным шагом, демонстрирующим стремление стать корпоративным игроком в сфере генеративного ИИ», — прокомментировал аналитик Gartner Арун Чандрасекаран в электронном письме TechRepublic.
Метапартнеры с Qualcomm для искусственного интеллекта на устройствах
Qualcomm установит Llama 2 на некоторые устройства в 2024 году. Точные модели устройств, к которым это будет применяться, пока не разглашаются, но Qualcomm заявила, что это будут устройства на базе процессоров Snapdragon. Qualcomm стремится запускать языковую модель на некоторых устройствах напрямую, а не всегда в облаке.
«Мы приветствуем подход Meta к открытому и ответственному искусственному интеллекту и стремимся к внедрению инноваций и сокращению входных барьеров для разработчиков любого размера за счет внедрения генеративного искусственного интеллекта в устройства», — заявил Дурга Маллади, старший вице-президент и генеральный менеджер по технологиям, планированию и периферийным решениям Qualcomm, в пресс-релизе. «Чтобы эффективно масштабировать генеративный ИИ в массовом масштабе, ИИ должен работать как в облаке, так и на периферийных устройствах, таких как смартфоны, ноутбуки, автомобили и устройства IoT».
Что Llama 2 говорит о конкуренции в бизнес-пространстве генеративного ИИ?
Открытие Llama 2 и закрепление партнерства с Microsoft может быть признаком того, что Meta пытается оставаться конкурентоспособной с GPT-4. OpenAI GPT-4 также бесплатен и является моделью ChatGPT, на которую Microsoft сделала большую ставку. У Google также есть конь на ринге с моделью PaLM позади Барда.
«Это изменит ландшафт рынка LLM», — заявил в Twitter главный научный сотрудник Meta в области искусственного интеллекта Янн ЛеКун.
Как связь с Meta может изменить сделки Microsoft с OpenAI, пока неясно, но «партнерство с Meta может открыть для них новые возможности», — сказал Чандрасекаран. «Модели Llama 2 потенциально могут стимулировать спрос на IaaS Azure и операционные инструменты, поскольку клиенты стремятся точно настроить эти модели и создавать на их основе бизнес-приложения», — добавил он.
Создание модели с открытым исходным кодом также может стать кардинальным изменением. «Выпустив Llama 2 и лицензировав ее для коммерческого использования, Meta может дать огромный импульс сообществу разработчиков открытого исходного кода», — сказал Чандрасекаран. «Сегодня модели с закрытым исходным кодом, возможно, имеют преимущество в производительности по сравнению с моделями с открытым исходным кодом, но у Llama есть потенциал сократить этот разрыв в среднесрочной и долгосрочной перспективе».
Оригинал