Шпаргалка по Llama 3: полное руководство на 2024 год

Шпаргалка по Llama 3: полное руководство на 2024 год

1 мая 2024 г.

OpenAI, возможно, является более известным именем, когда речь идет о коммерческом генеративном искусственном интеллекте, но Meta успешно завоевала это место благодаря открытому исходному коду мощных больших языковых моделей. 18 апреля Meta представила свою крупнейшую модель генеративного ИИ — Llama 3, которая превосходит GPT04 в некоторых стандартных тестах производительности ИИ.

Что такое Лама 3?

Llama 3 — это LLM, созданная Meta. Его можно использовать для создания генеративного искусственного интеллекта, в том числе чат-ботов, которые могут отвечать на естественном языке на самые разные запросы. Варианты использования, по которым оценивалась Llama 3, включают мозговой штурм, творческое письмо, кодирование, обобщение документов и ответы на вопросы голосом конкретного человека или персонажа.

Полная модель Llama 3 выпускается в четырех вариантах:

    Предварительно обучено 8 миллиардов параметров. 8 миллиардов параметров точно настроены. 70 миллиардов предварительно обученных параметров. 70 миллиардов параметров точно настроены.

Генеративные возможности искусственного интеллекта Llama 3 можно использовать в браузере с помощью функций искусственного интеллекта в Facebook, Instagram, WhatsApp и Messenger Meta. Саму модель можно загрузить с Meta или с основных корпоративных облачных платформ.

Когда выйдет Llama 3 и на каких платформах?

Llama 3 была выпущена 18 апреля на Google Cloud Vertex AI, IBM watsonx.ai и других крупных хостинговых платформах LLM. Следом за ним последовала AWS, добавившая Llama 3 в Amazon Bedrock 23 апреля. По состоянию на 29 апреля Llama 3 доступна на следующих платформах:

    Блоки данных. Обнимающее лицо. Кэггл. Microsoft Azure. NVIDIA НИМ.

Аппаратные платформы AMD, AWS, Dell, Intel, NVIDIA и Qualcomm поддерживают Llama 3.

Является ли Llama 3 открытым исходным кодом?

Llama 3 имеет открытый исходный код, как и другие LLM Meta. Создание моделей с открытым исходным кодом стало ценным отличием Meta.

SEE: Стэнфордский отчет об индексе искусственного интеллекта раскрывает 8 тенденций использования искусственного интеллекта в современном бизнесе. (Техреспублик)

Ведутся споры о том, какая часть кода или весов большой языковой модели должна быть общедоступной, чтобы считаться открытым исходным кодом. Но что касается бизнес-целей, Meta предлагает более открытый взгляд на Llama 3, чем ее конкуренты для своих программ LLM.

Лама 3 бесплатна?

Llama 3 бесплатна, пока она используется в соответствии с условиями лицензии. Модель можно загрузить непосредственно с Meta или использовать в различных службах облачного хостинга, перечисленных выше, хотя с этими услугами может взиматься плата.

Является ли Llama 3 мультимодальным?

Llama 3 не является мультимодальным, что означает, что он не способен понимать данные разных модальностей, таких как видео, аудио или текст. В ближайшем будущем Meta планирует сделать Llama 3 мультимодальным.

Улучшения Llama 3 по сравнению с Llama 2

Чтобы сделать Llama 3 более функциональной, чем Llama 2, Meta добавила новый токенизатор для более эффективного кодирования языка. Meta дополнила Llama 3 групповым вниманием к запросам — методом повышения эффективности вывода моделей. По словам Меты, обучающий набор Llama 3 в семь раз превышает размер обучающего набора, использованного для Llama 2, и включает в себя в четыре раза больше кода. Meta применила новые возможности для предварительной подготовки и точной настройки инструкций Llama 3.

Поскольку Llama 3 спроектирована как открытая модель, Meta добавила ограждения с учетом требований разработчиков. Новым ограждением является Code Shield, предназначенный для перехвата небезопасного кода, который может создавать модель.

Что будет дальше с Ламой 3?

Мета планирует:

    Добавьте несколько языков в Llama 3. Разверните контекстное окно. В целом увеличьте возможности модели в будущем.

Meta работает над моделью параметров 400B, которая может помочь сформировать следующее поколение Llama 3. По данным Meta, в ходе раннего тестирования Llama 3 400B с настройкой инструкций набрала 86,1 балла по оценке знаний MMLU (тест AI). конкурентоспособен с GPT-4. Llama 400B на данный момент станет крупнейшим LLM в Мете.

Место Llama 3 в конкурентной среде генеративного искусственного интеллекта

Llama 3 напрямую конкурирует с GPT-4 и GPT-3.5, Gemini и Gemma от Google, Mistral 7B от Mistral AI, Perplexity AI и другими LLM для индивидуального или коммерческого использования для создания чат-ботов с генеративным искусственным интеллектом и других инструментов. Примерно через неделю после презентации Llama 3 Snowflake представила собственный ИИ открытого предприятия с сопоставимыми возможностями под названием Snowflake Arctic.

Растущие требования к производительности LLM, таких как Llama 3, способствуют гонке вооружений ПК с поддержкой искусственного интеллекта, которые могут запускать модели, по крайней мере частично, на устройстве. Между тем, компании, занимающиеся генеративным искусственным интеллектом, могут столкнуться с повышенным вниманием из-за больших вычислительных потребностей, что может способствовать ухудшению изменения климата.

Лама 3 против GPT-4

Llama 3 превосходит OpenAI GPT-4 в HumanEval, стандартном тесте, сравнивающем способность модели ИИ генерировать код с кодом, написанным людьми. Llama 3 70B набрал 81,7 балла по сравнению с показателем GPT-4, равным 67 баллам.

Однако GPT-4 превзошел Llama 3 по оценке знаний MMLU с результатом 86,4 против 79,5 у Llama 3 70B. О производительности Llama 3 в других тестах можно узнать в блоге Meta.

Подпишитесь на новостную рассылку Innovation Insider Узнайте о последних технологических инновациях, которые меняют мир, включая Интернет вещей, 5G, последние новости о телефонах, безопасности, умных городах, искусственном интеллекте, робототехнике и многом другом. Доставка по вторникам и пятницам Адрес электронной почты Подписываясь на нашу рассылку, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности. Вы можете отписаться в любое время. Подписаться
Подпишитесь на новостную рассылку Innovation Insider Узнайте о последних технологических инновациях, которые меняют мир, включая Интернет вещей, 5G, последние новости о телефонах, безопасности, умных городах, искусственном интеллекте, робототехнике и многом другом. Доставка по вторникам и пятницам Адрес электронной почты Подписываясь на нашу рассылку, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности. Вы можете отписаться в любое время. Подписаться

Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE