NVIDIA GTC 2024: 5 главных тенденций
26 марта 2024 г.NVIDIA прошла долгий путь со времен специализации на видеокартах для игр — теперь графические процессоры NVIDIA обеспечивают большую мощность генеративного искусственного интеллекта для предприятий. На выставке NVIDIA GTC 2024, проходившей с 18 по 21 марта в Сан-Хосе, Калифорния, генеративный искусственный интеллект был повсюду: от чат-ботов до художественных инсталляций. Вот некоторые из главных технологических тенденций, которые мы наблюдали на NVIDIA GTC в этом году, то есть технологии, которые снова и снова появлялись в темах презентаций, в основных докладах и вопросах и ответах для прессы с генеральным директором NVIDIA Дженсеном Хуангом, а также на выставочной площадке.
Генерация с расширенным поиском
Генерация с расширенным поиском, заявленная как метод сокращения «галлюцинаций» или неточностей ИИ, позволяет генеративной модели ИИ сверять свою работу с внешними ресурсами, такими как исследовательские работы или статьи. RAG привлекателен для корпоративных клиентов, поскольку повышает надежность создаваемого контента.
СМОТРЕТЬ: Генеральный директор NVIDIA Дженсен Хуанг рассказал о будущих графических процессорах с архитектурой Blackwell и многом другом во время основного выступления на конференции. (Техреспублик)
Например, Lenovo одним из первых внедрила недавно анонсированную платформу NVIDIA NeMo с RAG, которую Lenovo использует для создания своей экосистемы искусственного интеллекта для клиентов, работающих на устройствах Lenovo.
«Фабрики искусственного интеллекта» для увеличения потребностей в хранении и вычислениях
Многие организации NVIDIA GTC позиционируют себя как «фабрики искусственного интеллекта», которые предоставляют предприятиям доступ к хранилищам и вычислительным мощностям, необходимым для создания частного искусственного интеллекта.
NexGen Cloud, которая называет свою службу фабрики искусственного интеллекта «GPUaaS», входит в число компаний, которые предоставят доступ к графическому процессору Blackwell от NVIDIA с 10 триллионами параметров (рис. A) позднее в этом году.
Десять триллионов заданий с параметрами требуют больших вычислительных ресурсов, и организации делают ставку на то, что смогут построить бизнес-модель, предоставляя клиентам ровно столько вычислительной мощности, сколько нужно.
«Поскольку эти модели становятся все больше и больше, продолжая расти в геометрической прогрессии, инфраструктура, необходимая для обучения, точной настройки и обслуживания или предоставления выводов для моделей в масштабе, также должна продолжать расти, чтобы решить эту проблему», — сказал Марк Ломейер, вице-президент. президент и генеральный менеджер по вычислительной инфраструктуре и ИИ/ML в Google Cloud, в интервью TechRepublic на NVIDIA GTC 2024.
СХД должна поддерживать высокопроизводительные структурированные данные, а также неструктурированные данные, такие как документы, изображения и видео, заявил Грег Финдлен, старший вице-президент по управлению продуктами и управлению данными компании Dell, на предварительном брифинге 15 марта. Клиенты также хотят иметь возможность управлять тем, как их процессы используют доступное оборудование. «Никто не хочет иметь простаивающие графические процессоры», — сказал Финдлен.
Dell AI Factory, разработанная с помощью и при поддержке продуктов NVIDIA, призвана сузить «огромные возможности» до «эффективных сценариев использования», — сказал Варун Чхабра, старший вице-президент Dell по инфраструктурному и телекоммуникационному маркетингу, на предварительном брифинге. .
Согласно исследованию Gartner, опубликованному в марте 2024 года, 83% из 459 поставщиков технологических услуг, опрошенных в период с октября по декабрь 2023 года, развернули или тестировали генеративный искусственный интеллект в своих организациях.
Edge AI
Организации, специализирующиеся на периферийном искусственном интеллекте, заняли большую часть выставочной площадки NVIDIA GTC 2024, предлагая широкий спектр вариантов использования: робототехника, автомобилестроение, промышленность, складирование, здравоохранение, критически важные системы и розничная торговля.
Многие из этих сценариев использования периферийного ИИ были основаны на платформе NVIDIA Jetson для робототехники. Микросервисы NVIDIA Metropolis на Jetson Orin позволяют разработчикам использовать вызовы API для настройки возможностей генеративного искусственного интеллекта на периферии, делая роботов более реактивными и гибкими в зависимости от окружающей среды.
Например, во время своего выступления генеральный директор NVIDIA Дженсен Хуанг продемонстрировал демонстрацию складских роботов, которые автоматически меняют маршрут вокруг препятствия (рис. B).
«ИИ не нов, но разговоры о генеративном ИИ оживляют эту тему для многих», — сказал Чабра в электронном письме TechRepublic. «Мы годами занимаемся анализом ИИ на периферии, а ученые, работающие с данными, используют наши конечные точки, такие как рабочие станции Dell Precision, для моделирования ИИ и проверки концепции».
Частный ИИ для предприятия
Организации работают над созданием частного генеративного ИИ, который сможет безопасно получать доступ к частным данным, обеспечивая при этом гибкость общедоступного ИИ, такого как ChatGPT.
На выставке частными службами искусственного интеллекта чаще всего называли Mistral AI, который предоставляет модель большого языка с открытым исходным кодом, которую клиенты могут размещать на своих собственных серверах.
Вторые пилоты
Вторые пилоты не новы: в конце концов, чат-боты, такие как ChatGPT, положили начало буму генеративного искусственного интеллекта. С тех пор «второй пилот» стал почти общим термином для чат-бота, который может отвечать на вопросы о данных.
Вторые пилоты могут использовать данные, принадлежащие компании.
NVIDIA GTC представила широкий спектр ИИ второго пилота, который может получать ответы на основе конкретных структурированных и неструктурированных данных, принадлежащих компании. Например, промышленный второй пилот SoftServe Gen AI считывает руководство по техническому обслуживанию манипулятора робота, чтобы создать пошаговые инструкции по ремонту, и может выделить детали, которые техническому специалисту необходимо заменить, на 3D-модели.
Цитирование позволяет людям проверять ответы ИИ
Еще одной распространенной тенденцией среди вторых пилотов предприятий было цитирование. NexGen Cloud продемонстрировала, как ее облачная платформа Hyperstack (разработанная SoftServe и ускоренная с помощью графических процессоров NVIDIA) может запускать второй пилот, который может отвечать на вопросы на основе видео и указывать на определенные моменты в расшифровке видео, где ИИ получал ответы. Сочетание проприетарных частных источников данных с функциональностью чат-бота в стиле второго пилота продолжает оставаться движущей тенденцией в области генеративного искусственного интеллекта для предприятий.
Отказ от ответственности: NVIDIA оплатила мне авиабилеты, проживание и питание на мероприятии NVIDIA GTC, которое проходило с 18 по 21 марта в Сан-Хосе, Калифорния.
Оригинал