IBM: корпоративные ИТ-компании сталкиваются с неизбежной революцией агентов ИИ
17 октября 2024 г.Дни ИИ, действующего исключительно как инструмент прогнозирования или чат-бот, сочтены.
Арманд Руис, вице-президент IBM по управлению продуктами для платформы ИИ, сообщил делегатам фестиваля SXSW в Австралии на этой неделе, что агенты ИИ вскоре позволят предприятиям в регионе Азиатско-Тихоокеанского региона автоматизировать сложные, многоэтапные задачи, освободив сотрудников для сосредоточения на более человечески ориентированных действиях.
Руиз объяснил, что технологии ИИ эволюционировали от предиктивных моделей в традиционном машинном обучении до повсеместного использования чат-ботов. Он предсказал, что следующий скачок откроет «агентскую эру», когда специализированные агенты ИИ будут сотрудничать с людьми для повышения организационной эффективности.
«Нам предстоит пройти долгий путь, чтобы ИИ позволил нам выполнять все эти рутинные задачи и делать это надежно, а затем делать это так, чтобы вы могли масштабировать это, а затем вы могли это объяснить и контролировать», — сказал Руис толпе. «Но мы доберемся туда, и мы доберемся туда быстрее, чем мы думаем».
Что такое агент ИИ?
По словам Руиса, агент ИИ — это система, которая может автономно рассуждать о сложных проблемах, разбивая задачи, создавая выполнимые планы и выполняя эти планы с помощью набора инструментов. Эти агенты демонстрируют продвинутое рассуждение, сохранение памяти и способность выполнять задачи самостоятельно.
Руиз выделил четыре способности агентов ИИ: планирование, память, инструменты и действие.
Агенты ИИ и их возможности
1. Планирование
Агенты ИИ способны осуществлять расширенное планирование для решения поставленных задач или получения подсказок.
Саморефлексия: агенты могут проводить саморефлексию или проверять, имеют ли их решения смысл или нет.
Самокритика: агенты могут использовать обратную связь, часто из тех же или разных крупных языковых моделей, для критики и улучшения своих планов.
СМ.: 10 главных стратегических технологических тенденций Gartner на 2025 год
Цепочка мыслей: агенты могут разбивать крупные задачи на более мелкие этапы для повышения точности.
Декомпозиция подцелей: они также могут устанавливать подцели, разделяя более крупные задачи на управляемые компоненты.
2. Память
Агенты ИИ используют как краткосрочную, так и долгосрочную память для поддержки своих автономных действий.
Кратковременная память: эта контекстная память позволяет агентам отслеживать действия в рамках текущего сеанса.
Долговременная память: агенты ИИ могут регистрировать прошлые взаимодействия, что помогает им учиться на ошибках и постоянно улучшать свою работу с течением времени.
3. Использование инструментов
Агенты ИИ будут подключены к сторонним инструментам для выполнения своих задач. При правильном доступе и управлении они смогут использовать инструменты, начиная от веб-поиска и платформ генерации кода и заканчивая корпоративными системами, такими как HR-платформы, Microsoft Teams, CRM-инструменты, облачные сервисы и хранилища данных.
4. Автономное действие
Истинный потенциал агентов ИИ заключается в их способности действовать автономно от имени людей. Будь то оптимизация рабочих процессов HR, таких как подбор персонала, решение проблем с программным кодом или решение других корпоративных задач, эти агенты превратят ИИ из пассивного чат-бота в проактивных участников.
Предприятия будут организовывать армии агентов в составе своей рабочей силы
По словам Руиса, на предприятиях, скорее всего, будут работать «миллионы агентов ИИ». Эти агенты, которые по сути будут выступать в качестве коллег или помощников ИИ для сотрудников-людей, смогут работать совместно друг с другом над различными задачами, что позволит им «решать проблемы от начала до конца».
Руис объяснил, что агенты ИИ могут функционировать как одношаговые или многошаговые системы, а их действия координируются и направляются СуперИИ.
Одношаговые агенты ИИ
Одношаговые агенты — это те, которые могут выполнять конкретные задачи или решать отдельные проблемы по запросу, выполняя их с помощью соответствующих инструментов. Инструменты определены, и процесс по-прежнему остается довольно ручным, хотя эти агенты могут получать доступ к таким системам, как LLM, для получения результатов.
Руис предупредил, что могут быть случаи, когда эти агенты ИИ будут галлюцинировать или работать не так хорошо, как хотелось бы.
Многошаговые агенты ИИ
Многошаговые агенты ИИ используют итеративные стратегии в том, что Руиз назвал «циклом мысли, действия, наблюдения», используя одну или несколько LLM. «У вас есть этот цикл, который очень итеративный, и удивительно, как это улучшает результат и обеспечивает лучшие результаты, пока вы не получите окончательный», — сказал он.
Супер ИИ
Предприятия будут развертывать системы «Super AI» для координации сетей отдельных агентов AI. По словам Руиса, эти Super AI будут выступать в качестве оркестраторов, планируя задачи, разбивая их на более мелкие компоненты и назначая их наиболее подходящим агентам в организации для эффективного выполнения работы.
«Один агент ИИ может быть очень хорош в продажах, управлении продуктами или кодировании, или очень хорош в мэйнфрейме или определенном языке программирования. У каждого будут небольшие языковые модели, которые очень легко обучать, очень дешево выполнять, и у них будет определенный доступ к определенным инструментам», — сказал он.
Кто будет основными пользователями агентов ИИ?
Руиз выделил три основные группы пользователей, которые, скорее всего, получат выгоду от использования агентов ИИ: разработчики, бизнес-пользователи, не владеющие кодом, и конечные пользователи.
Разработчики: Традиционно ИИ, наука о данных и машинное обучение требовали узкоспециализированных знаний. Однако Руис объяснил, что теперь миллионы разработчиков имеют доступ к этим технологиям через API. Кроме того, такие фреймворки, как CrewAI, позволяют разработчикам быстро создавать и развертывать агенты ИИ.
Бизнес-пользователи: Инструменты без кода вскоре позволят бизнес-пользователям создавать собственных агентов ИИ через пользовательский интерфейс. Новый конструктор агентов IBM, который должен дебютировать на конференции TechXchange компании IBM, позволит сотрудникам на всех уровнях бизнеса создавать агентов, которые могут автоматизировать и выполнять организационные задачи без необходимости знания программирования.
Конечные пользователи: Руис сказал, что широкий круг конечных пользователей также будет взаимодействовать с агентами ИИ, отметив, что будет «целый спектр» конечных пользователей, которые будут внедрять и использовать эти инструменты различными способами.
Как агенты преобразуют наши предприятия и работу
Руис сказал, что фабрики являются хорошей аналогией того, как работа может трансформироваться. В начале 1900-х годов фабрики полагались на ручную, трудоемкую работу многих людей, что было очень трудоемким и неэффективным. Однако на заре промышленной революции были введены машины, чтобы помочь автоматизировать их и ускорить производство.
Он объяснил, что ИИ сейчас развивается, чтобы помочь автоматизировать и дополнить умственную работу так же, как машины автоматизировали физический труд на фабриках. Он утверждает, что вместо того, чтобы стать заменой, он позволит им сосредоточиться на более стратегических и инновационных задачах, повышая общую производительность и эффективность.
«Мы уже видим это в маркетинге», — добавил Руис. «Мы увидим это и в продажах, и это начнет распространяться на все различные должностные функции. Наша цель — заставить ИИ освободить нас от множества отвлекающих факторов и позволить нам заниматься осмысленной работой и человеческими связями».
«Идея заключается в том, что агенты ИИ будут работать вместе с людьми в качестве дополняющих друг друга, расширяя человеческие возможности, а не заменяя людей полностью. Это позволит повысить производительность, сбалансировать работу и личную жизнь и сосредоточиться на более ценных видах деятельности».
Оригинал