Преимущества использования ИИ, ориентированного на данные, в корпоративном мире

Преимущества использования ИИ, ориентированного на данные, в корпоративном мире

19 марта 2022 г.

Станьте умнее, чтобы сделать вашу корпорацию эффективной, повысив точность систем ИИ. Подходы, ориентированные на данные, улучшают модели машинного обучения.


Ключевые выводы


  • Понимание концепции Data-Centric AI подхода.

  • Методы исправления данных во всех проектах ИИ.

  • Рост и возможности в корпоративном мире.

![Источник: Фото Квистолта на Unsplash] (https://cdn.hackernoon.com/images/v5Ld39rURIOoptrH3K2ZyWO8oM32-j893j34.jpeg)


Что такое датацентрический ИИ?


Проще говоря, подход, ориентированный на данные, относится к тому, как данные изменяются или модифицируются для повышения производительности и оценки. Данные — это основное кодирование знаний в предметной области, и они постоянно приобретают все большее значение в рамках искусственного интеллекта (ИИ) и надежных традиционных систем.


[Эндрю Нг] (https://www.linkedin.com/in/andrewyng/), технолог и предприниматель, является пионером Data-Centric AI. В своем программном докладе о глубоком обучении он обсудил эволюцию технологий (от [модельно-ориентированного к информационно-ориентированному ИИ] (https://towardsdatascience.com/from-model-centric-to-data-centric-4beb8ef50475) ) и представил некоторые ценные идеи о его реализации специалистам по данным, заявив, что подход, ориентированный на данные, дает больше времени на маркировку, управление, нарезку и дополнение данных. В другом видеосеансе Эндрю Нг сказал:


"Данные — это пища для ИИ"


Далее он добавляет:


  • «Вместо того, чтобы сосредотачиваться на коде, компании должны сосредоточиться на разработке систематических инженерных методов для улучшения данных надежными, эффективными и систематическими способами. Другими словами, компаниям необходимо перейти от подхода, ориентированного на модели, к подходу, ориентированному на данные. центрический подход».*

Методы проведения соревнований по ИИ, ориентированных на данные


Два основных метода, используемые в [Data-Centric AI] (https://datacentricai.community/):


Маркировка данных


Идентификация необработанных данных в изображениях, тексте и видео в процессе машинного обучения относится к маркировке данных. Как подчеркнул Эндрю Нг, проблема создания качественного набора данных многократно возникает из-за ошибок и несоответствий при маркировке данных.


Тем не менее, последовательные правила в маркировке и сильный консенсус среди профессионалов делают ставку на заблуждения и снижают субъективность. Наиболее важным аспектом маркировки является последовательность, позволяющая перепроверить точность этикетировщиков.


Количество обучающих примеров: (Изображение создано автором на основе источника)


Балансировка данных


Балансировка данных должна быть в правильном массиве. Для обеспечения эффективности данных принятие решений имеет решающее значение для обеспечения согласованности данных.


В этом решении ИИ и процесс принятия решений объединяют науку о данных и машинное обучение. Эндрю Нг привлекает внимание к данным и итеративно модифицирует их, удерживая их в неизменном виде. Точнее, отрывает качественные данные. Чтобы добиться этого эффективно, необходимо глубокое понимание баланса данных.


Важность ИИ, ориентированного на данные, в бизнес-секторах


По словам Эндрю Нг:


  • «Подход, ориентированный на данные, позволяет людям на производстве, в больницах и на фермах настраивать данные, что делает более доступным для тех, кто не имеет технического образования в области ИИ, вводить их в модель с открытым исходным кодом». *

Это даст ИИ дополнительные возможности проводить различия традиционными способами с минимальными наборами данных и меньшим опытом.


  • «То, что я вижу по всему миру, — это множество этих проектов стоимостью от 1 до 5 миллионов долларов, над которыми не работают», * говорит Нг.

В последние годы компании из различных отраслей, включая производителей автомобилей, электроники и медицинского оборудования, добиваются успехов, используя ИИ и решения для глубокого обучения.


Преимущества использования ИИ, ориентированного на данные, в корпоративном мире


  • «Если 80 процентов нашей работы — подготовка данных, то обеспечение качества данных — важная работа команды машинного обучения».* Эндрю Нг

Улучшает процесс принятия решений


Необходимость построения организации, ориентированной на данные, влечет за собой разработку инструментов, навыков и, что наиболее важно, фактической культуры, которая отдает приоритет данным при принятии решений. Все дело в сборе и анализе информации для принятия лучших решений.


Стремление к ориентированному на данные подходу улучшает процесс принятия решений, что невероятно необходимо в современном деловом мире. В частности, компаниям становится легче принимать изменения, которые могут существенно повлиять на траекторию роста компании.


Недавние достижения в области данных и аналитики повлияли на автомобильную промышленность, поскольку различные функции, основанные на данных, связаны с механическими сегментами. Архитектуры данных о транспортных средствах переопределяются из-за базовых моделей данных, которые стремятся обеспечить базовую аналитику и искусственный интеллект.


Потребители ожидают, что автомобильные компании будут передавать соответствующие сообщения по каналам. Наряду с тем, что они предпочитают фактические сроки, которые они выбрали ранее, иногда бренды терпят неудачу, и потребители уходят. Чтобы решить проблему гиперцелевого маркетинга, важно использовать подход, основанный на данных.


Устраняет проблемы рабочего процесса


ИИ, ориентированный на данные, позволяет производителям использовать машинное обучение даже при работе с небольшим набором данных в производственном секторе. Вот где стартап Ng оказался в центре внимания!


В рамках одной монолитной поисковой системы или системы искусственного интеллекта потребительское программное обеспечение по-прежнему работает бесперебойно, поскольку для этого требуется несколько предприятий. Каждая больница, например, использует свой способ кодирования электронных медицинских карт. Но следует отметить, что одна модель ИИ не может справиться с общими формами больниц.


К счастью, технология Landing AI позволяет производителям разрабатывать сложные модели искусственного интеллекта. Это может уменьшить количество найма тысяч инженеров для работы над ним. Тем не менее, это ворота к бесчисленным потенциальным возможностям трудоустройства, особенно в обрабатывающей промышленности. Мир работает на больших данных!


Нг смотрит на опережение (в ближайшие пять-семь лет). Он видит огромный прорыв для ИИ. Особое внимание будет уделено ИИ, ориентированному на данные, а не индустрии потребительского программного обеспечения. Далее он уточняет свои взгляды, говоря:


  • «Чего нам не хватает, так это более систематической инженерной дисциплины обработки хороших данных, которые поступают в системы ИИ, и это ключ к демократизации доступа к ИИ». *

Сокращает время разработки проектов


Производственные группы могут работать параллельно, что мгновенно влияет на данные, используемые системой ИИ при таком подходе. Это снижает продолжительность развития, устраняя чрезмерное движение вперед и назад между группами и зацикливание наиболее необходимого человеческого вклада. Благодаря своевременному обнаружению поврежденных деталей можно значительно избежать рисков. Именно так технологии машинного зрения эффективно работают в таких условиях.


Пример дефектов стальных листов: изображение автора


Например, серия изображений из стальных листов используется для выявления дефектов, которые обычно возникают при производстве стальных листов. Однако система может просматривать изображения продуктов на сборочной линии. Необходимо выявить не менее 39 различных дефектов. Разработка модели компьютерного зрения с гиперпараметрами достигает базовой системы с точностью 76,2%. Но задача состоит в том, чтобы добиться 90% точности.


Качество важнее количества


Платформа Data-Centric AI чрезвычайно полезна для предоставления высококачественных помеченных наборов данных. Внедрение подходящих алгоритмов в нужное время невероятно важно для достижения безошибочных результатов. В настоящее время это возможно и необходимо, поскольку качественные данные всегда востребованы в корпоративном мире.


Наличие подхода, ориентированного на данные, предлагает систематический метод, который улучшает данные, согласованные данные и, в конечном итоге, очищает несогласованные данные. Понимание и знание того, как организовать качество данных в соответствии со своими областями, дает компаниям конкурентное преимущество.


Подведение итогов: организациям нужен ИИ, ориентированный на данные, и смена дисков данных!


Использование ИИ, ориентированного на данные (машинное обучение), стало практичным подходом для всех отраслей промышленности по всему миру. Без сомнения, ИИ является ключевым аспектом принятия решений в различных секторах бизнеса, позволяющим получать надежные результаты от всех систем ИИ. Принятие решений ИИ стало фундаментальным сдвигом, который раскрыл максимальные возможности искусственного интеллекта (ИИ) в нынешнюю цифровую эпоху, которые продлятся в ближайшие годы.


Готовы ли вы начать работу с ИИ, ориентированным на данные? Вот несколько замечательных ресурсов и познавательный Data -Centric AI Community, чтобы помочь вам сделать следующий шаг. Удачи! 👍




Использованная литература


Фелиция Хоу, [Этот предприниматель в области ИИ работает над внедрением машинного обучения в другие отрасли (2021 г.)] (https://fortune.com/2021/11/08/andrew-ng-data-centric-artificial-intelligence-machine-learning -braianstorm-ai-landing-ai/)


Гил Пресс, [Эндрю Нг запускает кампанию за ИИ, ориентированный на данные, (2021)] (https://www.forbes.com/sites/gilpress/2021/06/16/andrew-ng-launches-a-campaign- для данных, ориентированных на ИИ/)


Беседа с Эндрю о MLOps: от ИИ, ориентированного на модели, к ИИ, ориентированному на данные, DeepLearningAI, (2021)



Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE