Итак, как же на самом деле обучают модели ИИ?

Итак, как же на самом деле обучают модели ИИ?

26 декабря 2023 г.

2023 год подходит к концу. В этом году генеративный ИИ, искусственный интеллект, ИИ, захвативший мир, ChatGPT, Сэм Альтман и Илон Маск попали в миллионы заголовков. Переворот OpenAI был самым интересным.

Искусственное воздействие весьма интересно повлияло на наш образ жизни. Людям, как правило, не нужно беспокоиться о фейковом контенте или фейковых новостях, если их источником информации являются только основные средства массовой информации, не споря с тем, что они публикуют фейковые новости по ошибке. В этом году страх перед фейковым контентом достиг своего пика. Я не знаю, почему это было так разрекламировано. Но страх был реальным: обычный человек искренне боялся негативного воздействия ИИ. Страх перед фейковым контентом был настолько широко распространен, что Merriam-Webster выбрала слово «аутентичный» в качестве слова 2023 года.

Многие пишут об искусственном интеллекте и его влиянии на современный образ жизни. Генеративные модели искусственного интеллекта — это увлекательная технология, которую люди до сих пор не могут полностью освоить. У него есть сила произвести революцию в мире. Вы, должно быть, читали, что модели ИИ работают на принципах машинного обучения, и что каким-то образом некоторые исключительно гениальные профессионалы и корпорации могут обучать машины, передавая им данные. Похоже на какую-то инопланетную технологию.

Но вопрос, который я задавал себе, заключается в том, как эти тренеры ИИ тренируют свои модели. Какой подход они применяют? Как они это делают? Есть ли недостатки у широко используемых методов?

Вы чувствуете любопытство? Тогда садитесь прямо здесь и позвольте мне отправиться в путешествие по поиску ответов на эти вопросы. Но перед этим позвольте мне подтвердить одну вещь: я не являюсь профессионалом в области ИИ и не экспертом в этой области. Я просто любопытный студент, который любит делиться тем, что узнает каждый день. Обучение модели ИИ — сложный процесс, требующий многолетнего опыта, упорной работы и многочисленных сотрудников. Я хотел бы углубиться в эту тему, но это тема для другой статьи.

Когда мы обучаем модель ИИ, нам нужно в основном помнить о трех целях:

  • Точность. Он должен обеспечивать вывод запроса с абсолютно возможной точностью, с вероятностью ошибок от низкой до нулевой.
  • Обобщение. Когда мы обучаем модель ИИ, мы обучаем ее с помощью определенных заранее разработанных запросов. Модель ИИ должна изучить эти закономерности и иметь возможность применять эти знания к непредвиденным данным.
  • Эффективность. Стоимость эксплуатации модели ИИ высока. Для ответа даже на самый маленький запрос требуются высокопроизводительные серверы и много вычислительной мощности. Модель искусственного интеллекта должна быть эффективной, чтобы снижать эксплуатационные расходы и предоставлять наилучшие ответы на запросы пользователя, а также узнавать об интересах пользователя, минимизировать ошибки и регистрировать непредвиденные операции и функциональные проблемы.

Делая все это, нам также необходимо помнить, что обучение модели ИИ — это утомительный процесс, требующий тысяч часов и большого количества ресурсов. Нам также необходимо помнить основной принцип работы: мы должны быть в состоянии научить модель, как преобразовывать необработанные данные (обучающие данные) в практические идеи, которые позволят модели применять свои знания - из обучающих данных - во всем мире. во многих секторах и в различных областях.

Мы можем обучать модель ИИ тремя способами: обучая ее под наблюдением, известное как обучение с учителем, позволяя ей самообучаться, называемое обучением без учителя, или путем обучения на основе взаимодействий. Сначала мы обсудим, как работает контролируемое обучение.

Обучение с учителем — это когда мы даем модели список входных данных и обучаем ее на ожидаемых результатах. Это похоже на дрессировку собаки: когда мы даем собаке лакомство за выполнение действий по сидению и стоянию по нашим командам, собака изучает закономерности и вскоре привыкает к ним. Он знает, что если услышит конкретное слово «сидеть» и сядет, то получит свое любимое лакомство. Мы не воздаем должное модели ИИ за ее хорошую работу, но мы можем в некотором роде принять ее, согласовав выходные данные, которые она выдает на запрос. Обучение с учителем может направлять модель и помогать ей совершенствовать свои способности.

Модель оценивает свою производительность, сравнивая, насколько она далека от ожидаемого ответа. Он вычисляет разницу и составляет отчет о необходимых корректировках по частям, которые необходимо улучшить и внести коррективы. Это важная часть контролируемого обучения, когда модель ИИ учится на своих ошибках, а также учится давать точные ответы, а также совершенствуются ее навыки принятия решений.

Обучение без учителя вызывается, когда модели ИИ предоставляется огромный объем данных для игры, как малышу дается множество строительных блоков, с которыми он может играть. Ребенок собирает их вместе и создает структуры или формы, что помогает развивать его когнитивные способности. То же самое и с моделями ИИ. Он распознает закономерности в этом огромном океане обучающих данных и учится их отображать. В обучении без учителя используются методы и инструменты, которые помогают модели ИИ организовывать отображаемые данные и визуализировать их. Затем он учится создавать из них возможные входные данные и подходящие выходные данные. Организация данных помогает упростить задачу, а также делает задачу более простой и эффективной для модели ИИ.

Существует еще одна форма обучения, которая называется обучением с подкреплением. В этом типе метода обучения ИИ учится на основе взаимодействия. Это похоже на обучение стажера работе, к которой он желает присоединиться. Тренер задает модели вопросы, и модель должна использовать свои навыки принятия решений для получения результатов, которые лучше всего подходят для ответа на запрос пользователя. Затем модель ИИ получает вознаграждение или наказание от тренера в зависимости от ее результатов. Модель ИИ постоянно пытается повысить уровень своих навыков, стремясь получить больше наград. Следует отметить, что награды и наказания здесь не реальны, а потому виртуальны. Это всего лишь виртуальная система наведения, созданная тренерами для моделей ИИ. Модели запрограммированы так, чтобы получить как можно больше вознаграждений и избежать штрафов.

Обучение с подкреплением или обучение на основе взаимодействия зависит от нескольких сложных алгоритмов, помогающих модели принимать оптимальные решения.

Это был наиболее общий и стандартный подход к обучению модели ИИ.

Можно также задать вопрос о том, как получаются данные для обучения моделей ИИ.

Ну, есть много способов получить данные. Лучший и наиболее рекомендуемый вариант — купить набор данных у надежного поставщика, но большинство моделей ИИ обучаются на всех данных, доступных в Интернете. Второго варианта следует избегать в любом случае. Согласно последним сообщениям, многие страны, в том числе США, Великобритания и Индия, собираются потребовать от компаний, занимающихся искусственным интеллектом, раскрывать информацию о том, откуда они получили данные для обучения. В начале этого года многие компании и службы, занимающиеся искусственным интеллектом, предстали перед судом по обвинению в краже и нарушении авторских прав произведений художников для обучения своих моделей искусственного интеллекта. Самый заметный случай был связан с Stability AI, Midjourney и Deviant Art.

Обучить модель искусственного интеллекта — это непростая задача, поскольку это не менее сложно, чем воспитать ребенка или домашнюю собаку. Это требует терпения, упорного труда и ресурсов. Область новая и возможностей много. Информация предоставлена ​​The Data Scientist.


Также опубликовано здесь.< /п>


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE