Изучите современные термины ИИ, чтобы оставаться в курсе

Изучите современные термины ИИ, чтобы оставаться в курсе

9 ноября 2022 г.

Прогресс в области ИИ стремительно растет: по прогнозам, стоимость отрасли ИИ вырастет более чем в 13 раз в течение следующих восьми лет.

Теперь компании, ориентированные на рост продуктов (PLG), стремятся воспользоваться этой ценной возможностью, встраивая ИИ в ключевые функции, которые улучшают взаимодействие с пользователем, выходят на новые рынки и стимулируют внедрение.

Jasper, например, является компанией PLG, которая использует искусственный интеллект для создания автоматических рекламных текстов. Недавно компания привлекла 125 млн долл. США и продемонстрировала свою ARR выросли до более чем 45 миллионов долларов США всего за один год.

Недавно Google купил запуск аватаров с искусственным интеллектом за 100 миллионов долларов, чтобы помочь ему лучше конкурировать в тенденциях обмена в социальных сетях. Все больше стартапов и предприятий следуют этому примеру.

По мере распространения ИИ язык, используемый для обсуждения ИИ, также развивался, чтобы отражать новый прогресс в этой области.

Терминология, от больших языковых моделей до преобразователей и графических процессоров, появляется в Твиттере (см. инфографика о ландшафте приложений генеративного ИИ) в новостях (см.: New York Times и VentureBeat), а также в бизнес-кейсах, описывающих некоторые из этих последних разработок в области ИИ.

Получение базового понимания этой новой терминологии ИИ имеет решающее значение для любой области, которая хочет извлечь выгоду из этой важной возможности, включая управление продуктами.

Это руководство послужит отправной точкой для изучения текущей ключевой терминологии ИИ, которую необходимо знать сейчас:

Основы

Классификация

Задача машинного обучения, целью которой является классификация точек данных по разным группам (называемым целевыми объектами или ярлыками классов), которые предварительно определяются обучающими данными.

Например, если у нас есть набор медицинских данных, состоящий из биологических измерений (частота сердечных сокращений, температура тела, возраст, рост, вес и т. д.) и информации о том, есть ли у человека конкретное заболевание, мы можем обучить классификационную модель, чтобы предсказывать, не у человека есть болезнь, учитывая только биологические измерения.

Это может быть полезно для очень дорогих или требующих больших затрат времени измерений заболеваний.

Регрессия

Задача обучения под наблюдением, которая пытается предсказать численный результат на основе точки данных. Например, дать описание дома (расположение, количество комнат, класс энергоэффективности) и прогнозировать рыночную цену дома.

Недооснащение

Явление, при котором алгоритм машинного обучения недостаточно хорошо адаптируется к обучающим данным, что приводит к низкой эффективности как обучающих данных, так и аналогичных, но разных данных.

Типичный пример недообучения возникает, когда нейронная сеть недостаточно долго обучается или когда недостаточно обучающих данных. Обратное явление — переоснащение.

Переоснащение

Явление, при котором алгоритм машинного обучения слишком приспособлен к обучающим данным, что делает производительность на обучающих данных очень высокой, но производительность на похожих, но разных данных низкая из-за плохой обобщаемости.

Типичный пример переобучения возникает, когда нейронная сеть слишком долго обучается. Обратное явление — недостаточное приспособление.

Функция стоимости

Это то, что алгоритмы машинного обучения пытаются свести к минимуму для достижения максимальной производительности. Это просто ошибка, которую алгоритм совершает в заданном наборе данных. Ее также иногда называют «функцией потерь».

Функция потерь

Значение (как правило, непрерывное), которое является удобной для вычислений заменой показателя производительности. Он измеряет ошибку между значениями, предсказанными моделью, и истинными значениями, которые мы хотим предсказать в модели.

Во время тренировки это значение минимизируется. «Функция убытков» иногда используется как взаимозаменяемая с «функцией затрат», хотя в некоторых контекстах они различаются.

Проверочные данные

Подмножество данных, на которых модель не обучается, но используется во время обучения, чтобы убедиться, что модель хорошо работает с отдельными данными. Данные проверки используются для настройки гиперпараметров, чтобы избежать переобучения.

Модели

Нейронная сеть

Особый тип алгоритма машинного обучения, который можно графически представить в виде сети, основанный на принципах работы биологического мозга.

Сеть представляет собой множество простых математических операций (сложение, умножение и т. д.), которые в сочетании образуют сложную операцию, которая может выполнять сложную задачу (например, идентифицировать автомобили на изображении).

Параметр

Обычно относится к числам в нейронной сети или алгоритме машинного обучения, которые изменяются, чтобы изменить поведение модели (иногда также называемые весовыми коэффициентами).

Если нейронная сеть аналогична радио, обеспечивая базовую структуру системы, то параметры аналогичны ручкам на радио, которые настраиваются для достижения определенного поведения (например, настройки на определенную частоту).

Параметры не задаются создателем модели, это значения, которые определяются в процессе обучения автоматически.

Гиперпараметр

Значение, которое участвует в определении общей структуры модели или поведения алгоритма. Гиперпараметры не изменяются в процессе обучения модели и устанавливаются заранее перед обучением.

Многие потенциальные значения гиперпараметров обычно проверяются, чтобы найти те, которые оптимизируют процесс обучения.

Например, в нейронной сети количество слоев — это гиперпараметр (не изменяемый при обучении), тогда как сами значения внутри слоев ("веса") являются параметрами. (изменено обучением).

Если модель представляет собой радио, то гиперпараметром будет количество ручек на радио, а значения этих ручек будут параметрами.

Генеративные модели

Генеративные модели — это подмножество моделей ИИ, которые можно использовать для создания данных, аналогичных набору обучающих данных.

Например, если хорошо работающая генеративная модель обучена на наборе данных человеческих лиц, то ее можно использовать для создания совершенно новых изображений новых человеческих лиц.

Генеративные модели стали популярными в последние годы и включают DALLE-2, Imagen, Стабильная диффузия и Генерационные модели потока Пуассона (PFGM).

Обучение с подкреплением

Обучение с подкреплением (RL) – это область машинного обучения, вдохновленная реальной средой, в которой обучение происходит путем поощрения желаемого поведения и наказания за нежелательное.

Впервые он приобрел популярность, когда компьютеры научились играть в различные видеоигры с помощью подходов RL, но теперь это мощный метод, который широко используется во многих областях глубокого обучения.

Современное глубокое обучение

Большие языковые модели

Языковые модели — это математические модели, дающие вероятность того, что определенная последовательность слов встречается в данном языке.

Большие языковые модели очень большие и обучаются на огромных объемах данных, поэтому инкапсулируют значительные объемы информации о языке.

Большие языковые модели широко используются в приложениях, имеющих отношение к естественному языку, например, для предсказания текста.

Трансформеры

Трансформеры — это разновидность модели глубокого обучения, которая широко используется в современных приложениях.

Их основное преимущество заключается в том, что они могут распределять свои вычисления между многими машинами, что позволяет выполнять сложные вычисления, необходимые для автоматического распознавания речи, за разумное время.

Перенос обучения

Переносное обучение – это метод машинного обучения, при котором обученная модель для одной задачи повторно используется в качестве отправной точки для новой модели для другой задачи. Затем новая модель может использовать уже существующие знания и часто требует меньшего обучения.

Это мощная техника, которая широко используется и часто дает хорошие результаты.

Оборудование

Ускорители

Ускорители – это специализированное компьютерное оборудование, полезное для ИИ и способное ускорить расчеты моделей.

Графические процессоры (GPU) и тензорные процессоры (TPU) — это разные типы ускорителей.

Графические процессоры

Графический процессор (GPU) – это компьютерная микросхема, предназначенная для выполнения быстрых математических вычислений. Традиционно графические процессоры отвечают за рендеринг графики и изображений, хотя сегодня они имеют более широкий спектр применения.

С появлением глубокого обучения важность графических процессоров возросла. Обучение глубоких нейронных сетей может быть более чем в 100 раз быстрее на графических процессорах, чем на центральных процессорах.


Фото Дебби Хадсон на Unsplash


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE