Рабочие процессы искусственного интеллекта и современные шаблоны проектирования приложений
9 декабря 2023 г.Взаимодействие с пользователем постоянно развивается, но нынешний рост искусственного интеллекта полностью перевернул все поле. ИИ открывает новую эру взаимодействия с новой парадигмой. Традиционные пользовательские интерфейсы основаны на шаблоне управления и контроля, когда пользователи сообщают компьютеру ряд команд для выполнения некоторых пользовательских задач. Однако искусственный интеллект позволяет пользователям более естественно взаимодействовать с компьютерами, сообщая им, чего они хотят, а не как это сделать.
Эта новая парадигма взаимодействия с ИИ, известная как парадигма, основанная на намерениях, все еще находится на ранних стадиях своего развития, но у нее есть потенциал совершить революцию в том, как мы взаимодействуем с компьютерами. Например, представьте, что вы можете сказать своему компьютеру: «Я хочу забронировать рейс в Париж», и он автоматически найдет лучшие рейсы и забронирует их для вас. Или представьте, что вы можете сказать: «Мне нужна помощь с налогами», и ваш компьютер шаг за шагом проведет вас через этот процесс. Это открывает множество абсолютно новых возможностей для разработки «идеального» UX и делает его полностью целостным и цельным.
Взаимодействие, основанное на намерениях, не лишено проблем. Современные модели изучения языка, также известные как LLM, уже очень хорошо понимают естественный язык. Однако состояние искусственного интеллекта в UX далеко от совершенства, нынешний стиль взаимодействия в чате страдает от того, что требует от пользователей описывать свои проблемы в виде прозаического текста, что создает высокую когнитивную нагрузку.
Кроме того, может быть сложно разработать пользовательский интерфейс, который был бы интуитивно понятен и прост в использовании для такого типа взаимодействия. Однако потенциальные преимущества взаимодействия на основе намерений значительны, и UX-дизайнеры уже изучают, как лучше всего реализовать эту новую парадигму.
В этой статье мы рассмотрим рост взаимодействия, основанного на намерениях, и его последствия для UX-дизайна. Мы обсудим существующие в настоящее время типы продуктов на базе искусственного интеллекта, каким образом они используют шаблоны ввода и вывода и как они предназначены для улучшения пользовательского опыта в среде искусственного интеллекта.
Обзор контента
- Как ИИ изменил работу дизайнера
- Основные типы рабочих процессов ИИ в продуктах
- Чат-боты
- Основной (с приоритетом ИИ)
- Контекстный
- Невидимый
- Заключение
Как ИИ изменил работу дизайнера
Как мы уже поняли, новой задачей дизайнеров, работающих с продуктами ИИ, является проектирование с использованием парадигмы, ориентированной на намерение. Когда вы думаете о традиционном программном обеспечении, вы взаимодействуете с ним, отправляя цепочку команд внутри системы для получения желаемого результата. Ваш ввод — это команда, это может быть что угодно интерактивное на вашем экране, например кнопки, раскрывающиеся списки, формы и т. д. Комбинации ваших действий в вашем GUI образуют команду, которая шаг за шагом проведет вас по вашему пути.
После набора шагов, навигации по информационной архитектуре в продукте, вы наконец получаете решение своей проблемы, результат работы системы. Например, когда вы пытаетесь заказать такси, вы отправляете набор команд для выбора пункта назначения, настройки параметров поездки и, наконец, отправляете команду для подтверждения поездки, когда система выбирает для вас водителя.
Взаимодействие, основанное на намерениях, сужается до системы ввода-обработки-вывода. Вы буквально даете системе то, что хотите получить в результате (так называемое приглашение), система обрабатывает ваши входные данные и выдает вам выходные данные. Все этапы расчета происходят в системе, вы получаете только то, что вам нужно. Возвращаясь к нашему примеру с такси, в системе, основанной на намерениях, вам нужно всего лишь дать подсказку («Заказать такси до дома»), и вас подвезут.
Эта парадигма по-прежнему будет требовать команд в рабочих процессах, поскольку машины могут ошибаться, а люди иногда могут захотеть изменить выходные данные и контролировать их или использовать их в разных потоках, чтобы лучше настроить поведение системы в соответствии со своими целями.
Основные типы рабочих процессов ИИ в продуктах
Давайте договоримся об этих названиях, однако, когда мы интегрируем ИИ в пользовательский поток, он может работать по-разному в зависимости от рабочих процессов продукта, задач, проблем, технических особенностей и других ограничений. В процессе наших исследований и анализа видны определенные закономерности в продуктах, давайте на них посмотрим. Также мы расскажем, как тот или иной продукт использует паттерн ввод-обработка-вывод, какие UI-решения он использует и как решает стандартные для AI-продуктов задачи юзабилити. Итак, поехали.
1. Чат-боты
Давайте поговорим о самом очевидном примере. Нынешняя шумиха вокруг ИИ в основном связана с чат-ботами и их возможностями. В этом шаблоне с использованием LLM рабочий процесс ИИ происходит через диалог через интерфейс чат-бота. Пользователь взаимодействует с чат-ботом, разговаривая с ним, а чат-бот отвечает на вопросы и подсказки пользователя. Обычно этот тип рабочего процесса можно использовать для решения широкого круга задач и решений, самых широких запросов, изучения новых тем и т. д.
Однако нынешний стиль взаимодействия в чате создает высокую когнитивную нагрузку для пользователей, поскольку требует от них излагать свои проблемы в виде прозаического текста. Для решения этой проблемы была разработана новая роль: «оперативный инженер». Инженеры по подсказкам несут ответственность за получение правильных результатов от ChatGPT, предоставляя соответствующие подсказки. Другими словами, чат-боты требуют большого внимания к их удобству использования.
Вводы чат-бота
В продуктах чат-ботов обычно используются шаблоны ввода текстовых подсказок. Такой подход позволяет пользователям вводить и отправлять в систему любой запрос в виде текста и писать все, что они хотят. Он предоставляет широчайшие возможности для ввода и вывода результатов.
Шаблон запроса пользователя обычно отображается в виде элемента пользовательского интерфейса текстового поля. В чат-ботах он обычно остается фиксированным.
В сочетании с подсказками также часто добавляются заранее написанные подсказки, что уменьшает непонимание и ошибочные представления пользователя о том, что делать с этим чат-ботом, дает предложения и упрощает выбор.
Также чат-боты довольно часто предлагают использовать голосовой ввод для заполнения поля ввода текста, позволяя использовать голос вместо набора текста с клавиатуры. Это создает почти органичный диалог между человеком и компьютером.
Обработка чат-ботом
Важно показать, в каком состоянии находится система и как она обрабатывает запрос пользователя. Разные приложения используют разные подходы. Самый распространенный подход в чат-ботах — генерация текста в реальном времени. Поскольку для получения результата алгоритму может потребоваться некоторое время, рекомендуется показывать генерацию текста на ходу. Это позволит вам сосредоточить внимание пользователя и сделать переход между вводом и выводом более плавным.
Вывод чат-бота
В приложениях чат-ботов типы вывода могут сильно различаться. Это может быть текст, изображения (например, созданные при вводе текста) или другие результаты, которые зависят от целевой темы приложения и его функций. Важно, чтобы конечный копирайтинг отражал действия пользователя, а также желаемый характер и индивидуальность приложения (если это применимо).
Если вы собираетесь создать чат-бота, вам следует учитывать лучшие практики, которые уже используют другие приложения.
- Несколько выходов. Поскольку результаты системы могут быть разными и иногда не высокого качества или система может неправильно понять запрос пользователя, рекомендуется добавить возможность нескольких выходных данных, чтобы увеличить вероятность того, что система угадает запрос, который хочет пользователь. см. ол>
- Приносим извинения за неточность. Искусственный интеллект внутри системы может давать неправильные результаты, которые приводят к путанице, оскорбительному содержанию или чувству беспокойства у пользователя. Система приносит извинения за возможные неточности. ол>
- Сохраненные взаимодействия. Запоминайте недавние действия пользователей в системе, что позволяет нам легче обращаться к ним. Показ недавних пунктов назначения, поисковых запросов и других данных может помочь облегчить когнитивную нагрузку. ол>
2. Первичный (ИИ-в первую очередь)
Продукты этого типа очень похожи на чат-ботов, основанных на моделях изучения языка, за исключением того, что их позиционирование сужено до конкретных случаев использования, и они могут давать самые разные типы результатов: от изображений до сложных интерактивных ответов на вопросы в формате конкретной отрасли.
Эти продукты используют искусственный интеллект в качестве основного рабочего процесса посредством полноэкранного взаимодействия и пошаговых форм.
Ввод для основного типа
Как мы уже упоминали, ввод похож на шаблоны ввода чат-бота, которые обычно выглядят как поле подсказки для текста. Рекомендации также остаются одинаковыми, например шаблоны подсказок (которые помогут начать мыслительный процесс) и голосовой ввод.
Кроме того, иногда имеет смысл разрешить пользователю устанавливать некоторые параметры, если их можно применить к выходным данным системы. Это означает использование ползунков критериев и других стандартных шаблонов пользовательского интерфейса, знакомых пользователю.
Обработка основного типа
Схемы обработки соответствуют другим типам рабочих процессов. Лучше всего здесь просто генерировать выходные данные системы на ходу. Но при разработке обработки для рабочих процессов, ориентированных на искусственный интеллект, обратите внимание на результат, если есть возможность показать его по частям. Например, если изображение может быть показано в процессе генерации или ваша технология позволяет показывать его только в завершенном виде.
В этом случае рассмотрите возможность предоставления детальных сообщений о ходе вычислений во время вычислений.
Вывод для основного типа
В рабочих процессах, ориентированных на искусственный интеллект, типы вывода могут варьироваться от изображений до различных структур пользовательского интерфейса (или даже динамических элементов пользовательского интерфейса) в зависимости от того, что система пытается дать своему пользователю и какое решение она пытается достичь.
>При разработке этого типа рабочего процесса рассмотрите возможность использования нескольких результатов вывода, разрешите точную настройку вывода, чтобы пользователь мог достичь желаемого результата, разрешите повторные подсказки и предоставьте возможность добавлять отзывы о работе системы.
3. Контекстный
В этом типе рабочий процесс ИИ добавляется поверх существующего основного рабочего процесса с помощью триггеров и контекстных действий. Используя LLM, он предлагает решения контекстных задач с помощью различных элементов пользовательского интерфейса.
Ввод для контекстных рабочих процессов
Входные данные в контекстных рабочих процессах зависят от типов задач и могут сильно различаться. Это может быть текстовый ввод, шаблоны подсказок или кнопки для выполнения определенных задач, например обобщения текста.
При использовании этого подхода рассмотрите возможность разработки процесса активации/деактивации с учетом того, каким образом пользователь запускает эти запросы или команды.
Быстрое создание
Этот шаблон выглядит как управляемые мастера, которые помогают пользователям создавать подробные подсказки без их написания, и использует различные элементы ввода пользовательского интерфейса, такие как текстовые поля, раскрывающиеся списки, переключатели и другие. Все это объединяется в структуры форм, которые адаптируются к контексту задачи и позволяют разбить сложную подсказку на небольшие логические части, снижая нагрузку на пользователя и освобождая его от необходимости много думать о формате быстрый. Это может быть особенно полезно, когда у вас часто повторяющийся запрос с одной и той же структурой, тогда вы можете позволить пользователю заполнять только те части, которые изменяются, чтобы не писать каждый раз новое приглашение.
Обработка контекстных рабочих процессов
Неудивительно, что контекстные системы требуют контекстного подхода к разработке дизайна. Опять же, правильный путь во многом зависит от типов задач, которые необходимо выполнить программному обеспечению, но общие правила остаются прежними. Если возможно, покажите вывод результатов по мере их генерации. Если нет, покажите шаг, на котором алгоритм работает в данный момент, и явный индикатор обработки (значок загрузки или индикатор выполнения)
Вывод для контекстных рабочих процессов
При разработке выходных данных для интегрированных рабочих процессов искусственного интеллекта позвольте пользователю проверять выходные данные в контексте, прежде чем применять их к основному рабочему процессу. Это позволит пользователю проверить правильность результата, сгенерированного искусственным интеллектом, и в случае неверных результатов удалить или изменить его.
Объедините преимущества подходов взаимодействия на основе команд и намерений. В зависимости от задачи, которую решает ваш продукт, позвольте пользователям модифицировать и использовать данный результат для достижения своих целей. Обеспечьте как можно более плавный и легкий поток.
Например, в ситуациях, когда основного текста много, пользователи с когнитивными проблемами или проблемами с грамотностью хотят знать, что содержится в этом контенте, без необходимости читать весь текст. Пользователь может нажать, чтобы просмотреть сокращенную и упрощенную версию текста, созданного ИИ.
Также рекомендуется сохранять и отображать недавние запросы, чтобы при необходимости можно было быстро вернуться к ним.
4. Невидимый
Рабочие процессы с использованием невидимого ИИ можно считать наиболее традиционными. Эти типы существуют уже давно и появились задолго до недавнего ажиотажа вокруг языковых моделей. «Невидимый» ИИ буквально невидим, поскольку система обрабатывает действия пользователя в фоновом режиме. Работая автономно, алгоритмы машинного обучения пытаются найти соответствующий контент, улучшить подсказки, а также рассчитать и проанализировать поведение. Точки соприкосновения и взаимодействия в невидимых системах сведены к минимуму
Невидимые системы также могут помогать пользователям выполнять различные задачи, прерывая их рабочие процессы. Предложения и адаптация автодополнения на ходу — способы реализации этой идеи на практике. Функции автозаполнения, предлагающие несколько предложений одновременно, также являются способом уменьшить количество ошибок, а когда система искусственного интеллекта не уверена, чего хочет пользователь, она позволяет пользователю выбирать из выбранной линейки, а не предлагать ему один вариант. Тем не менее, обратите внимание: даже если некоторые исправления, внесенные искусственным интеллектом, разумны, они все равно могут быть неправильными, и отменить их не должно быть сложно. Разработан таким образом, чтобы можно было принимать, редактировать или отклонять предложения ИИ.
При создании невидимого опыта убедитесь, что система отображает соответствующую информацию, основанную на текущей активности пользователя, и отдайте приоритет персонализированным рекомендациям. Обновляйте рекомендации быстро и часто.
Показывая рекомендации пользователю, четко указывайте источник данных и объясняйте, почему был предсказан или предложен тот или иной результат.
Предоставьте пользователям системы ИИ возможность выражать свои предпочтения посредством регулярного взаимодействия. Примите к сведению отзывы пользователей и сообщите им, когда будут внесены изменения. Вместо того, чтобы просто благодарить пользователей, объясните, какую пользу им принесет их отзыв. Это повысит вероятность того, что они снова предоставят обратную связь. Когда пользователь нажимает кнопку «Не нравится», система должна немедленно предоставить ответ и подтвердить, что в будущем он будет видеть меньше такого рода контента.
Заключение
ИИ определенно изменит то, как мы взаимодействуем с компьютерными системами. Однако разработка рабочих процессов ИИ требует тщательного рассмотрения типа создаваемого рабочего процесса и целевого пользователя. Независимо от того, является ли ваша система ИИ основанной на чате, контекстной, невидимой или основной, крайне важно учитывать лучшие практики, возникшие в других подобных системах ИИ. Предоставление нескольких вариантов вывода, извинения за неточности и предоставление пользователям возможности выражать свои предпочтения — это лишь несколько примеров установленных передовых практик. Кроме того, важно учитывать этапы ввода, обработки и вывода рабочего процесса и проектировать их таким образом, чтобы они были простыми и понятными для пользователя. Следуя этим рекомендациям и принимая во внимание уникальные потребности ваших пользователей, вы сможете создавать эффективные, действенные и удобные для пользователя продукты на основе ИИ.
Оригинал