Рабочие процессы искусственного интеллекта и современные шаблоны проектирования приложений

Рабочие процессы искусственного интеллекта и современные шаблоны проектирования приложений

9 декабря 2023 г.

Взаимодействие с пользователем постоянно развивается, но нынешний рост искусственного интеллекта полностью перевернул все поле. ИИ открывает новую эру взаимодействия с новой парадигмой. Традиционные пользовательские интерфейсы основаны на шаблоне управления и контроля, когда пользователи сообщают компьютеру ряд команд для выполнения некоторых пользовательских задач. Однако искусственный интеллект позволяет пользователям более естественно взаимодействовать с компьютерами, сообщая им, чего они хотят, а не как это сделать.

Эта новая парадигма взаимодействия с ИИ, известная как парадигма, основанная на намерениях, все еще находится на ранних стадиях своего развития, но у нее есть потенциал совершить революцию в том, как мы взаимодействуем с компьютерами. Например, представьте, что вы можете сказать своему компьютеру: «Я хочу забронировать рейс в Париж», и он автоматически найдет лучшие рейсы и забронирует их для вас. Или представьте, что вы можете сказать: «Мне нужна помощь с налогами», и ваш компьютер шаг за шагом проведет вас через этот процесс. Это открывает множество абсолютно новых возможностей для разработки «идеального» UX и делает его полностью целостным и цельным.

Взаимодействие, основанное на намерениях, не лишено проблем. Современные модели изучения языка, также известные как LLM, уже очень хорошо понимают естественный язык. Однако состояние искусственного интеллекта в UX далеко от совершенства, нынешний стиль взаимодействия в чате страдает от того, что требует от пользователей описывать свои проблемы в виде прозаического текста, что создает высокую когнитивную нагрузку.

Кроме того, может быть сложно разработать пользовательский интерфейс, который был бы интуитивно понятен и прост в использовании для такого типа взаимодействия. Однако потенциальные преимущества взаимодействия на основе намерений значительны, и UX-дизайнеры уже изучают, как лучше всего реализовать эту новую парадигму.

В этой статье мы рассмотрим рост взаимодействия, основанного на намерениях, и его последствия для UX-дизайна. Мы обсудим существующие в настоящее время типы продуктов на базе искусственного интеллекта, каким образом они используют шаблоны ввода и вывода и как они предназначены для улучшения пользовательского опыта в среде искусственного интеллекта.

Обзор контента

  • Как ИИ изменил работу дизайнера
  • Основные типы рабочих процессов ИИ в продуктах
  • Чат-боты
  • Основной (с приоритетом ИИ)
  • Контекстный
  • Невидимый
  • Заключение

Как ИИ изменил работу дизайнера

Как мы уже поняли, новой задачей дизайнеров, работающих с продуктами ИИ, является проектирование с использованием парадигмы, ориентированной на намерение. Когда вы думаете о традиционном программном обеспечении, вы взаимодействуете с ним, отправляя цепочку команд внутри системы для получения желаемого результата. Ваш ввод — это команда, это может быть что угодно интерактивное на вашем экране, например кнопки, раскрывающиеся списки, формы и т. д. Комбинации ваших действий в вашем GUI образуют команду, которая шаг за шагом проведет вас по вашему пути.

Command-based interaction

После набора шагов, навигации по информационной архитектуре в продукте, вы наконец получаете решение своей проблемы, результат работы системы. Например, когда вы пытаетесь заказать такси, вы отправляете набор команд для выбора пункта назначения, настройки параметров поездки и, наконец, отправляете команду для подтверждения поездки, когда система выбирает для вас водителя.

Взаимодействие, основанное на намерениях, сужается до системы ввода-обработки-вывода. Вы буквально даете системе то, что хотите получить в результате (так называемое приглашение), система обрабатывает ваши входные данные и выдает вам выходные данные. Все этапы расчета происходят в системе, вы получаете только то, что вам нужно. Возвращаясь к нашему примеру с такси, в системе, основанной на намерениях, вам нужно всего лишь дать подсказку («Заказать такси до дома»), и вас подвезут.

Intent-based interaction

Эта парадигма по-прежнему будет требовать команд в рабочих процессах, поскольку машины могут ошибаться, а люди иногда могут захотеть изменить выходные данные и контролировать их или использовать их в разных потоках, чтобы лучше настроить поведение системы в соответствии со своими целями.

Основные типы рабочих процессов ИИ в продуктах

Давайте договоримся об этих названиях, однако, когда мы интегрируем ИИ в пользовательский поток, он может работать по-разному в зависимости от рабочих процессов продукта, задач, проблем, технических особенностей и других ограничений. В процессе наших исследований и анализа видны определенные закономерности в продуктах, давайте на них посмотрим. Также мы расскажем, как тот или иной продукт использует паттерн ввод-обработка-вывод, какие UI-решения он использует и как решает стандартные для AI-продуктов задачи юзабилити. Итак, поехали.

1. Чат-боты

Давайте поговорим о самом очевидном примере. Нынешняя шумиха вокруг ИИ в основном связана с чат-ботами и их возможностями. В этом шаблоне с использованием LLM рабочий процесс ИИ происходит через диалог через интерфейс чат-бота. Пользователь взаимодействует с чат-ботом, разговаривая с ним, а чат-бот отвечает на вопросы и подсказки пользователя. Обычно этот тип рабочего процесса можно использовать для решения широкого круга задач и решений, самых широких запросов, изучения новых тем и т. д.

Однако нынешний стиль взаимодействия в чате создает высокую когнитивную нагрузку для пользователей, поскольку требует от них излагать свои проблемы в виде прозаического текста. Для решения этой проблемы была разработана новая роль: «оперативный инженер». Инженеры по подсказкам несут ответственность за получение правильных результатов от ChatGPT, предоставляя соответствующие подсказки. Другими словами, чат-боты требуют большого внимания к их удобству использования.

ChatGPT is a well-known chatbot and LLM

Pi, another example of a mobile chatbot

Вводы чат-бота

В продуктах чат-ботов обычно используются шаблоны ввода текстовых подсказок. Такой подход позволяет пользователям вводить и отправлять в систему любой запрос в виде текста и писать все, что они хотят. Он предоставляет широчайшие возможности для ввода и вывода результатов.

Шаблон запроса пользователя обычно отображается в виде элемента пользовательского интерфейса текстового поля. В чат-ботах он обычно остается фиксированным.

ChatGPT uses a text field, placed at the bottom of the page

Google Bard's text prompting

В сочетании с подсказками также часто добавляются заранее написанные подсказки, что уменьшает непонимание и ошибочные представления пользователя о том, что делать с этим чат-ботом, дает предложения и упрощает выбор.

ChatGPT shows user prompt examples at the beginning of a new chat

Также чат-боты довольно часто предлагают использовать голосовой ввод для заполнения поля ввода текста, позволяя использовать голос вместо набора текста с клавиатуры. Это создает почти органичный диалог между человеком и компьютером.

For example, Bard provides the ability to enter a hint using the user's voice input

Обработка чат-ботом

Важно показать, в каком состоянии находится система и как она обрабатывает запрос пользователя. Разные приложения используют разные подходы. Самый распространенный подход в чат-ботах — генерация текста в реальном времени. Поскольку для получения результата алгоритму может потребоваться некоторое время, рекомендуется показывать генерацию текста на ходу. Это позволит вам сосредоточить внимание пользователя и сделать переход между вводом и выводом более плавным.

Pi chatbot assistant shows the output in real-time process of generation

Вывод чат-бота

В приложениях чат-ботов типы вывода могут сильно различаться. Это может быть текст, изображения (например, созданные при вводе текста) или другие результаты, которые зависят от целевой темы приложения и его функций. Важно, чтобы конечный копирайтинг отражал действия пользователя, а также желаемый характер и индивидуальность приложения (если это применимо).

Если вы собираетесь создать чат-бота, вам следует учитывать лучшие практики, которые уже используют другие приложения.

  1. Несколько выходов. Поскольку результаты системы могут быть разными и иногда не высокого качества или система может неправильно понять запрос пользователя, рекомендуется добавить возможность нескольких выходных данных, чтобы увеличить вероятность того, что система угадает запрос, который хочет пользователь. см.
  2. Bard suggest three drafts of the system respond

    Bing Image Generator creates multiple images on a single prompt

    1. Приносим извинения за неточность. Искусственный интеллект внутри системы может давать неправильные результаты, которые приводят к путанице, оскорбительному содержанию или чувству беспокойства у пользователя. Система приносит извинения за возможные неточности.
    2. Bard apologizes in advance for potentially inaccurate results

      1. Сохраненные взаимодействия. Запоминайте недавние действия пользователей в системе, что позволяет нам легче обращаться к ним. Показ недавних пунктов назначения, поисковых запросов и других данных может помочь облегчить когнитивную нагрузку.
      2. Bard shows recent conversations history

        2. Первичный (ИИ-в первую очередь)

        Продукты этого типа очень похожи на чат-ботов, основанных на моделях изучения языка, за исключением того, что их позиционирование сужено до конкретных случаев использования, и они могут давать самые разные типы результатов: от изображений до сложных интерактивных ответов на вопросы в формате конкретной отрасли.

        Эти продукты используют искусственный интеллект в качестве основного рабочего процесса посредством полноэкранного взаимодействия и пошаговых форм.

        Copy.ai looks like a chatbot, but its primary function is narrowed down to help you write marketing copy

        DALLE’s prompt input takes first place in systems workflow, but outputting it in the form of image-generating

        Ввод для основного типа

        Как мы уже упоминали, ввод похож на шаблоны ввода чат-бота, которые обычно выглядят как поле подсказки для текста. Рекомендации также остаются одинаковыми, например шаблоны подсказок (которые помогут начать мыслительный процесс) и голосовой ввод.

        Copy.ai prompt field with the possibility to set up input parameters

        Кроме того, иногда имеет смысл разрешить пользователю устанавливать некоторые параметры, если их можно применить к выходным данным системы. Это означает использование ползунков критериев и других стандартных шаблонов пользовательского интерфейса, знакомых пользователю.

        App for generating graphic assets Recraft uses criteria slider for setting up the output level of details

        Обработка основного типа

        Схемы обработки соответствуют другим типам рабочих процессов. Лучше всего здесь просто генерировать выходные данные системы на ходу. Но при разработке обработки для рабочих процессов, ориентированных на искусственный интеллект, обратите внимание на результат, если есть возможность показать его по частям. Например, если изображение может быть показано в процессе генерации или ваша технология позволяет показывать его только в завершенном виде.

        В этом случае рассмотрите возможность предоставления детальных сообщений о ходе вычислений во время вычислений.

        Bing Creator shows the progress bar while generating an image

        Вывод для основного типа

        В рабочих процессах, ориентированных на искусственный интеллект, типы вывода могут варьироваться от изображений до различных структур пользовательского интерфейса (или даже динамических элементов пользовательского интерфейса) в зависимости от того, что система пытается дать своему пользователю и какое решение она пытается достичь.

        >

        При разработке этого типа рабочего процесса рассмотрите возможность использования нескольких результатов вывода, разрешите точную настройку вывода, чтобы пользователь мог достичь желаемого результата, разрешите повторные подсказки и предоставьте возможность добавлять отзывы о работе системы.

        Bing Create shows multiple images from a single prompt

        Copy.ai shows two thumbs-up/thumbs-down buttons for rating an output from the user’s side

        Recraft allows infinite repromting of existing image

        3. Контекстный

        В этом типе рабочий процесс ИИ добавляется поверх существующего основного рабочего процесса с помощью триггеров и контекстных действий. Используя LLM, он предлагает решения контекстных задач с помощью различных элементов пользовательского интерфейса.

        ClickUp suggests using their AI assistant in the context of the features already offered

        Linear offers its AI services to quickly build complex data filtering

        Ввод для контекстных рабочих процессов

        Входные данные в контекстных рабочих процессах зависят от типов задач и могут сильно различаться. Это может быть текстовый ввод, шаблоны подсказок или кнопки для выполнения определенных задач, например обобщения текста.

        При использовании этого подхода рассмотрите возможность разработки процесса активации/деактивации с учетом того, каким образом пользователь запускает эти запросы или команды.

        ClickUp triggers its AI assistant when inputting AI in the document and allowing to choose between a set of pre-constructed prompts

        In upcoming Dovetail AI features, you’ll also be able to summarize data from various sources. For example, simplify a lengthy support conversation or turn an hour-long customer interview transcript into a few bullet points.

        Быстрое создание

        Этот шаблон выглядит как управляемые мастера, которые помогают пользователям создавать подробные подсказки без их написания, и использует различные элементы ввода пользовательского интерфейса, такие как текстовые поля, раскрывающиеся списки, переключатели и другие. Все это объединяется в структуры форм, которые адаптируются к контексту задачи и позволяют разбить сложную подсказку на небольшие логические части, снижая нагрузку на пользователя и освобождая его от необходимости много думать о формате быстрый. Это может быть особенно полезно, когда у вас часто повторяющийся запрос с одной и той же структурой, тогда вы можете позволить пользователю заполнять только те части, которые изменяются, чтобы не писать каждый раз новое приглашение.

        ClickUp lets users fill up the form to create a detailed prompt due to the context of its workflow

        Обработка контекстных рабочих процессов

        Неудивительно, что контекстные системы требуют контекстного подхода к разработке дизайна. Опять же, правильный путь во многом зависит от типов задач, которые необходимо выполнить программному обеспечению, но общие правила остаются прежними. Если возможно, покажите вывод результатов по мере их генерации. Если нет, покажите шаг, на котором алгоритм работает в данный момент, и явный индикатор обработки (значок загрузки или индикатор выполнения)

        ClickUp AI generating output on the go

        Вывод для контекстных рабочих процессов

        При разработке выходных данных для интегрированных рабочих процессов искусственного интеллекта позвольте пользователю проверять выходные данные в контексте, прежде чем применять их к основному рабочему процессу. Это позволит пользователю проверить правильность результата, сгенерированного искусственным интеллектом, и в случае неверных результатов удалить или изменить его.

        ClickUp enables checking generated text before it can be inserted inside the document

        Объедините преимущества подходов взаимодействия на основе команд и намерений. В зависимости от задачи, которую решает ваш продукт, позвольте пользователям модифицировать и использовать данный результат для достижения своих целей. Обеспечьте как можно более плавный и легкий поток.

        Например, в ситуациях, когда основного текста много, пользователи с когнитивными проблемами или проблемами с грамотностью хотят знать, что содержится в этом контенте, без необходимости читать весь текст. Пользователь может нажать, чтобы просмотреть сокращенную и упрощенную версию текста, созданного ИИ.

        Bard uses a dropdown menu to show possible response modifiers, which allows making the result shorter or longer

        Также рекомендуется сохранять и отображать недавние запросы, чтобы при необходимости можно было быстро вернуться к ним.

        ClickUp shows user’s recent prompts

        4. Невидимый

        Рабочие процессы с использованием невидимого ИИ можно считать наиболее традиционными. Эти типы существуют уже давно и появились задолго до недавнего ажиотажа вокруг языковых моделей. «Невидимый» ИИ буквально невидим, поскольку система обрабатывает действия пользователя в фоновом режиме. Работая автономно, алгоритмы машинного обучения пытаются найти соответствующий контент, улучшить подсказки, а также рассчитать и проанализировать поведение. Точки соприкосновения и взаимодействия в невидимых системах сведены к минимуму

        TikTok recommended videos as an example of the invisible workflow. Analyzing user’s behavior and interest, their AI algorithms predict what will be the most interesting for the user.

        Невидимые системы также могут помогать пользователям выполнять различные задачи, прерывая их рабочие процессы. Предложения и адаптация автодополнения на ходу — способы реализации этой идеи на практике. Функции автозаполнения, предлагающие несколько предложений одновременно, также являются способом уменьшить количество ошибок, а когда система искусственного интеллекта не уверена, чего хочет пользователь, она позволяет пользователю выбирать из выбранной линейки, а не предлагать ему один вариант. Тем не менее, обратите внимание: даже если некоторые исправления, внесенные искусственным интеллектом, разумны, они все равно могут быть неправильными, и отменить их не должно быть сложно. Разработан таким образом, чтобы можно было принимать, редактировать или отклонять предложения ИИ.

        Dovetail provides computed suggestions for surfacing relevant tags for faster analysis, which are seamless and related to the current task, approaching the principles of invisible interaction

        При создании невидимого опыта убедитесь, что система отображает соответствующую информацию, основанную на текущей активности пользователя, и отдайте приоритет персонализированным рекомендациям. Обновляйте рекомендации быстро и часто.

        Показывая рекомендации пользователю, четко указывайте источник данных и объясняйте, почему был предсказан или предложен тот или иной результат.

        Spotify shows the source artist, explaining why it picked these playlists

        Предоставьте пользователям системы ИИ возможность выражать свои предпочтения посредством регулярного взаимодействия. Примите к сведению отзывы пользователей и сообщите им, когда будут внесены изменения. Вместо того, чтобы просто благодарить пользователей, объясните, какую пользу им принесет их отзыв. Это повысит вероятность того, что они снова предоставят обратную связь. Когда пользователь нажимает кнопку «Не нравится», система должна немедленно предоставить ответ и подтвердить, что в будущем он будет видеть меньше такого рода контента.

        Spotify’s remove button allows users to clarify suggestions, informing the system they want to see similar songs less

        Заключение

        ИИ определенно изменит то, как мы взаимодействуем с компьютерными системами. Однако разработка рабочих процессов ИИ требует тщательного рассмотрения типа создаваемого рабочего процесса и целевого пользователя. Независимо от того, является ли ваша система ИИ основанной на чате, контекстной, невидимой или основной, крайне важно учитывать лучшие практики, возникшие в других подобных системах ИИ. Предоставление нескольких вариантов вывода, извинения за неточности и предоставление пользователям возможности выражать свои предпочтения — это лишь несколько примеров установленных передовых практик. Кроме того, важно учитывать этапы ввода, обработки и вывода рабочего процесса и проектировать их таким образом, чтобы они были простыми и понятными для пользователя. Следуя этим рекомендациям и принимая во внимание уникальные потребности ваших пользователей, вы сможете создавать эффективные, действенные и удобные для пользователя продукты на основе ИИ.


        Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE