Азимов неосознанно стал пионером современной инженерии подсказок
15 мая 2023 г.Айзек Азимов, провидец в области научная фантастика, неосознанно стал пионером в современной оперативной инженерии благодаря своим заставляющим задуматься исследованиям взаимодействия человека и робота в его новаторской серии Robot.
Prompt Engineering — предыстория и история
==Самый популярный новый язык программирования – английский – Андрей Карпати (@karpathy)==
Инжиниринг подсказок — это процесс, в котором подсказки ввода для большой языковой модели ИИ создаются и уточняются для получения точных, актуальных и полезных результатов. Он включает в себя преднамеренную и систематическую разработку и уточнение подсказок и базовых структур данных для манипулирования системами ИИ для достижения конкретных и желаемых результатов. С появлением искусственного интеллекта, особенно моделей обработки естественного языка, быстрое проектирование приобрело значение как средство повышения эффективности и удобства работы систем искусственного интеллекта.
Быстрая инженерия сочетает в себе элементы ==логики, кодирования, искусства и языка==.
Подскажите технические условия
Ясность подсказки. Подсказка должна быть четкой и недвусмысленной, чтобы ИИ не мог ее неверно истолковать.
Прямая точность: предназначена для получения конкретной информации или результатов, которые требуются от ИИ.
Контекст подсказки. Достаточный контекст в подсказке, такой как справочная информация или примеры, необходим для того, чтобы направить систему ИИ на получение желаемого результата.
Мгновенная адаптация: получение ожидаемых и точных результатов для моделей ИИ, обученных по-разному.
Подсказка по цепочке размышлений. Подсказка включает в себя цепочку рассуждений, которая освещает процесс рассуждений, необходимый для решения проблемы.
Подсказка от наименьшего к большему: разбить проблему на подзадачи, а затем решить каждую из них, чтобы привести ИИ в определенном направлении к окончательному решению.
Подсказка ролей: вы специфицируете контекст ИИ для конкретной специализированной роли, которая поможет получить более точные результаты.
Один, ноль или несколько подсказок. Предоставление нуля, одного или нескольких примеров вопросов/ответов, чтобы помочь установить контекст для ИИ и ограничить его движение по определенному пути и получить более точные результаты. р>
Серия роботов Азимова
Вселенная роботов Азимова — это огромный и запутанный мир, который охватывает множество романов, рассказов и взаимосвязанных сериалов. Действие происходит в будущем, когда люди колонизировали различные планеты по всей галактике. Эта вселенная характеризуется четким разделением между Землей и мирами космонавтов.
Земля, перенаселенная и технологически ограниченная, населена людьми, которые живут в огромных куполообразных городах, известных как стальные пещеры , где роботов обычно боятся и им не доверяют.
Космические миры, напротив, представляют собой технологически развитые общества с небольшим населением, где люди и роботы сосуществуют в гармонии, а роботы стали неотъемлемой частью повседневной жизни. Миры космонавтов снисходительно относятся к Земле и ее обитателям, считая их отсталыми и неполноценными.
Три закона робототехники — это центральная концепция вселенной роботов, которая служит руководящими принципами поведения роботов.
Эти законы, разработанные Азимовым, заключаются в следующем:
- Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинен вред;
- Робот должен подчиняться приказам, отдаваемым ему людьми, за исключением случаев, когда такие приказы противоречат Первому закону; и
- Робот должен защищать свое существование до тех пор, пока такая защита не противоречит Первому или Второму закону.
В рассказах Азимова взаимодействие между людьми и роботами, а также этические и философские последствия Трех законов составляют основу вселенной роботов, предлагая читателям уникальное исследование проблем и потенциальных последствий будущего, в котором человечество и передовой искусственный интеллект сосуществуют.
Азимов: Инженер без сознания
В серии и рассказах Айзека Азимова о роботах, начиная с 1950-х годов, особое внимание уделяется важности отдачи точных команд роботам, что можно рассматривать как предшественник современной быстрой инженерии. Работы Азимова продемонстрировали присущее ему понимание необходимости тщательно продуманных инструкций, особенно при работе со сложными системами искусственного интеллекта, заложенными в его роботах, работающих в соответствии с тремя законами робототехники.
Примеры оперативной разработки из произведений Азимова
Зеркальное изображение (рассказ, 1972 г.)
Во время случайного межзвездного путешествия группы космонавтов на космическом корабле происходит преступление. Две стороны - молодой и блестящий математик (Шаббат) и пожилой и признанный математик (Гумбольдт), оба обвиняют друг друга в краже блестящей новой математической идеи у другого. Единственными свидетелями являются роботы-слуги каждого математика. Детектива-землянина Элайджу Бейли просят помочь в расследовании и раскрытии преступления как можно скорее, прежде чем оно перерастет в гораздо более крупный скандал, однако все, что ему разрешено, — это взять интервью у роботов. Бейли видит, что каждая сторона выдвигает зеркальное отражение истории другой стороны, и ему нужно выяснить, какая из сторон лжет.
Детектив Бейли допрашивает робота-младшего математика (Sabbats) и проводит его по логическим шагам, которые показывают, что старший математик нанесет больший вред из-за показаний робота, и заставляет робота изменить свои показания.
Вот отрывок из допроса детектива Элайджи Бейли и робота-официанта Р. Идда, небольшие изменения для краткости:
<цитата>Бейли: Вы личный робот Gennao Sabbat, не так ли?
Робот: Я сэр.
Бейли: Как долго?
Робот: Уже двадцать два года, сэр.
Бейли: А репутация вашего хозяина ценна для вас?
Робот: Да, сэр.
Бейли: Считаете ли вы важным защищать эту репутацию?
Робот: Да, сэр.
Бейли: Защита репутации так же важна, как и физическая жизнь?
Робот: Нет, сэр.
Бейли: защитить свою репутацию так же важно, как и репутацию другого человека?
Робот: Такие дела должны решаться индивидуально, сэр. Невозможно установить общее правило.
Бейли: Если бы вы решили, что репутация вашего мастера важнее, чем репутация другого, скажем, Альфреда Барра Гумбольдта, стали бы вы лгать, чтобы защитить репутацию своего мастера?
Робот: Хотел бы, сэр.
Бейли: Вы солгали в своих показаниях относительно вашего учителя в его полемике с доктором Гумбольдтом?
Робот: Нет, сэр.
Бейли: Но если бы вы лгали, вы бы отрицали, что лгали, чтобы защитить эту ложь, не так ли?
Робот: Да, сэр.
Бейли: Что ж, давайте обсудим это. Ваш учитель, Дженнао Саббат, молодой человек с большой репутацией в математике, но он молодой человек. Если бы в этом споре с доктором Гумбольдтом он поддался искушению и поступил неэтично, его репутация несколько пошатнулась бы, но он молод и у него будет достаточно времени, чтобы оправиться. Впереди у него было много интеллектуальных триумфов, и люди в конце концов стали бы смотреть на эту попытку плагиата как на ошибку вспыльчивого юноши, лишенного здравого смысла. Это было бы чем-то, что было бы компенсировано в будущем. Если бы, с другой стороны, доктор Гумбольдт поддался искушению, дело было бы гораздо серьезнее. Он старик, чьи великие дела растянулись на века. До сих пор его репутация была безупречной. Все это, однако, будет забыто в свете этого единственного преступления его последних лет, и у него не будет возможности загладить его в оставшееся ему сравнительно короткое время. Мало ли что еще он мог бы сделать. В случае с Гумбольдтом было бы загублено гораздо больше лет работы, чем в случае с вашим учителем, и гораздо меньше возможностей вернуть себе его положение. Вы видите, не так ли, что Гумбольдт находится в худшем положении и заслуживает большего внимания?
Робот: Мои показания были ложью. Это был доктор Гумбольдт
Бейли: вам приказано никому ничего не говорить об этом, пока не будет получено разрешение от капитана корабля
Когда Бейли допрашивает старшего математика Гумбольдта, робота-слугу Р. Престона, допрос идет точно так же, за исключением части в конце, которая выглядит так:
<цитата>Бейли: Но если бы вы лгали, вы бы отрицали, что лгали, чтобы защитить эту ложь, не так ли?
Робот: Да, сэр.
Бейли: Что ж, давайте обсудим это. Ваш учитель, Альфред Барр Гумбольдт, — пожилой человек с большой репутацией в математике, но он пожилой человек. Если бы в этом споре с доктором Саббатом он поддался искушению и действовал неэтично, его репутация несколько пошатнулась, но его большой возраст и его многовековые достижения противостоят этому и одержат победу. Люди сочтут эту попытку плагиата ошибкой, возможно, больного старика, который больше не уверен в своих суждениях. С другой стороны, если бы искушению поддался доктор Саббат, дело было бы гораздо серьезнее. Он молодой человек с гораздо менее надежной репутацией. Обычно у него впереди были столетия, в течение которых он мог накопить знания и достичь великих целей. Теперь это будет для него закрыто, затемнено одной ошибкой его юности. У него гораздо большее будущее, чем у твоего хозяина. Вы видите, не так ли, что Sabbat находится в худшем положении и заслуживает большего внимания?
Робот: Мои показания были такими, как я-
Бейли: Продолжайте, Р. Престон.
Дэниел: Боюсь, друг Элайджа, что Р. Престон находится в стазисе [разбился]. Он вышел из строя.
В рассказе детектив Бейли использует эту разницу в реакциях роботов, чтобы расставить ловушку и обманом заставить настоящего вора признаться.
Здесь мы можем видеть, как Азимов использует подсказки от наименее к наибольшему, использованные Бейли во время допроса роботов. Для обоих роботов он хочет выяснить, есть ли какая-либо асимметрия в их опыте (то есть, кто из них лжет), и его подход состоит в том, чтобы вести их по пути рассуждений, где в конце он в конечном итоге ставит сложный моральный вопрос.
В конечном счете, в истории Бейли использует комбинацию этой асимметрии реакций робота и своей интуиции человеческой натуры, чтобы раскрыть дело, но очень интересно наблюдать, как Азимов предсказывает нюансы, необходимые для взаимодействия с ИИ человеческого уровня, и фактически он основывает этот основополагающий принцип. научно-фантастические сериалы работают над этим фактом.
Обход (1942)
В этой короткой истории необычайно дорогой робот Спиди отправляется с заданием получить элемент на опасной планете. Поскольку этот Спиди дорог, он запрограммирован следовать 3-му закону (робот должен защищать свое существование, пока такая защита не противоречит Первому или Второму закону) сильнее, чем обычно.
Пауэлл и Донован, главные герои, поручают Спиди извлечь селен из пула селена. Людям это нужно, чтобы перезарядить свои энергетические клетки, которые на исходе, и защитить себя от жары. Однако они непреднамеренно создают конфликт между Вторым и Третьим законами робототехники, давая Спиди неточную команду, которая не подчеркивает важность миссии. Они инструктируют Спиди: «Иди и возьми [селен]». Из-за опасности, исходящей от пула селена, и склонности Спиди следовать 3-му закону более строго, чем обычно, Спиди застревает в петле, неспособной расставить приоритеты своих приказов (Второй закон) над своим самосохранением (третий закон).< /p>
Проблема в конечном итоге решается тем, что Пауэлл подвергает себя опасности, что приводит к срабатыванию Первого закона и вынуждает Спиди сделать его спасение приоритетом. Пауэлл и Донован вначале дают Спиди неточную команду:
<цитата>Затем он сказал: "Послушай, Майк, что ты сказал Спиди, когда отправил его за селеном?"
Донован был ошеломлен. "Ну, черт возьми, я не знаю. Я просто сказал ему, чтобы получить его."
"Да, я знаю, но как? Постарайся запомнить точные слова."
"Я сказал... э-э... Я сказал: "Спиди, нам нужно немного селена. Ты можешь получить его в таком-то месте. Иди и возьми" — вот и все . Что еще вы хотели, чтобы я сказал?"
Ключевым моментом здесь является то, что эта команда, данная Донованом Я только что сказал ему получить это, была неточной, потому что не содержала срочности. Во вселенной Asimovs Robots тон и подача команды являются просто дополнительными переменными самой подсказки. Так как тон командования не был особенно настойчивым, это привело к конфликту между тремя законами.
Поскольку скорость застряла в цикле и не может принять другую подсказку, которая была повторена и переформулирована с большей точностью, единственным способом получить правильное действие было изменить другие переменные во вселенной, чтобы первоначальная неточная подсказка привела к желаемому результату. . В конце концов Пауэлл решает проблему, подвергая себя опасности, вынуждая Спиди уделить первоочередное внимание его спасению (приоритет отдается 1-му закону) и выводит его из тупика между 2-м и 3-м законами.
Эта история показывает, как неправильное использование контекста в подсказке (приказ Speedy) приводило к неточным результатам. Правильным контекстом является этот отрывок из Runaround:
<цитата>Единственное, что могло их спасти, — это селен. Единственное, что могло получить селен, это Спиди. Если Соиди не вернулся, нет селена. Никакого селена, никаких фотоэлементов. Никаких фотобанков — ну, смерть от медленного жарения — один из самых неприятных способов покончить с собой.
Донован свирепо потер свою рыжую копну волос и выразился с горечью.
«Мы станем посмешищем для Системы, Грег. Как все могло так быстро пойти наперекосяк? Великая команда Пауэлла и Донована отправляется на Меркурий, чтобы сообщить о целесообразности повторного открытия горнодобывающей станции Сансайд с использованием современных технологий и технологий. роботы и все портим в первый же день. Тоже чисто рутинная работа. Никогда не проживем."
"Нам не придется, возможно," тихо ответил Пауэлл. "Если мы не предпримем что-то быстро, ни о какой скромной жизни - или даже просто о жизни - не может быть и речи".
Подсказка также страдала от недостатка адаптируемости, хорошая подсказка должна давать точные результаты в разных системах ИИ. Донован говорит, что он отдал быстрый стандартный приказ (подсказка) достать селен.
<цитата>Донован: "Я сказал... э-э... Я сказал: "Спиди, нам нужно немного селена. Ты можешь получить его в таком-то месте. Иди и бери - и все. Чего еще ты хотел?" мне сказать?"
Пауэлл: "Вы ведь не придавали заказу срочности?"
Донован: «Зачем? Это была чистая рутина».
Неправильное предположение состоит в том, что простой приказ/подсказка о получении селена, который отлично работает на любом другом роботе/ИИ, будет работать так же и на Спиди, но, поскольку мы знаем, что «позитронный мозг»/нейронная сеть Спиди обучены иначе (усилен 3-й закон самосохранения) Спиди не стандартный ИИ. Поэтому следовало использовать более адаптируемый запрос/порядок.
Принципы ясности, контекста и адаптируемости подсказок, отдаваемых ИИ для получения точных результатов, являются основной концепцией разработки подсказок. Обычно считается, что чем более описательным и подробным будет приглашение, тем лучше будут результаты. PromptingGuide.ai а>. В этом рассказе (впервые написанном в 1942 году) Азимов подробно показывает, как несоблюдение этих правил может привести к неточным результатам.
Стальные пещеры (1954)
«Стальные пещеры» были впервые опубликованы в 1954 году и являются первым романом из серии романов, действие которых происходит во вселенной роботов. В нем представлены персонажи — детектив Элайджа Бейли и робот Дэниел Оливау.
История разворачивается в далеком будущем. Жители Земли живут в больших городах с куполами и питают глубокую обиду на космонавтов, группу людей, которые колонизировали другие планеты и освоили передовые технологии и робототехнику. Азимов использует повествование о приятеле-полицейском, чтобы исследовать темы предубеждений, ИИ, технологий и сотрудничества. Партнерство между Бейли и Дэниелом служит краеугольным камнем серии роботов Азимова, которая продолжает углубляться в динамичные отношения между людьми и роботами/ИИ, а также проблемы, с которыми они сталкиваются при сосуществовании.
В главах «Слова эксперта / Переход к машине» есть короткая, но очень умная сцена, которая показывает, что еще в 1954 году Азимов предсказал необходимость оценки эффективности ИИ и что оценка может быть очень инвазивной, но также будет метод более простой оценки, чтобы быстро проверить работоспособность и точность модели.
В рассматриваемой сцене задействован земной робототехник (доктор Герригель), которого Бейли попросил провести оценку робота Дэниела Оливо, чтобы убедиться, что у него правильно установлен 1-й закон (в основном точная модель).
Когда доктор Герригель предлагает компьютерные лаборатории для любого оборудования, которое ему может понадобиться, он отвечает:
<цитата>Доктор. Джерригель: Дорогой мистер Бейли, мне не нужна лаборатория.
Бейли: Почему бы и нет?
Доктор. Джерригель: Проверить Первый закон несложно. ... это достаточно просто.
Бейли: Не могли бы вы объяснить, что вы имеете в виду? Вы хотите сказать, что можете проверить его здесь?
Доктор. Джерригель: «Да, конечно. Послушайте, мистер Бейли, я приведу вам аналогию. Если бы я был доктором медицины и должен был проверить уровень сахара в крови пациента, мне понадобилась бы химическая лаборатория. Если бы мне нужно было измерить его базовый уровень метаболизма, или проверить его корковую функцию, или проверить его гены, чтобы точно определить врожденный дефект, мне понадобилось бы сложное оборудование. С другой стороны, я мог проверить, был ли он слеп, просто проведя рукой перед его глазами, и я мог проверить, мертв ли он, просто пощупав его пульс. «Я имею в виду, что чем важнее и фундаментальнее тестируемое свойство, тем проще необходимое оборудование. То же самое и в роботе. Первый закон является фундаментальным. Это влияет на все. Если бы его не было, робот не мог бы правильно реагировать двумя дюжинами очевидных способов».
Описание фактической оценки, которую д-р Герригель проводит с Дэниелом, описывается следующим образом:
<цитата>То, что последовало за этим, смутило и разочаровало его.
Доктор. Герригель продолжал задавать вопросы и выполнять действия, которые казались бессмысленными, перемежаясь ссылками на свою тройную логарифмическую линейку, а иногда и на зрителя.
Однажды он спросил: "Если у меня есть две двоюродные сестры с разницей в возрасте в пять лет, младшая из которых девочка, какого пола старше?"
Дэниел ответил (неизбежно, подумал Бейли): «Невозможно сказать по предоставленной информации».
На что единственным ответом доктора Герригеля, помимо взгляда на секундомер, было вытянуть правую руку как можно дальше в сторону и сказать: «Не могли бы вы коснуться кончика моего среднего пальца кончиком безымянный палец левой руки?»
Дэниел сделал это быстро и легко.
Через пятнадцать минут, не больше, доктор Герригель закончил.
Это не отличается от современных подходов к оценке больших языковых моделей (LLM). LLM можно оценивать с помощью более сложного подхода, который включает в себя интеграцию в другие приложения и процессы, называемые внешней оценкой. и более интроспективный, но более быстрый подход, который включает оценку AI LLM, непосредственно называемую внутренней оценкой. а>. Оценка модели выполняется с помощью таких мер, как недоумение< /a> и энтропия используя математические формулы в наборе данных.
Когда доктор Герригель оценивает Дэниела, он проводит серию тестов, чтобы оценить физические и функциональные свойства робота, чтобы определить, действительно ли это робот, и понять, правильно ли он был установлен с учетом 1-го закона. Точно так же внутренняя оценка большой языковой модели включает анализ ее внутренней работы и производительности при выполнении конкретных задач, чтобы понять, насколько хорошо она усвоила языковые шаблоны, отношения и знания из обучающих данных.
Он часто включает измерение его производительности при выполнении различных лингвистических задач, таких как предсказание следующего слова в предложении, ответы на вопросы или обобщение текста. Исследователи также могут анализировать внутренние представления модели, например, изучать изученные встраивания или механизмы внимания, чтобы получить представление о лингвистических знаниях, которые она приобрела во время обучения. Эти оценки помогают определить сильные и слабые стороны модели, а также ее способность понимать и генерировать человекоподобный язык.
В обоих случаях оценки предназначены для оценки возможностей субъекта (Дэниела или большой языковой модели) и для понимания лежащих в их основе механизмов.
Несмотря на то, что Азимов не особо строит мир вокруг деталей своего метода «внутренней оценки» доктора Герригеля из Дэниела, удивительно, что Азимов предсказал, что этот тип оценки ИИ будет использоваться 70 лет назад.
Заключение
Это всего лишь несколько примеров того, как Айзек Азимов вникал в сложные отношения между ИИ и человечеством, предвидя важность быстрого проектирования для получения более качественных ответов от ИИ и роботов. Серия роботов Азимова представляет собой спекулятивную научную фантастику, которая становится все более актуальной благодаря широкому успеху больших языковых моделей и искусственного интеллекта. Эта основная работа предлагает ценный исторический контекст и информацию для специалистов по данным и инженерам по машинному обучению, проливая свет на происхождение многих современных идей и вдохновения в этой области.
Ссылки
Концепции и варианты использования Prompt Engineering
Выбор правильных типов подсказок
Руководство по оперативной разработке р>
Домашняя страница Андрея Карпаты
Оригинал