Добро пожаловать в музей галлюцинаций ИИ

Добро пожаловать в музей галлюцинаций ИИ

15 июля 2025 г.

TLDR; В этой статье исследует удивительный творческий потенциалИИ галлюцинациивГенеративные модели ИИКак Далл · е. Хотя обычно рассматриваются как недостатки вглубокое обучение, эти «ошибки» могут создать неожиданный художественный блеск. Сравнивая человеческое воображение с логикой, основанной на рисунке, пьеса вопроса о том, может ли ложь ИИ на самом деле новым видом творчества. Это бросает вызов тому, как мы определяем правду, ошибку и вдохновение в эпохуискусственный интеллектПолем

Что это значит для ИИ «галлюцинировать»?

Термингаллюцинациядавно несет весомые коннотации. Согласно словарю Oxford Advanced Curner, галлюцинация:

«Факт, казалось бы, видел или слышал кого -то/чего -то, чего на самом деле нет, особенно из -за болезни или наркотиков».

Другими словами, галлюцинации обычно ассоциируются с ложными восприятием - чем -то, чего следует бояться или фиксировать.

В мире генеративного ИИ значение не так другое. Когда LLM (большая языковая модель), такая как CHATGPT или генеративная модель ИИ, такая как Dall-E, как говорят, «галлюцинировал», это означает, что он произвелложная или вводящая в заблуждение информациюПолем Последствия этого серьезны: это говорит о том, что мы никогда не сможем полностью доверять модели. Потенциальные риски? Вводящие в заблуждение факты, опасные советы или сломанное программное обеспечение.

Когда галлюцинация заходит слишком далеко

Давайте начнем с темной стороны. Представьте, что вы планируете романтический вечер в городе, который вы никогда не посещали. Вы просите Chatgpt порекомендовать ресторан и выбирать из многообещающего списка мест. Но когда вы приедете - все одеты - вы обнаружите, что ресторана не существует в указанном месте. Более того, он не существует ни в одном месте. На самом деле, это никогда не было.

Раздражающий? Определенно. Но это относительно безобидный пример.

Теперь рассмотрим больше разрушительных сценариев:

  • Медицинская дезинформацияприводит к неправильным диагнозам и лечению.
  • Исторические неточностиЭто стоило ученику их оценки.
  • Кодовые ошибкичто сбой целых систем.
  • Автономное неисправность вожденияиз -за ошибочных интерпретаций.

ИИ галлюцинации - это не просто вымышленные побочные эффекты; они могут иметьреальные последствияПолем

Пентагон, который не был

Два года назад проверенная учетная запись Twitter (теперь x) опубликовалаизображение взрываПолем На фото было взрывающееся облако дыма рядом со зданием, какПентагонПолем Твит стал вирусным и вызвал быструю реакцию на рынке - Доу Джонс упал на 85 очков всего за четыре минуты.

Вот рассол - изображение было фальшивым.

Изображение, вероятно, было сгенерировано ИИ, и взрыв никогда не произошел. Но к тому времени, когда он был развенчан,Финансовый ущерб уже был нанесенПолем

Неясно, была ли это подсказкой на человеке, которая создала это изображение или галлюцинацию модели, но в любом случае результат был таким же.

Когда боты составляют политику

Совсем недавно,Компьютерная служба поддержки Cursor Insure Inmaring Inslaving пользователям, что инструмент больше не может использоваться на нескольких машинахПолем Последовало возмущение - пользователи жаловались, некоторые даже отменили свои подписки.

Была только одна проблема:Это не было правдойПолем

Позже генеральный директор курсора пояснил: «У нас нет такой политики. Вы, конечно, свободны использовать курсор на нескольких машинах». Кто был ответственным, спросите вы? «К сожалению, это неверный ответ от передовой линии A.I. поддержка бота». Заявил генеральный директор.

Таким образом, ИИ изобрел политику из воздуха.

Катастрофа зала суда

Возможно, самый известный пример: tАдвокаты WO использовали CHATGPT, чтобы помочь разработать юридическое краткое описаниеПолем Цитируется модельПолностью сфабрикованные юридические случаиПолем Адвокаты, не зная, представили их федеральному судье. Результат? Санкции, штрафы и публичное смущение.

Судья заявил, что они «отказались от своих обязанностей» и продолжали стоять у поддельных цитат даже после того, как их допрашивали.

Может ли галлюцинация быть ... хорошей?

Эти примеры усиливают один вывод:ИИ нельзя доверять вслепуюПолем Каждый вывод должен быть дважды проверен, независимо от того, насколько это может быть убедительно и уверенно.Хотя, можете ли вы полностью доверять людям?

А что, если мы посмотрим на галлюцинацию под другим углом?

Именно тогда я вспомнил что -то убедительное. Один из самых дальновидных умов в технологической истории - тот, кто буквально помог сформировать мир, в котором мы живем, - также был известен тем, что охватывал галлюцинацию. Не случайно, но по дизайну.

Стив Джобс, культовый соучредитель Apple, открыто приписывал психоделические лекарства, такие как LSD, за расширение его творческого мышления. Он не стеснялся этим. На самом деле, он назвал этот опыт как один из самых глубоких в его жизни.

Работа не была обусловлена конвенцией - он был обусловлен воображением. Любите его или ненавидите его, никто не может отрицать масштаб его воздействия. Он не просто строил продукты; Он наклонил реальность, чтобы соответствовать своему видению. И если измененное восприятие сыграло роль в этом процессе, разве мы не должны пересмотреть то, что мы имеем в виду, когда говорим идею - или изображение - является «галлюцинированным»?

Работа, ЛСД и творчество

Стив Джобс открыто приписывал его творческие прорывы психоделическим опыту. В биографии Уолтера ИсааксонаСтив Джобс, он говорит:

«Взять LSD было глубоким опытом, одной из самых важных вещей в моей жизни. LSD показывает вам, что в монете есть другая сторона, и вы не можете вспомнить это, когда он изнашивается, но вы это знаете. Это укрепило мое чувство, что было важно - создание великих вещей вместо того, чтобы зарабатывать деньги».(стр. 37, глава: «Отбрасывание»)

Если галлюцинация может помочь человеку увидеть мир по -другому, может ли галлюцинация ИИ служить той же цели?

Когда галлюцинация становится творческим компасом

Может ли галлюцинация, когда она помещена в правильный контекст, быть больше, чем просто недостатком? Может ли это, на самом деле, статьвоображение? В областях, где точность является вторичной по отношению к видению, таким как искусство, рассказывание историй или дизайн, возможно, мы не смотрим не на ошибку, а неожиданную особенность.

В моей предыдущей статьеЯ исследовал, как Dall-E SO, называемые галлюцинациями, превратили грубые детские наброски в яркие, полноценные иллюстрации. ИИ заполнил пробелы не фактами, а с талантом - интерпретацией, а не репликация.

Но можем ли мы пойти дальше?

Как художник, я знаю вес творческого блока. Он тихо подкрадывается, затем остается дольше, чем следовало. Чем больше вы пытаетесь навязать оригинальность, тем больше ваши идеи возвращаются в те же знакомые закономерности - безопасные, предсказуемые и скучные. Вы прокручиваете Pinterest часами, охотитесь за иской, но ваш разум просто продолжает возвращаться к вещам, которые он уже видел.

Что если генеративный ИИ - это не просто инструмент, а своего родаТворческая медицина? Не заменить человеческое воображение, а чтобы потрясти его. Чтобы предложить пути, мы никогда не будем идти самостоятельно. Может быть, в пространстве между точностью и ошибкой мы находим что -то лучше:Сюрприз.

Логика - это ваш враг

Наши умы подключены ккогерентностьПолем
Когда мы видим замок, мы представляем принцессу. Собака? Наверное, погоня за мячом. Малыш? Обнимая плюшевого мишка.

Это автоматическое распознавание образцов невероятно полезно для повседневной жизни - оно помогает нам быстро и эффективно ориентироваться в мире. Но вот улов: это также строит невидимыйкоробкив нашем мозге. Коробки, которыепределнаш творческий потенциал.

Ловушка категоризации: ваш мозг любит историю

Давайте посмотрим на следующие карты:

Теперь представьте, что я попросил вас сгруппировать их в 3 четные категории. Большинство умов мгновенно увидят это:

  • Аночное небос луной, облаком и звездой
  • Ачаепитиесцена со столом, кусочек торта и, возможно, чайник
  • Алесс лисой, деревом и грибом

Вы можете добавить вариации - возможно, ваша лиса нюхает гриб, или, может быть, если вы более креативны, чем обычный человек, она сидит рядом с коемдой, нарисую его на палке. Но даже в нашем самой творческой,Мы все еще придерживаемся сценарияПолем Контекст блокирует нас в структуре.

И когда все работают с одной и той же рамки ... уникальность умирает немного.

Разрыв контекста (специально)

Теперь давайте сломем это.

Давайте пробежаем ожидаемые и выбросим наши логические инстинкты из окна.Давайте бросим вызов логике в пользу безграничного творчества.
Представьте себе эту группировку:

  • Луна

  • Лиса

  • Таблица

Ага. Ваш мозг просто остановился, не так ли?

Вы, вероятно, не могли бы создать визуальное. Или, если вы это сделали, это чувствовало себя разрозненным, абсурдным, даже неудобным.

Но угадайте, что не борется? Генеративный ИИ, конечно.

Вместо этого давайте представим следующую группировку:

И теперь давайте наслаждаемся безграничным воображением Dall-E 3.

Начинает праздновать день рождения с грибным тортом

Generated by the author using DALL-E 3.

Питье дерева в облаке

Generated by the author using DALL-E 3.

Лиса и лунная чаепития

Generated by the author using DALL-E 3.

Свободно от человеческой логики

Далл-е легко смог смешать концепции, которые никогда не встречаются в реальном мире (галлюцинации).

Почему между нашим умом и его мышлением существует такая разница?

Люди склонны рассуждать на основеЗначение, когерентность и живой опытПолем Когда попросили представить сцену с участием луны, лисы и стола, наш мозг инстинктивно пытаетсяразобраться в комбинацииПолем Мы хотим повествование. Наши умы ищут логику, контекст или метафору, и когда мы не можем его найти, мы часто останавливаемся или сдаемся. Это потому, что человеческий мозгоптимизирован для актуальности, не случайность.

Dall-E, с другой стороны, не полагается на личную память или линейную логику. Это обученомиллиарды изображений и подписей, разоблачение егоБесчисленные визуальные комбинации -Многие из них необычные или даже сюрреалистические. Поэтому, когда вы предпринимаете это не связанными с такими элементами, как луна, лиса и таблица, это не колеблется или задается вопросом, имеет ли связь «смысл». Вместо этого он рисует изстатистические закономерностио том, как появились эти объектывместе, рядом друг с другом или в аналогичном визуальном контексте, даже если косвенно.

Другими словами:

  • Людям нужна когерентность.
  • Далл-е просто нуждается в корреляции.

И в этом заключается его сила: свободна от потребности человека в логике или внутренней согласованности, Dall-E можетуверенно генерируйте абсурд, поэтическое или прекрасно странное -Все без второго догадки.

Муза человека

Нас учили бояться галлюцинации - справедливо так во многих областях. В области медицины, права, истории и критичных безопасности ИИ должен придерживаться более высокого уровня истины. Но в искусстве, дизайне и воображении? Правила разные.

Сам «недостаток», который делает ИИ ненадежным в качестве фактического источника, может быть тем, что делает его таким мощным, какТворческий компаньонПолем Галлюцинация в правых руках становится чем -то другим полностью:искраПолем

Когда Dall -e «неправильно понимает» лису, луну и стол, он не проходит - этосмецПолем Он приглашает нас ослабить нашу хватку на логике, увидеть, что происходит, когда мы отпускаем повествование и воспринимаем возможность.

Это явление может вылечить блок художника, помогая нашему разуму ослабить контекст и логику, оно может повысить творчество и искать идеи, которые могли бы быть за пределами нашего понимания.

Так что, может быть, настоящий вопрос не в том, «мы можем остановить ИИ от галлюцинации?»

Может, это:Что мы можем построить, когда позволим ему мечтать?

Обо мне

Я - Мария Питерберг - эксперт по искусственному искусству, ведущий команду программного обеспечения для выполнения в Habana Labs (Intel) и полупрофессиональный художник, работающий на традиционных и цифровых средах. Я специализируюсь на крупномасштабных системах обучения искусственного интеллекта, включая библиотеки связи (HCCL) и оптимизацию времени выполнения. Бакалавр информатики.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE