
Представляем паслен: инструмент, помогающий художникам сражаться с ИИ
7 июня 2025 г.Еще раз привет, дорогие читатели. Меня зовут Джон Киган, и я журналист по расследованию данных здесь, на размере. Возможно, вы читали мои отчеты оКак прочитать политику конфиденциальности,КомпаниичтоГувер вверхтвойПерсональные данные, иКак вы упакованыв качестве данных для индустрии таргетинга в Интернете.
Перед тем, как моя карьера стала стать тем, что написала слова в новостях, я рисовал иллюстрации, которые бежали рядом с ними. Как человек, который приходит из фона визуальных эффектов, я был очарован ростом генеративных инструментов текста до изображения AI, таких как стабильная диффузия, Dall-E и Midjourney.
Когда я узнал о том, как эти инструменты были обучены, употребляя буквально миллиарды изображений из Интернета, я был удивлен, увидев, что некоторые из моих собственных изображений быличасть учебного набора, включено без каких -либо компенсаций или одобрения вашим по -настоящему.
Я далеко не один. В целом, многие художники не довольны тем, как их работа (и их фирменные стили) были превращены в подсказки, которые лишают их контроля и компенсации их произведений искусства. Но теперь команда исследователей компьютерных наук в Чикагском университете хочет выровнять игровое поле и артистов -армии с помощью инструментов, которые им необходимы для борьбы с несанкционированным использованием своей работы по обучению новых моделей искусственного интеллекта.
В статье описывается новый инструмент под названием «Паслен», который можно использовать против этих мощных генераторов изображений. Названный в честь смертельной травы, паслены позволяет любому невидимо изменять пиксели изображения, чтобы «отравить» изображение. Наряду с неправильно меченными метаданными, «атака отравления» может помочь генерировать неправильные результаты в генераторах изображений, например, что привлечение «Фотографии собаки» генерирует фотографию кошки.
Я поговорил с Шоном Шан, аспирантом и ведущим студентом статьи под названием «Атаки от отравления быстрого отравления на генеративных моделях текста до изображения.”Бумагашироко освещался в СМИКогда он упал на arxiv.org в конце прошлого месяца. Но я хотел узнать больше о том, что означает паслен для борьбы за права артистов в Интернете, и о потенциале, который инструмент может затронуть гонку вооружений между создателями и разработчиками генераторов ИИ, чей жадный аппетит к данным не считается насыщенным в ближайшее время.
Интервью было отредактировано для ясности и краткости.
Джон Киган:Можете ли вы рассказать мне немного о работе, которую выполняла ваша команда, и что привело вас к созданию паслена?
Шон Шан:Мы думаем, что в настоящее время между художниками или индивидуальными создателями и крупными компаниями действительно существует огромная силовая асимметрия, верно?
Большая компания просто берет ваши данные, и нет ничего не может сделать. ХОРОШО. Итак, как мы можем помочь? Если вы возьмете мои данные, это нормально. Я не могу остановить это, но я введу определенный тип вредоносных или изготовленных данных, так что вы будете отравлять, или это повредит вашей модели, если вы возьмете мои данные. И мы разработали его таким образом, что очень сложно разделить то, что такое плохие данные, какие хорошие данные с сайтов художников. Так что это действительно может дать некоторые стимулы как компаниям, так и художникам, чтобы просто работать вместе над этой штукой, верно? Вместо того, чтобы просто компания, берущая все от художников, потому что они могут.
Киган:Похоже, все атаки, которые вы выкладываете, требуют от злоумышленника оставить отравленные данные на пути модели, которая собирает данные. Так что уже слишком поздно для изображений, которые уже были сокручены и подарили в модели, верно? И это работает только в том случае, если кто -то использует паслен, публикует изображение в Интернете, а изображение будет скрасивается в какой -то момент в будущем?
Шан:Это правильно.
Киган:Можете ли вы описать, как может выглядеть один единственный кусок отравленных данных?
Шан:Таким образом, мы обсудили два типа атак - один просто очень тривиальный, точно так же, как ОК, все, что мне нужно сделать, это опубликовать изображение кошки, изменить текст альт на «картину собаки» и модель - если у вас достаточно этого - это имеет смысл, что модель начнет ассоциировать «собаку», вы знаете изображения кошек.
Но это довольно легко удалить, верно? Это очень ясно для человека, но также для многих машинных систем, что это неверно. Таким образом, мы проделали некоторую работу, где мы пытались сделать образ кошки, который выглядит как кошка для человека, но для модели он будет думать, что это на самом деле собака.
Киган:Ваша статья описывает, как художники могут использовать паслен в качестве защиты от несанкционированного использования их изображений. Но это также предлагает некоторые увлекательные примеры возможного использования компаний. Одним из примеров, который вы упомянули в газете, является то, как можно использовать паслен для рекламы, манипулируя моделью для производства фотографий автомобилей Tesla, например, когда кто -то типит в «Роскошных автомобилях» в качестве подсказки. И вы также предлагаете представление о том, что такая компания, как Disney, может использовать это для защиты своей интеллектуальной собственности, заменив символов Disney в подсказки на общие запасные символы. Ваша команда рассмотрела, куда все это направлено?
Шан:Да, абсолютно. Вероятно, есть много вариантов использования. Но я думаю, что, возможно, похоже на случай DRM [цифровые права], вы знаете, вы можете защитить авторские права, но есть и множество злоупотреблений защиты содержания людей, используя авторские права в прошлом.
Мое мнение о этом пространстве в том, что это как бы о силовой асимметрии. Прямо сейчас у художников действительно очень ограниченная сила, и что -нибудь очень поможет, верно? Там может быть некоторый залоговый ущерб или некоторые побочные эффекты определенной компании, которая делает что -то, но, по нашему мнению, стоит того, просто чтобы дать художникам инструмент для борьбы.
Еще одним восприятием этого является то, что некоторые из этих развлекательных компаний, возможно, не Disney, но небольшая или средняя игровая компания также очень обеспокоена искусственным искусством. Таким образом, это, вероятно, также может помочь в этих случаях.
Киган:Какие контрмеры могут развернуть компании, связанные с такими инструментами, как паслен?
Шан:Мы смотрели на несколько видов механизмов детекторов. Несмотря на то, что мы пытаемся заставить изображения выглядеть одинаково, возможно, есть способы определить разницу, и (компании, которые разрабатывают генераторы изображений), конечно, есть множество людей, чтобы сделать это.
Итак, вы знаете, они могут отфильтровать их, скажем, хорошо, это вредоносные данные, давайте не будем тренироваться на них. В некотором смысле мы также выигрываем в этих случаях, потому что они удаляют данные, которые мы не хотим, чтобы они тренировались, верно?
Так что это также своего рода польза от этого случая. Но я чувствую, что могут быть некоторые способы (компании) могут обучить их модель быть надежными против подобных атак, но действительно неясно, что они делают в эти дни, потому что они на самом деле не слишком много говорят об этом, чтобы увидеть, действительно ли это действительно большой заботой для них или, если у них есть способы обойти это.
Но как только мы разместим, как только мы начнем изучать немного больше, возможно, мы увидим, что эти компании относятся к этому.
Киган:Это приводит меня к следующему вопросу, и мы видим, как крупные компании, какСалатиГеттиВыпустите инструменты искусственного интеллекта, которые поставляются с уверенностью в том, что они были обучены только лицензированным изображениям. На этой неделе Openai (создатель Chatgpt и Dall-E 3) объявил, что этоПредлагая, чтобы помочь оплатитьДля любых судебных исков об авторском праве, которые клиенты его бизнес -уровня могут быть в результате использования их продуктов. Учитывая юридическую неопределенность, и теперь потенциал для состязательного саботажа с такими инструментами, как паслен, видели ли мы последние из крупномасштабных усилий по цене по обучению моделей ИИ в открытой паутине?
Шан:Поэтому я думаю, что компании намного более осторожны с тем, что они делают и что делают их услуги. Как будто мы не знаем, где они получают данные на данный момент? Но я просто играл с Open.ai вчера. В своей новой модели они очень осторожны. Например, вы не сможете использовать имя любого художника, чтобы вызвать его, если они не родились до 20 -го века или чего -то.не допускаетобщественные деятели в подсказываниях]. Так как есть вещи, они определенно обеспокоены этим. И, конечно, это из -за этих судебных процессов, из -за этих проблем.
Поэтому я не удивлюсь, если они останутся - возможно, временно - разжигая эти наборы данных, потому что у них, вероятно, есть слишком много данных. Но я думаю, что в долгосрочной перспективе им придется адаптировать свою модель, верно? Ваша модель может просто застрять в 2023 году, и в какой -то момент вам нужно узнать что -то новое. Поэтому я бы сказал, что они, вероятно, все еще будут продолжать соскрести эти веб -сайты и, возможно, немного более тщательно. Но мы не знаем на данный момент.
Спасибо за чтение,
Джон Киган
Журналист по расследованию данных
Разметка
- Джон Киган, Журналист по расследованию данных
Дизайн и графика
- Габриэль Хонгсдусит
Обручение
- Мария Пуэртас
Редактирование
- Майкл Рейли
Также опубликованоздесь
ФотоДжози ВайснаНеспособный
Оригинал