
Судья находит обучение ИИ по полным книгам «разумно необходимым»
3 июля 2025 г.Андреа Барц, Чарльз Гребер и Кирк Уоллес Джонсон против Антропического ПБК, извлеченного 25 июня 2025 года, является частью
3. Сумма и субстанция используемой части
Третьим фактором справедливого использования является «сумма и субстанция части» работы, защищенной авторским правом, используемой обвиняемым. 17 США § 107 (3). Суть этого фактора заключается в том, была ли сумма «разумной по отношению к цели копирования». Кэмпбелл, 510 США в 586. Таким образом, количество копирования рассматривается сначала против самой работы, а затем, что более важно против предложенной преобразующей цели. См. Уорхол, 598 США в 543 и N.18.
A. Копии, используемые для обучения конкретных LLMS
Копии, выбранные для включения в учебные наборы, были выбраны, потому что они были завершены и потому, что они содержали богатое защитное выражение, или, так как этот порядок принимает показания для авторов. Было ли все это копирование разумно необходимым для преобразующего использования?
Да.
«То, что имеет значение [], так это не столько« сумма и существенность используемой части »при создании копии, а скорее сумма и существенность того, что, таким образом, стало доступным для общественности [в предполагаемом вторичном использовании], для которого он может служить конкурирующей заменой [для первичного использования]». Google, 804 F.3d в 222. Здесь, опять же, нет никаких утверждений о какой -либо прослеживаемой связи между выходами службы Claude и работами авторов. Копирование, используемое для обучения LLM, лежащих в основе Клода, было особенно разумным.
В ответ авторы возражают в основном, что копирование, используемое при обучении, было чрезвычайно обширным, так и не необходимым.
Что касается обширного копирования, то это правда, что все работы были скопированы. И, «Копирование [] всю работу [s]‘ охватывает [s] против вывода справедливого использования ». Всемирная Церковь Бога против Филадельфии Церковь Бога, Inc., 227 F.3d 1110, 1118 (9th Cir. 2000) (цитируя Hustler Mag. Inc. v. Morame Inc., 796 F.2d 1148, 1155 (9th Cir. 1986); 1986); 1986); 1986); 1986); См. Кэмпбелл, 510 США в 587. Но мы только что рассмотрели, почему аргумент авторов неверен. Копии, которые относятся к этому фактору, - это те, которые просто служат тому же использованию, что и обычная работа. Авторы не утверждают, что такое копирование. Обвиняемые используют здесь инкрементных копий столь же ортогонально, насколько это возможно, для обычного использования книги.
Что касается строгой необходимости, авторы делают более сильную точку зрения. Когда продуктивное использование стало возможным только заимствованием с определенной работы, справедливое использование поднимается к его зениту. Когда продуктивное использование возможно без заимствования, справедливое использование падает на его надир - и заимствование заслуживает особенно убедительного оправдания. См. Warhol, 598 США в 543 и N.18, 547. Здесь верно, что Anpropic мог бы использовать некоторые другие книги или вообще вообще не для обучения своих LLMS - или так, как этот порядок принимает записи для авторов. Но Anpropic представила убедительное объяснение того, почему все равно было достаточно необходимо использовать их.
Во -первых, все согласны с антропным нуждающимся в миллиардах слов для обучения любого данного LLM. Если использовать только книги, Anpropic потребовалось бы миллионы книг на модель. Если использование набора, содержащего лишь небольшую часть книг и большую часть других текстов, Антропику все еще потребовалось бы сотни тысяч книг. Авторы утверждают, что, поскольку Антропик показал, что он может использовать такие меньшие наборы книг, он, безусловно, мог бы использовать никаких книг вообще - или, по крайней мере, не их книги (OPP. 23). Но авторы забывают, что «достаточно необходимый» не означает «строго необходимо». Авторы не знают, что объем текста, необходимый для обучения LLM, является монументальным. Поскольку использование так много работ было достаточно необходимым, использование любой одной работы для фактической обучения LLMS было примерно столь же разумным, как и следующая.
С другой стороны, ни один результат для общественности даже предположительно нарушает. Итак, да, работы авторов были выбраны как самые сильные примеры письма. Но убедительные преимущества обучения LLMS по сильным примерам не были компенсированы откровениями для общественности любой части самих работ. То, что было скопировано, было поэтому особенно разумным и убедительным.
Третий фактор, таким образом, способствует справедливому использованию для обучающих копий.
B. Копии, используемые для создания центральной библиотеки
Но опять же, было отдельное использование - различие, которое имеет некоторое значение относительно того, были ли сумма и содержание копирования «разумным в отношении цели копирования» для копий библиотеки. Кэмпбелл, 510 США в 586.
(i) Приобретенные библиотечные копии, преобразованные из печати в Digital.
Для копий библиотеки печати, которые приобрел антропной, а затем преобразован в копии цифровой библиотеки, Anpropic уже пользовался правом, чтобы сохранить копии в своей библиотеке. Цель копирования состояла в том, чтобы держать их в его библиотеке, но с более благоприятными свойствами хранения и поиска. Копирование всей работы было именно то, что потребовалось этой цели. Там не было избыточного копирования. Источник была уничтожена.
Третий фактор справедливого использования предпочитает справедливое использование для приобретенных библиотечных копий, преобразованных из печати в цифровой.
(ii) Пиратская библиотека копий.
Однако для пиратских библиотечных копий в Антрике не было никакого права на хранение копий книг вообще. Его цель, по его словам, состояла в том, чтобы обучать LLMS. Но его объективным поведением было поиск «всех книг в мире», а затем сохранить их даже после того, как решает, что это не сделает дальнейшие копии от них для обучения, что указывает на то, что есть и другие применения. Против того, чтобы приобрести все книги, которые можно было бы на шанс, что некоторые могут оказаться полезными для обучения LLMS и, возможно, и других вещей, почти любое несанкционированное копирование было бы слишком много. Антропический скопировал миллионы книг в Toto, работы авторов среди них.
Третий фактор указывает на справедливое использование для пиратских библиотечных копий.
Продолжить чтениеЗДЕСЬПолем
О серии Hackernoon Legal PDF: мы представляем вам самые важные технические и проницательные документы в суде государственного достояния.
Это дело суда, полученное 25 июня 2025 годаStorage.courtlistener.com, является частью общественного достояния. Созданные судом документы являются произведениями федерального правительства, а в соответствии с законодательством об авторском праве автоматически помещаются в общественное достояние и могут быть разделены без юридических ограничений.
Оригинал