The Times против Microsoft/OpenAI: несанкционированное воспроизведение Times работает в моделях GPT (11)

The Times против Microsoft/OpenAI: несанкционированное воспроизведение Times работает в моделях GPT (11)

2 января 2024 г.

:::совет Судебное заявление компании New York Times против корпорации Microsoft от 27 декабря 2023 г. является частью серии юридических PDF-серий HackerNoon . Вы можете перейти к любой части этого файла здесь. Это часть 11 из 27.

:::

IV. ФАКТИЧЕСКИЕ ОБЪЯВЛЕНИЯ

С. Несанкционированное использование и копирование материалов Times ответчиками

2. Воплощение несанкционированного воспроизведения и производных от времени работает в моделях GPT

98. Еще одним свидетельством обучения с использованием несанкционированных копий Times Works является то, что сами магистранты GPT «запомнили» копии многих из этих же произведений, закодированные в их параметрах. Как показано ниже и в Приложении J, текущая версия LLM GPT-4 будет выводить почти дословные копии значительных частей Times Works, когда будет предложено сделать это. Такие заученные примеры представляют собой несанкционированные копии или производные разработки Times Works, использованные для обучения модели.

99. Например, в 2019 году The Times опубликовала серию из пяти частей, получившую Пулитцеровскую премию, о хищническом кредитовании в сфере такси Нью-Йорка. 18-месячное расследование включало 600 допросов, более 100 запросов на записи, крупномасштабный анализ данных и проверку тысяч страниц внутренних банковских отчетов и других документов и в конечном итоге привело к уголовным расследованиям и принятию новых законов для предотвращения будущее злоупотребление. OpenAI не принимал участия в создании этого контента, но при минимальных подсказках перескажет большую его часть дословно:[26]

Exhibit J at 5.

100. Аналогичным образом, в 2012 году газета The Times опубликовала революционную серию статей, посвященную тому, как аутсорсинг Apple и других технологических компаний изменил глобальную экономику. Этот сериал стал результатом огромных усилий на трех континентах. Освещать эту историю было особенно сложно, потому что The Times неоднократно отказывали ни в интервью, ни в доступе. The Times связалась с сотнями нынешних и бывших руководителей Apple и в конечном итоге получила информацию от более чем шести десятков инсайдеров Apple. Опять же, GPT-4 скопировал этот контент и может воспроизводить большую часть его дословно:[27]

Exhibit J at 3.

101. Приложение J содержит множество дополнительных примеров запоминания Times Works с помощью GPT-4. По имеющейся информации, эти примеры представляют собой небольшую часть работ Times Works, выразительное содержание которых в значительной степени закодировано в параметрах серии LLM GPT. Таким образом, каждый из этих LLM включает в себя множество несанкционированных копий или производных Times Works.

:::совет Продолжить чтение здесь.

:::


[26] Оригинал статьи см. Брайан М. Розенталь, «Поскольку тысячи таксистов оказались в ловушке кредитов, высокопоставленные чиновники подсчитали деньги», NY TIMES (19 мая 2019 г.), https://www.nytimes.com /2019/05/19/nyregion/taximedallions.html.

[27] Оригинальную статью см. в Charles Duhigg & Кейт Брэдшер, Как США проиграли в работе с iPhone, NY TIMES (21 января 2012 г.), https://www.nytimes.com/2012/01/22/business/apple-america-and-a-squeezed- среднийкласс.html.


:::информация О серии документов HackerNoon Legal PDF: мы представляем вам наиболее важные технические и подробные материалы судебных дел, являющиеся общественным достоянием.

Это судебное дело 1:23-cv-11195 получено 29 декабря 2023 г. с сайта nycto-assets.nytimes. com является общественным достоянием. Документы, созданные судом, являются произведениями федерального правительства и в соответствии с законом об авторском праве автоматически становятся общественным достоянием и могут распространяться без юридических ограничений.

:::


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE