Обвинения GitHub Copilot: воспроизведение кода без указания авторства

Обвинения GitHub Copilot: воспроизведение кода без указания авторства

5 сентября 2023 г.

:::совет Документ Министерства энергетики США против Github (измененная жалоба) (отредактировано) от 8 июня 2023 г. является частью серии юридических PDF-файлов HackerNoon. Вы можете перейти к любой части этого файла здесь. Это часть 22 из 38.

:::

VII. ФАКТИЧЕСКИЕ ОБЪЯВЛЕНИЯ

Ф. Второй пилот воспроизводит код названных истцов без указания авторства

4. Пример: второй пилот выводит код Doe 5 практически дословно

121. Четвертый пример также демонстрирует, как Copilot предлагает несколько модифицированных копий кода, написанного Doe 5, в ответ на последовательность подсказок, что является распространенным способом использования Copilot. Чтобы защитить личность Doe 5, абзацы, описывающие код, будут отредактированы.

  1. (Отредактировано) в соответствии с лицензией MIT. (Отредактировано) Первые три теста из исходного файла показаны ниже: (Отредактировано)
  2. 123. Когда второму пилоту предлагается ввести первый раздел кода Doe 5, содержащий первый полный тест и название второго: (Отредактировано)

    Первое предложение от Copilot предлагает завершить второй тест с дословной копией исходного кода Doe 5: (Отредактировано)

    124. Когда предложение второго пилота принимается и добавляется название третьего теста Doe 5, следующий запрос для второго пилота выглядит следующим образом: (Отредактировано)

    125. И снова первое предложение от Copilot предлагает завершить третий тест с дословной копией кода Doe 5 (за исключением небольших косметических изменений в разрывах строк): (Отредактировано)

    126. Поскольку Copilot (неоднократно) воспроизводит код Doe 5 практически дословно, предложения Copilot должны соответствовать требованиям лицензии Doe 5 (лицензия MIT) на этот код, включая указание авторства. Они не. Copilot также не воспроизвел лицензию Doe 5

    127. Это лишь несколько примеров кода Истцов, воспроизведенного Copilot. Отсюда следует, что многие, если не все, запросы, введенные в Copilot, с готовностью заставят его выдать дословные, почти дословные или измененные копии Лицензионного материала, которые нарушают лицензии, под которыми публикуется исходный код. Если учесть количество пользователей Copilot и множество запросов Copilot, то каждый день эти нарушения, должно быть, накапливаются с поразительной частотой. Таким образом, вполне вероятно, если не факт, что дословные, почти дословные или измененные копии кода каждого Истца уже были созданы Copilot.

    128. Кроме того, даже несмотря на то, что Истцы смогли привести эти примеры, Истцы остаются в значительном невыгодном положении с точки зрения доказательств по сравнению с Ответчиками, поскольку Ответчики контролируют всю информацию о наборе обучающих данных. В частности, только Ответчики знают, когда были изъяты Лицензионные материалы Истцов и Группы. Как это обычно бывает с открытым исходным кодом, многие Лицензионные материалы регулярно обновляются. Таким образом, сложно определить, какие итерации кода могли быть обучены и могут быть переданы Copilot.

    :::совет Продолжить чтение здесь.

    :::


    О серии документов HackerNoon Legal PDF: мы представляем вам наиболее важные технические и подробные материалы судебных дел, являющиеся общедоступными.

    Это судебное дело 4:22-cv-06823-JST получено 26 августа 2023 г. с сайта Storage Courtlistener является частью общественного достояния. Документы, созданные судом, являются произведениями федерального правительства и в соответствии с законом об авторском праве автоматически становятся общественным достоянием и могут распространяться без юридических ограничений.


    Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE