The Times против Microsoft/OpenAI: бизнес-модель, основанная на массовом нарушении авторских прав (8)
2 января 2024 г.:::совет Судебное заявление компании New York Times против корпорации Microsoft от 27 декабря 2023 г. является частью серии юридических PDF-серий HackerNoon . Вы можете перейти к любой части этого файла здесь. Это часть 8 из 27.
:::
IV. ФАКТИЧЕСКИЕ ОБЪЯВЛЕНИЯ
Б. Продукты GenAI ответчиков
1. Бизнес-модель, основанная на массовом нарушении авторских прав
55. OpenAI была основана в декабре 2015 года как «некоммерческая исследовательская компания в области искусственного интеллекта». OpenAI стартовала с стартового капитала в размере 1 миллиарда долларов от своих основателей, группы самых богатых технологических предпринимателей и инвесторов, а также таких компаний, как Amazon Web Services и InfoSys. В эту группу входили Илон Маск, генеральный директор Tesla и X Corp. (ранее известной как Twitter); Рид Хоффман, соучредитель LinkedIn; Сэм Альтман, бывший президент Y Combinator; и Грег Брокман, бывший технический директор Stripe.
56. Несмотря на то, что при своем основании OpenAI приняла очень крупные инвестиции от чрезвычайно богатых компаний и частных лиц, первоначально она утверждала, что ее исследования и работа будут совершенно не мотивированы прибылью. В пресс-релизе от 11 декабря 2015 года Брокман и соучредитель Лия Суцкевер (ныне президент и главный научный сотрудник OpenAI соответственно) написали: «Наша цель — продвигать цифровой интеллект таким образом, чтобы это с наибольшей вероятностью принесло пользу человечеству в целом». , не ограниченный необходимостью получения финансовой отдачи. Поскольку наши исследования свободны от финансовых обязательств, мы можем лучше сосредоточиться на положительном воздействии на человека». В соответствии с этой миссией OpenAI пообещала, что ее работа и интеллектуальная собственность будут открыты и доступны для общественности, что ее «исследователям будет настоятельно предложено публиковать свои работы, будь то в виде статей, сообщений в блогах или кода» и что его «патенты (если таковые имеются) будут доступны всему миру».
57. Несмотря на свои первоначальные обещания альтруизма, OpenAI быстро превратилась в многомиллиардный коммерческий бизнес, построенный в значительной степени на нелицензионном использовании произведений, защищенных авторским правом, принадлежащих The Times и другим. Всего через три года после своего основания OpenAI утратила статус исключительно некоммерческой организации. В марте 2019 года она создала OpenAI LP — коммерческую компанию, занимающуюся львиной долей операций OpenAI, включая разработку продуктов, и привлечением капитала от инвесторов, стремящихся получить прибыль. Корпоративная структура OpenAI превратилась в сложную сеть коммерческих холдинговых, операционных и подставных компаний, которые управляют повседневной деятельностью OpenAI и предоставляют инвесторам OpenAI (в первую очередь Microsoft) полномочия и влияние на операции OpenAI, одновременно привлекая миллиарды долларов в виде инвестиций. капитал от инвесторов. Результат: сегодня OpenAI — это коммерческое предприятие, стоимость которого оценивается в 90 миллиардов долларов, а в 2024 году прогнозируется, что выручка превысит 1 миллиард долларов.
58. С переходом к коммерческому статусу произошло еще одно изменение: OpenAI также прекратила свою деятельность
Приверженность открытости. OpenAI выпустила первые две версии своей флагманской модели GenAI
GPT-1 и GPT-2 в открытом доступе в 2018 и 2019 годах соответственно. Но OpenAI изменился
курс в 2020 году, начиная с выпуска GPT-3 вскоре после OpenAI LP и других коммерческих проектов
Были сформированы подразделения OpenAI, которые взяли под свой контроль проектирование и разработку продуктов.
59. GPT-3.5 и GPT-4 на порядок мощнее двух предыдущих поколений, однако Ответчики держали их конструкцию и подготовку в полном секрете. Для предыдущих поколений OpenAI имел объемные отчеты с подробным описанием содержания обучающего набора, конструкции и аппаратного обеспечения LLM. Не так для GPT-3.5 или GPT-4. Например, для GPT-4 в «техническом отчете», опубликованном OpenAI, говорится: «Этот отчет не содержит дополнительных подробностей об архитектуре (включая размер модели), аппаратном обеспечении, обучающих вычислениях, построении набора данных, методе обучения и т. д.». 3]
60. Главный научный сотрудник OpenAI Суцкевер оправдал эту секретность коммерческими соображениями: «Там конкуренция…. И есть много компаний, которые хотят сделать то же самое, поэтому с точки зрения конкуренции вы можете рассматривать это как развитие отрасли». модели от правообладателей, таких как The Times.
61. Имя OpenAI стало нарицательным после выпуска ChatGPT в ноябре 2022 года. ChatGPT — это чат-бот, генерирующий текст, который, учитывая подсказки, созданные пользователем, может имитировать человеческие ответы на естественном языке. ChatGPT мгновенно стал вирусной сенсацией: за месяц после его выпуска он достиг миллиона пользователей, а за три месяца - более 100 миллионов.
62. OpenAI через OpenAI OpCo LLC и по указанию OpenAI Inc., OpenAI LP и других организаций OpenAI предлагает набор услуг на базе своих LLM, ориентированных как на обычных потребителей, так и на предприятия. Версия ChatGPT на базе GPT-3.5 доступна пользователям бесплатно. OpenAI также предлагает потребителям премиальную услугу на базе «самой функциональной модели OpenAI» GPT-4 за 20 долларов в месяц. Предложения OpenAI, ориентированные на бизнес, включают инструменты ChatGPT Enterprise и ChatGPT API, позволяющие разработчикам включать ChatGPT в индивидуальные приложения. OpenAI также лицензирует свою технологию корпоративным клиентам за лицензионные сборы.
63. Эти коммерческие предложения оказались чрезвычайно ценными для OpenAI. Более 80% компаний из списка Fortune 500 используют ChatGPT.[5] Согласно последним отчетам, доход OpenAI составляет 80 миллионов долларов в месяц, и в ближайшие 12 месяцев он может превысить 1 миллиард долларов.[6]
64. Этот коммерческий успех во многом основан на крупномасштабном нарушении авторских прав OpenAI. Одной из основных особенностей, способствующих использованию и продажам ChatGPT и связанных с ним продуктов, является способность LLM создавать текст на естественном языке в различных стилях. Чтобы добиться этого результата, OpenAI в ходе «обучения» LLM сделала многочисленные репродукции произведений, защищенных авторским правом, принадлежащих The Times.
65. По имеющейся информации и предположениям, все Ответчики OpenAI либо были непосредственно вовлечены в широкомасштабное нарушение OpenAI и коммерческое использование Times Works, либо направляли, контролировали и получали прибыль от него. OpenAI Inc. вместе с Microsoft контролировала и направляла широкое воспроизведение, распространение и коммерческое использование материалов The Times, осуществляемое OpenAI LP и OpenAI Global LLC через ряд холдинговых и подставных компаний, в число которых входят OpenAI Holdings LLC, OpenAI GP LLC, и ООО «Корпорация ОАИ». OpenAI LP и OpenAI Global LLC принимали непосредственное участие в проектировании, разработке и коммерциализации продуктов OpenAI на основе GPT, а также непосредственно участвовали в широком воспроизведении, распространении и коммерческом использовании Times Works. OpenAI LP и OpenAI Global LLC также контролировали и руководили OpenAI, LLC и OpenAI OpCo LLC, которые занимались распространением, продажей и лицензированием продуктов OpenAI на основе GPT и, таким образом, монетизировали воспроизведение, распространение и коммерческое использование Times Works. /п>
66. По крайней мере, с 2019 года Microsoft принимала и продолжает активно участвовать в обучении, разработке и коммерциализации продуктов OpenAI GPT. В интервью Wall Street Journal на Всемирном экономическом форуме 2023 года генеральный директор Microsoft Сатья Наделла сказал, что «семейство моделей ChatGPT и GPT… это то, с чем мы уже несколько лет тесно сотрудничаем с OpenAI». Благодаря этому партнерству Microsoft участвовала в создании и коммерциализации программ GPT LLM и продуктов на их основе как минимум двумя способами.
67. Во-первых, Microsoft создала и эксплуатировала специальные компьютерные системы для осуществления массовых нарушений авторских прав, подробно описанных здесь. Эти системы использовались для многократного воспроизведения интеллектуальной собственности The Times с целью создания моделей GPT, которые используют и во многих случаях сохраняют значительную часть выражений, охраняемых авторским правом, содержащихся в этих произведениях.
68. Microsoft является единственным поставщиком облачных вычислений для OpenAI. Microsoft и OpenAI совместно разработали суперкомпьютерные системы на базе облачной компьютерной платформы Microsoft Azure, которые использовались для обучения всех моделей OpenAI GPT после GPT-1. В программной речи на конференции Microsoft Inspire в июле 2023 года г-н Наделла сказал: «Мы создали инфраструктуру для обучения их моделей. Они внедряют инновации в алгоритмы и обучение этих передовых моделей».
69. Эта инфраструктура представляла собой не просто компьютерные системы общего назначения, которые OpenAI могла использовать по своему усмотрению. Microsoft специально разработала его с целью использования практически всего Интернета (с непропорционально большим количеством Times Works) для обучения самых способных LLM в истории. В интервью в феврале 2023 года г-н Наделла сказал:
Но помните, что под тем, что OpenAI выпускает в виде больших моделей,
тяжелая работа по созданию была проделана командой [Microsoft] Azure
компьютерная инфраструктура. Потому что эти рабочие нагрузки настолько
отличается от всего, что было раньше. Поэтому нам нужно было
полностью переосмыслить даже центр обработки данных, вплоть до инфраструктуры, которая
Сначала мы даже попробовали построить модели. И теперь мы
преобразование моделей в продукты.[7]
70. Microsoft построила этот суперкомпьютер «в сотрудничестве и исключительно для OpenAI» и «разработала [его] специально для обучения моделей ИИ этой компании». [8] Даже по стандартам суперкомпьютеров он был необычайно сложным. По словам Microsoft, он работал как «единая система с более чем 285 000 процессорными ядрами, 10 000 графическими процессорами и 400 гигабитами в секунду сетевого подключения для каждого графического сервера». Эта система вошла в пятерку самых мощных общеизвестных суперкомпьютерных систем в мире.
71. Чтобы убедиться, что суперкомпьютерная система соответствует потребностям OpenAI, Microsoft необходимо было протестировать систему как независимо, так и в сотрудничестве с разработчиками программного обеспечения OpenAI. По словам г-на Наделлы в отношении OpenAI: «Они создают базовые модели, а мы [Microsoft] много работаем над ними, включая инструменты для ответственного ИИ и безопасности ИИ». По имеющейся информации и убеждениям, такое «инструментирование вокруг ИИ и безопасности ИИ» включает в себя тонкую настройку и калибровку продуктов на основе GPT перед их выпуском для широкой публики.[9]
72. В сотрудничестве с OpenAI Microsoft также коммерциализировала технологию OpenAI на основе GPT и объединила ее со своим собственным поисковым индексом Bing. В феврале 2023 года Microsoft представила Bing Chat, функцию чат-бота с генеративным искусственным интеллектом в своей поисковой системе на базе GPT-4. В мае 2023 года Microsoft и OpenAI представили «Просмотр с помощью Bing», плагин для ChatGPT, который позволил ему получить доступ к новейшему контенту в Интернете через поисковую систему Microsoft Bing. Bing Chat и Browse with Bing сочетают в себе способность GPT-4 имитировать человеческое выражение, в том числе выражение The Times, с возможностью генерировать на естественном языке краткое изложение содержимого результатов поиска, включая обращения к Times Works, что устраняет необходимость посещения собственных веб-сайтов The Times. . Эти «синтетические» результаты поиска призваны напрямую отвечать на запросы пользователей и могут включать в себя обширные пересказы и прямые цитаты из репортажей Times. Такое копирование обеспечивает взаимодействие с собственными сайтами и приложениями Ответчиков, а не перенаправляет пользователей на The Times так же, как обычные списки результатов поиска.
73. В недавнем интервью г-н Наделла признал тесное участие Microsoft в деятельности OpenAI и, следовательно, нарушение авторских прав:
[Мы] были очень уверены в своих силах. У нас есть все права интеллектуальной собственности и все возможности. Если завтра OpenAI исчезнет, я не хочу, чтобы кто-либо из наших клиентов, честно говоря, беспокоился об этом, потому что у нас есть все права продолжать инновации. Не только для того, чтобы обслуживать продукт, но мы можем пойти и просто сделать то, что мы делали в партнерстве сами. У нас есть люди, есть компьютеры, есть данные, у нас есть все.
74. Благодаря своему сотрудничеству как в создании, так и в коммерциализации моделей GPT, Ответчики получили прибыль от массового нарушения авторских прав, коммерческой эксплуатации и незаконного присвоения интеллектуальной собственности The Times. Как недавно выразился г-н Наделла: «[OpenAI] делает ставку на нас, мы делаем ставку на них». Он продолжил, описывая эффект от инвестиций Microsoft в 13 миллиардов долларов:
И это дает нам значительные права, как я уже сказал. А еще эта штука, она ведь не без рук, да? Мы там. Мы ниже их, над ними, вокруг них. Мы оптимизируем ядро, создаем инструменты, создаем инфраструктуру. Вот почему я думаю, что многие промышленные аналитики говорят: «Ого, это действительно совместный проект Microsoft и OpenAI». Реальность такова, что мы, как я уже сказал, очень самодостаточны во всем этом.
:::совет Продолжить чтение здесь.
:::
[3] OPENAI, ТЕХНИЧЕСКИЙ ОТЧЕТ GPT-4 (2023 г.), https://cdn.openai.com/papers/gpt-4.pdf.
[4] Джеймс Винсент, соучредитель OpenAI, о прошлом подходе компании к открытому обмену результатами исследований: «Мы были неправы», THE VERGE (15 марта 2023 г.), https://www.theverge.com/2023/3/15 /23640180/openai-gpt-4-launch-closedresearch-ilya-sutskever-interview.
[5] OpenAI, Представляем ChatGPT Enterprise, OPENAI (28 августа 2023 г.), https://openai.com/blog/introducing-chatgpt-enterprise.
[6] Крис Моррис, Годовой объем продаж OpenAI приближается к 1 миллиарду долларов, FAST COMPANY (30 августа 2023 г.), https://www.fastcompany.com/90946849/openai-chatgpt-reportedly-nears-1-billion-annual -продажи.
[7] Впервые на CNBC: Стенограмма CNBC: Генеральный директор Microsoft Сатья Наделла беседует с Джоном Форттом из CNBC
«Мощный обед» сегодня, CNBC (7 февраля 2023 г.), https://www.cnbc.com/2023/02/07/first-on-cnbc-cnbc-transcriptmicrosoft-ceo-satya-nadella- говорит-с-cnbcs-jon-fortt-on-power-lunch-today.html.
[8] Дженнифер Лэнгстон, Microsoft анонсирует новый суперкомпьютер, излагает концепцию будущей работы в области искусственного интеллекта, MICROSOFT (19 мая 2020 г.), https://news.microsoft.com/source/features/ai/openai-azure-supercomputer/. 9 СЕБАСТЬЕН БУБЕК И ДР., ИСКРЫ ИСКУССТВЕННОГО ОБЩЕГО ИНТЕЛЛЕКТА: РАННИЕ ЭКСПЕРИМЕНТЫ С GPT-4 (2023), https://arxiv.org/pdf/2303.12712.pdf
:::информация О серии документов HackerNoon Legal PDF: мы представляем вам наиболее важные технические и подробные материалы судебных дел, являющиеся общественным достоянием.
Это судебное дело 1:23-cv-11195 получено 29 декабря 2023 г. с сайта nycto-assets.nytimes. com является общественным достоянием. Документы, созданные судом, являются произведениями федерального правительства и в соответствии с законом об авторском праве автоматически становятся общественным достоянием и могут распространяться без юридических ограничений.
:::
Оригинал