Веб-сайт мамы готов приостановить OpenAI после того, как узнал, что компания, занимающаяся искусственным интеллектом, возможно, удалила свои данные

Веб-сайт мамы готов приостановить OpenAI после того, как узнал, что компания, занимающаяся искусственным интеллектом, возможно, удалила свои данные

24 июля 2024 г.

Британский родительский центр Mumsnet подал иск против OpenAI, утверждая, что компания нарушила закон об авторском праве, используя свои данные для обучения своих моделей искусственного интеллекта, в том числе тех, которые используются в ChatGPT. Это первый подобный судебный иск, предпринятый против OpenAI в Великобритании, но один из растущего числа подобных дел, распространяющихся по всему миру, обвиняет OpenAI в незаконном сборе информации для своих моделей без разрешения. Mumsnet утверждает, что на ее форумах содержится более шести миллиардов слов, и что OpenAI использовала эти слова для обучения своих моделей ИИ воспитанию детей и смежным темам.

«Такой сбор данных без разрешения является явным нарушением наших условий использования, в которых четко указано, что никакая часть сайта не может распространяться, очищаться или копироваться для каких-либо целей без нашего явного согласия», — объяснила соучредитель Mumsnet Джастин Робертс в < data-analytics-id="inline-link" href="https://www.mumsnet.com/talk/site_stuff/5122770-why-were-take-legal-action-against-open-ai-and-other -scrapers">опубликовать на сайте. «LLM создают такие модели, как ChatGPT, чтобы дать ответы на любые возможные вопросы, что будет означать, что нам больше не придется искать решения где-то еще. И они строят эти модели на основе контента с веб-сайтов, которые они собираются заменить».

Юридическая жалоба указывает на сроки сбора данных как на еще один предмет разногласий, поскольку в основном это происходило до того, как веб-сайты обратили пристальное внимание на то, собирают ли компании, занимающиеся искусственным интеллектом, их данные. Mumsnet утверждает, что изначально большую часть сбора данных выполняли сторонние исследовательские учреждения.

Робертс написал, что Mumsnet обратился к OpenAI по поводу лицензирования своего контента, отметив, что на платформе имеется концентрированная коллекция произведений женщин, которая отличается от большей части интернет-контента. Но, по словам Робертса, OpenAI им отказала, сославшись на интерес к «наборам данных, к которым нелегко получить доступ в Интернете». 

Очистить записки

Mumsnet не единственный, кто высказывает жалобы на сбор данных OpenAI, и теперь является частью расширяющейся группы компаний, подающих OpenAI в суд по этому поводу. Например, цель Гильдия авторов подала в суд на OpenAI, утверждая, что для обучения моделей ИИ использовались книги, защищенные авторским правом, а также группа ученых, утверждающих, что их статьи были аналогичным образом аннулированы OpenAI. Reuters и Нью-Йорк Таймс подали в суд на OpenAI не только за сбор данных, но и за то, что ChatGPT генерирует ответы, содержание которых слишком близко к их статьям, защищенным авторским правом. . Даже Creative Commons подала иск против разработчика ИИ, утверждая, что компания использовала контент, лицензированный Creative Commons, для обучения своих моделей ИИ способами, нарушающими условия лицензий.

OpenAI защищает свою практику как подпадающую под доктрину добросовестного использования. В Великобритании компания ответила на запрос Палаты лордов, признав необходимость использования материалов, защищенных авторским правом, для обучения своих моделей искусственного интеллекта и что ей следует делать больше для поддержки создателей контента, но при этом утверждает, что то, что она делает, является законным. Хотя это первый случай OpenAI по этому вопросу в Великобритании, Getty Images имеет аналогичное дело в судах страны против Stability AI за ее ИИ, генерирующий изображения.

Исход иска Mumsnet и других дел может создать прецедент в том, как компании, занимающиеся искусственным интеллектом, обращаются с контентом, защищенным авторским правом, и может повлиять на будущие правила и практику лицензирования. Попытка сбалансировать инновации в области искусственного интеллекта и права интеллектуальной собственности далека от завершения и, вероятно, не будет решена в ближайшее время.

Честно говоря, Mumsnet не против LLM и искусственного интеллекта как концепции. Фактически, Mumsnet использовала модели OpenAI для создания чат-бота с искусственным интеллектом. присоединяется к-ai-boom-chatbot-trained-parenting-advice/">под названием MumsGPT в прошлом году. MumsGPT был доступен только руководителям Mumsnet, когда о нем было объявлено, и с тех пор о нем не упоминалось, так что, возможно, его больше не существует, но идея заключалась в том, чтобы предложить его в качестве исследовательского инструмента и даже как что-то, что политики могли бы использовать в развитии родительского воспитания. соответствующие правила. Робертс не упомянула MumsGPT, но в своем объяснении иска отметила, что у ИИ есть положительные потенциальные возможности применения.

«Но если LLM позволят просто воровать контент у издателей и сообществ, таких как Mumsnet, они рискуют их уничтожить», — написал Робертс. «Мы знаем, что борьба с таким транснациональным гигантом, как OpenAI, с его доходом в 3 миллиарда долларов, — непростая задача, учитывая огромные ресурсы, которые они нам бросят, но это слишком важная проблема, чтобы просто откладывать ее на потом. Не только для Mumsnet, но и для каждого веб-сайта, на который вы когда-либо заходили, чтобы узнать новости, получить совет или просто спросить, не поступаете ли вы неразумно».

Вам также может понравиться...


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE