Apple прокладывает путь к более этичному генеративному искусственному интеллекту, что крайне необходимо в современном мире, основанном на искусственном интеллекте.
26 апреля 2024 г.Авторское право сейчас является чем-то вроде минного поля, когда дело касается ИИ a>, и есть новый отчет, в котором утверждается, что генеративный искусственный интеллект Apple, в частности его 'Ajax' модель большого языка (LLM) - возможно, одна из немногих, которая сочетает в себе и то, и другое юридически и этически подготовлены. Утверждается, что Apple пытается соблюдать стандарты конфиденциальности и законности, внедряя инновационные методы обучения.
Закон об авторском праве в эпоху генеративного искусственного интеллекта сложно ориентироваться, и это становится все более важным, поскольку инструменты искусственного интеллекта становятся все более распространенными. Одна из наиболее вопиющих проблем, которая возникает снова и снова, заключается в том, что многие компании обучают свои большие языковые модели (LLM), используя произведения, защищенные авторским правом, обычно не раскрывая, лицензируют ли они эти учебные материалы. Иногда результаты этих моделей включают целые разделы произведений, защищенных авторским правом.
В настоящее время обоснованием того, почему материалы, защищенные авторским правом, так широко используются некоторыми из этих компаний для обучения своих LLM, является то, что, как и в случае с людьми, этим моделям требуется значительный объем информации (называемый обучающими данными для LLM), чтобы учиться и генерировать последовательные данные. и убедительные ответы - и что касается этих компаний, материалы, защищенные авторским правом, являются честной добычей.
Многие критики генеративного ИИ считают нарушением авторских прав, если технологические компании используют произведения для обучения и выпуска программ LLM без явных соглашений с правообладателями или их представителями. Тем не менее, эта критика не помешала технологическим компаниям делать именно это, и предполагается, что это относится и к большинству инструментов искусственного интеллекта, вызывая растущее недовольство компаниями, работающими в сфере генеративного искусственного интеллекта.
Лес юридических баталий и этических дилемм в генеративном ИИ
В отношении этих технологических компаний даже возникает все больше юридических проблем. OpenAI и Microsoft на самом деле были New York Times подала в суд за нарушение авторских прав еще в декабре 2023 год, когда издатель обвинил обе компании в обучении своих студентов-магистров по миллионам статей New York Times. В сентябре 2023 г. OpenAI и Microsoft также подали в суд ряд известных авторов, в том числе Джордж Мартин, Майкл Коннелли и Джонатан Франзен. В июле 2023 года более 15 000 авторов подписали открытое письмо, адресованное таким компаниям, как Microsoft, OpenAI, Meta, Алфавит и другие, призывая лидеров технологической индустрии защищать писателей, призывая эти компании должным образом кредитовать и компенсировать авторам их работы при использовании их для обучения генеративных моделей искусственного интеллекта.
В апреле этого года The Register сообщил что на Amazon подал иск бывший Сотрудница утверждала, что столкнулась с жестоким обращением, дискриминацией и преследованием, и в процессе она рассказала о своем опыте, когда дело касалось вопросов нарушения авторских прав. Эта сотрудница утверждает, что ей сказали намеренно игнорировать и нарушать закон об авторском праве, чтобы улучшить продукты Amazon и сделать их более конкурентоспособными, и что ее начальник сказал ей, что «все остальные делают это», когда дело доходит до нарушений авторских прав. Apple Insider поддерживает это утверждение, заявляя, что это, похоже, общепринятый отраслевой стандарт.
Как мы видели на примере многих других новых технологий, законодательство и этические рамки всегда появляются после первоначальной задержки, но похоже, что это становится более проблематичным аспектом генеративных моделей ИИ, на который компаниям, ответственным за них, придется реагировать.
Подход Apple к этическому обучению ИИ (о котором мы знаем на данный момент)< /h2>
Похоже, что по крайней мере один крупный технологический игрок пытается пойти более осторожным и продуманным путем, чтобы избежать как можно большего количества юридических (и моральных!) проблем — и, что несколько удивительно, это Apple. По данным Apple Insider, Apple усердно добивается лицензирование работ крупных новостных изданий при поиске учебных материалов по ИИ. Еще в декабре Apple подала прошение о предоставлении лицензии нескольким крупным издателям на использование их в качестве учебных материалов для своей собственной LLM, известной как Ajax.
Предполагается, что Ajax будет программным обеспечением для базовых функций устройства для будущих продуктов Apple, и вместо этого он может лицензировать такое программное обеспечение, как Google Gemini для более продвинутых функций, например тех, которые требуют подключения к Интернету. Apple Insider пишет, что это позволяет Apple избежать определенных обязательств по нарушению авторских прав, поскольку Apple не будет нести ответственность за нарушение авторских прав, скажем, со стороны Google Gemini.
В статье, опубликованной в марте, подробно описано, как Apple намерена обучать своих собственный LLM: тщательно подобранный выбор изображений, текста-изображения и текстового ввода. В своих методах Apple одновременно отдавала приоритет улучшению подписей к изображениям и многоэтапному обоснованию, одновременно уделяя внимание сохранению конфиденциальности. Последний из этих факторов становится еще более возможным для Ajax LLM, поскольку он полностью встроен в устройство и, следовательно, не требует подключения к Интернету. Здесь есть компромисс, поскольку это означает, что Ajax не сможет самостоятельно проверять контент, защищенный авторским правом, и плагиат, поскольку он не сможет подключаться к онлайн-базам данных, в которых хранятся материалы, защищенные авторским правом.
Есть еще одно предостережение, которое Apple Insider раскрывает по этому поводу в разговоре с источниками, знакомыми со средами тестирования искусственного интеллекта Apple: в настоящее время, похоже, не существует большого количества ограничений, если таковые имеются, для пользователей, использующих материалы, защищенные авторским правом, в качестве входных данных для тестирования. среды тестирования устройств. Также стоит отметить, что Apple технически не единственная компания, которая придерживается подхода, основанного на приоритете прав: инструмент искусственного интеллекта Adobe Firefly также утверждается, что он полностью соответствует авторским правам, поэтому мы надеемся, что больше стартапов в области искусственного интеллекта будут достаточно мудры, чтобы последовать примеру Apple и Adobe.
Я лично приветствую такой подход Apple, поскольку считаю, что человеческое творчество — одна из самых невероятных способностей, которыми мы обладаем, и я считаю, что его следует вознаграждать и отмечать, а не скармливать искусственному интеллекту. Нам придется подождать, чтобы узнать больше о том, как выглядят правила Apple, касающиеся авторского права и обучения ее ИИ, но я согласен с Оценка Apple Insider, что это определенно звучит как улучшение, особенно после того, как было задокументировано, что некоторые ИИ слово в слово извергают материалы, защищенные авторским правом. Мы можем с нетерпением ждать возможности узнать больше об усилиях Apple в области генеративного искусственного интеллекта, которые, как ожидается, станут ключевым фактором для ее конференции по программному обеспечению, ориентированной на разработчиков, WWDC 2024.