Как взломать модерацию контента в метавселенной: уроки Web2.0

Как взломать модерацию контента в метавселенной: уроки Web2.0

14 ноября 2022 г.

<цитата>

Модерация контента в Web 2 — неразрешимая проблема.

Невозможно провести золотой стандарт между свободой слова пользователей и цензурой вредоносного контента со стороны привратников. Даже если бы самые длинные и понятные в мире рекомендации были составлены с помощью 10 000 больших языковых моделей в течение 10 000 часов, они все равно не охватывали бы все возможные сценарии, когда сообщения и комментарии опускаются ниже или выше «планки приемлемости». С другой стороны, без четкого кодекса поведения и вмешательства со стороны владельца платформы любая социальная сеть со временем придет в негодность.

Токсичное поведение среди пользователей в метавселенной даже усиливается. В целом, издевательства, домогательства, разжигание ненависти, причудливые случаи ощупывания и другие типы плохого поведения слишком распространены в виртуальных мирах. исследование, проведенное в США в 2021 году, показывает, что пятеро из шести взрослых (83 %) подвергались какой-либо форме домогательств в многопользовательских онлайн-играх. Забегая вперед, нынешний технический директор Meta, Эндрю Босуорт, написал в служебной записке, что модерировать то, что люди говорят или делают в метавселенной, «в любом значимом масштабе практически невозможно».

Как сделать так, чтобы наше общее цифровое пространство не превратилось в беззаконные джунгли, засоренные трештоком, спамом и травлей?

Impression by DALL-E 2

На мой взгляд, решение простое: основную часть модерации должны выполнять пользователи.

Очень похоже на систему баллов сообщества Reddit с акцентом на два момента:

* Очки сообщества должны восприниматься пользователями как ценные.

* Каждый пользователь имеет псевдоним в сети с послужным списком репутацией, которую могут проверить другие. Репутация должна восприниматься как ценная для пользователей.

Я предполагаю, что первая социальная платформа, разработавшая функционирующую систему с «самомедерацией», в которой пользователи будут мотивированы вносить ценный вклад и боятся сделать обратное, займет лидирующие позиции в «метавселенной» — углублении слияния. между виртуальной и физической реальностью.

Давайте подробнее рассмотрим проблему модерации.

Полемика Йе в Твиттере

<цитата>

'Сегодня вечером я немного сонный, но когда я проснусь, меня ждет смертная казнь 3 О ЕВРЕЙСКИХ НАРОДАХ. «Самое смешное, что я на самом деле не могу быть антисемитом, потому что чернокожие на самом деле тоже евреи. Вы, ребята, играли со мной и пытались забить всех, кто выступает против ваших планов.'”

Помимо временного запрета на Twitter и резкой реакции прессы и социальных сетей, несколько брендов разорвали отношения с Е после его скандального заявления. Adidas прекратил спонсорство бренда обуви и одежды Ye, Yeezy, на долю которого приходилось приблизительно 1,5 миллиарда долларов его собственного капитала.

Если бы Е был гражданином Европы, он, скорее всего, был бы оштрафован или даже приговорен к тюремному заключению за антисемитские высказывания. В ЕС язык ненависти не защищен правом на свободу выражения мнений[1], в то время как конституционное право на свободу слова считается более весомым в США. В Твиттере единственным общим набором правил, который объединяет пользователей со всего мира, являются положения и условия Твиттера. Частный контракт, который может быть обеспечен только компанией и не требует более жесткого наказания для пользователей, чем постоянная блокировка.

Антисемитские высказывания Йе были красной едой для журналов сплетен и основных СМИ из-за его огромного количества поклонников и статуса знаменитости. Но представьте, что дискриминационные замечания, начиная от «невинного троллинга» и заканчивая правдоподобными угрозами смертью в стиле Джеффри Дамера, публикуются анонимными пользователями в социальных сетях каждую долю секунды в день. Очевидно, что ни у одного из этих «анонов» нет спонсорской помощи Adidas в размере 1,5 миллиарда долларов, не говоря уже о каком-либо общественном имидже, который можно потерять. Им буквально нечего терять, публикуя материалы в социальных сетях, что оказывается проблемой.

Согласно простой теории игр и человеческой психологии, если один пользователь ведет себя плохо и получает вознаграждение за более широкое распространение , больше пользователей, вероятно, последуют его примеру, если они могут делать это без последствий. В результате планка социального поведения опускается все ниже и ниже. Опыт, который многим знаком в Твиттере.

«Коллективный сверхразум» Маска

Новый «оператор горячей линии для жалоб в Твиттере» Илон Маск сделал следующее примечание рекламодателям после приобретения Твиттера:

https://twitter.com/elonmusk/status/1585619322239561728?embedable=true

Некоторые постоянные пользователи Твиттера называют его «адским сайтом». Мишель Голдберг не сдерживает свою критику в недавней статье для NY Times. :

<цитата>

«Иногда я описывал, что сидеть в Твиттере — это как засиживаться допоздна на плохой вечеринке, где полно людей, которые тебя ненавидят. Теперь я думаю, что это было слишком щедро по отношению к Твиттеру. Я имею в виду, что даже самые худшие вечеринки заканчиваются. Твиттер больше похож на экзистенциалистскую притчу о вечеринке, где бестелесные души пытаются и не могут быть замечены должным образом навсегда. Неудивительно, что самые активные пользователи платформы часто называют ее «этим адским местом».

По правде говоря, большинство активных пользователей Твиттера редко пишут твиты.

Несмотря на большую опасность поляризационных и эхо-камер, Илон Маск видит потенциал Twitter как «коллективный кибернетический сверхразум (с большим количеством возможностей для совершенствования)». Как коллективный сверхразум, который объединяет всех, но без необходимости имплантации нейронов в мозг.

https://twitter.com/elonmusk/status/1588081971221053440 ?t=EfPsvKD3qUQxfaN6-cyjUA&s=03?embedable=true

Джо Бак-Коулман, исследователь отдела журналистской этики и безопасности Колумбийского университета, не согласен с этим понятием:

<цитата>

«(..) нейроны в конечном счете являются плохой аналогией индивидуального человеческого поведения. Как совокупность клеток с идентичной ДНК, которые должны жить или умереть вместе, нейроны преследуют общую цель, и у них нет причин конкурировать, обманывать или красть. Даже если бы у нас была полная модель работы мозга, мы не смогли бы напрямую применить ее к человеческому поведению, потому что она не учитывала бы конкурентную динамику между людьми».

Позже в своем эссе Джо Бак-Коулман заключает:

<цитата>

«Предпосылка Илона о том, что Twitter может вести себя как коллективный разум, верна только в том случае, если структура сети и характер взаимодействия настроены на достижение коллективных результатов».

На самом деле все довольно просто: если бы все пользователи разделяли представление Илона о Твиттере как о «общей цифровой городской площади, где можно обсуждать широкий спектр убеждений в здоровой манере», не было бы никаких проблемы с модерацией контента. Однако для многих, а возможно, и для большинства пользователей, Твиттер — это либо «адская площадка», либо шутка, либо место, где слова и действия не имеют реальных последствий.

Вот почему пользователям нужны стимулы для предоставления ценной, честной и точной информации. И им нужно опасаться последствий противоположного поступка. Нам нужна неавторитарная система социального кредита, управляемая коллективным сверхразумом.

Система баллов сообщества Reddit как инструмент модерации

Я думаю, что система очков сообщества Reddit может стать будущим модерации контента.

Идея состоит в том, чтобы создать что-то вроде «системы самомодерации», в которой пользователи могли бы зарабатывать что-то, внося ценный вклад, и, с другой стороны, нести наказание за троллинг, рассылку спама, угрозы, запугивание, преследование, извержение ненависти. высказывания или любые действия, противоречащие интересам сообщества.

Reddit внедрил свою систему очков сообщества в середине 2020 года и описывает ее следующим образом:

<цитата>

«Очки сообщества — это способ, которым Redditors могут владеть частью своих любимых сообществ. Модераторы и создатели контента зарабатывают баллы, внося свой вклад в сообщество, и они могут тратить свои баллы на специальные функции, отображать свои баллы как репутацию в сообществе и голосовать своими баллами, чтобы повлиять на решения сообщества».

Очки сообщества — это токены ERC-20, принадлежащие пользователям. в самом прямом смысле, поскольку они хранятся в блокчейне независимо от Reddit. В настоящее время они представлены на экспериментальном уровне в сабреддитах, таких как r/CryptoCurrency (Moons), r/FortniteBR (кирпичи) и r/ ethtrader (пончики). Токены распределяются между членами сообщества и модераторами в соответствии с ежемесячно накопленными баллами кармы (голосами за и против постов и комментариев).

Я рассматриваю Moons, Bricks и Donuts как эксклюзивные для сообщества усовершенствования системы очков кармы Reddit. Для тех, кто не является знатоком Reddit: очки кармы представляют собой положительные и отрицательные голоса за вклад пользователя в Reddit и отображаются публично как показатель репутации пользователя.

Очки сообщества можно рассматривать как карму Reddit, которую можно потратить или обменять.[2] В настоящее время их можно использовать в качестве взвешенных голосов в пулах сообщества, чтобы давать чаевые другим пользователям, публиковать GIF-файлы в комментариях, покупать цифровые товары для профилей пользователей на Reddit, и они даже могут быть торгуется на определенных DEX.

Пока полезность и ценность очков сообщества Reddit довольно ограничены. Однако я считаю, что система оценки кредитоспособности в том или ином формате могла бы стать отличным «встроенным инструментом» для модерации контента, поскольку «расходуемые социальные кредитные баллы» находят больше реальных словесных применений и увеличиваются в цене.

Если в представлении Илона Маска о Твиттере как о «коллективном кибернетическом сверхразуме есть доля правды, почему контент должен модерироваться администраторами, а не самим сверхразумом?

Нет никаких сомнений в том, что в ближайшем будущем модераторы все еще будут нужны, чтобы как можно скорее удалять ненавистные и незаконные материалы. Но особенно в виртуальных мирах, где общение между пользователями происходит в режиме реального времени, ущерб уже нанесен до того, как модераторы успеют вмешаться. Вот почему система кредитного скоринга должна быть реализована на социальных сайтах, 3D или нет в качестве превентивной меры. Обещание зарабатывать токены сообщества, которые можно обменивать, конвертировать и использовать в качестве реальных денег для получения доступа к услугам и опыту, будет стимулировать пользователей вести себя должным образом, а также поможет им определить, с кем им нравится вести дела.< /p>

Как мы узнали из Биткойн, когда всего 51% пользователей в системе справедливы и честны и имеют рациональный личный интерес чтобы оставаться честным и честным, система в целом работает.

Visualization of current nodes on the Lightening Network (13-11-2022) Source: https://lnrouter.app/graph

:::информация

<цитата>

Спасибо за чтение! Подпишитесь на мой бесплатный Substack, чтобы получать ежемесячные публикации и обновления.

:::

[1] См. статью 17 Европейского Конвенция о правах человека

[2] См. https://www.reddit.com/r/ethtrader/comments/kl6ldu/donuts_faq/.


Также опубликовано здесь


Оригинал