
Шипы, спады и сюрпризы: отслеживание вирусного роста R/Antipwork и стабильность темы
17 июня 2025 г.Таблица ссылок
Аннотация и 1. Введение
2. Связанная работа
3. Методология
4. Результаты
5. Обсуждение
6. Заключение, ссылки и приложение
4 Результаты
В следующем разделе мы характеризуем, как изменялась деятельность по публикации и комментированию в течение периода повышенного освещения в СМИ (RQ1), затем мы исследуем тенденции в поведении тяжелых и легких пользователей (RQ2) и, наконец, мы видим, как распределение тем изменилось между тремя периодами времени (RQ3). Если не указано иное, все анализы относятся к периоду времени в период с 1 января 2019 г.-31 июля 2022 года. Цифры ограничены периодом в период с 1 мая 2021 года-31 июля 2022 года ради ясности.
4.1 RQ1: Activity subredDit
Основные средства массовой информации обычно указывают на количество подписчиков R/противодействия, чтобы проиллюстрировать его рост и популярность (см. Рисунок 1). Однако, в дополнение к подписке, пользователи могут взаимодействовать с SubredDit, публикуя, комментируя и голосуя. Поскольку Reddit больше не предоставляет количество третьих лиц, мы сосредоточились на поведении пользователей и комментировали поведение пользователей.
На рисунке 2 показано ежедневное количество сообщений, представленных в R/Antipwork, которая получила как минимум один комментарий. До середины 2021 года среднее количество постов в день неуклонно росло, например, увеличиваясь
С 46.4 в январе 2020 года, незадолго до начала пандемии коронавируса до 76,8 в апреле 2021 года. С мая 2021 года уровень публикации начал ускоряться, постоянно нарушая 200 постов в день к сентябрю, прежде чем расти в с 9 октября по выходные 23-24 октября. С конца октября 2021 года поведение публикации в будние дни устроилось в схеме повышенной активности, которая прокалывается в выходные дни. На своем пике 26 января было сделано 2658 постов, на следующий день после интервью Дорина Форда Fox News, прежде чем упасть менее чем половину объема публикации предыдущего месяца. 27 января 2022 года R/Antipwork потерял 38 228 подписчиков (2,2%) (см. Правую руку серой области на рисунке 1). Для сравнения, второй по величине падение в подписчиках было 24 февраля 2019 года, когда число подписчиков уменьшилось на 7.
На рисунке 3 показаны аналогичные тенденции в комментировании поведения: экспоненциальное увеличение в середине октября 2021 года, за которым следует внезапный крах в конце января 2022 года. В отличие от публикации, однако нет очевидных различий между комментированием объема в будние дни и выходные. Как и в отношении постов в R/противодействие, количество комментариев достигло пика в течение 26-28 января, прежде чем упасть на 46,2% 29 января 2022 года.
Пунктирные линии на рисунках 2 и 3 показывают результаты обнаружения точек изменения. На рисунке 3 первое изменение 14 октября последовало за вирусным сообщением U/Hestolemysmile (единственный, наиболее комментированный по сообщению о R/Antipwork [12]). На рисунке 2 первые два изменения 15 и 22 октября совпадают с публикацией широко распространенных статей Newsweek и New York Times, соответственно. На обоих рисунках 2 и 3, 29 января, было идентифицировано как количество сообщений и комментариев, упавших после интервью Fox News. Остальные события, по -видимому, находятся в сезонных праздниках: посты, похоже, увеличиваются после Дня благодарения (30 ноября), в то время как комментарии увеличиваются в первый рабочий день после Рождества (27 декабря). Последние события, связанные с публикацией (13 мая 2022 года) и комментированием (11 февраля и 14 мая 2022 года), по -видимому, не связаны с конкретными событиями, но модель признает более постепенные сдвиги вниз в деятельности.
4.2 RQ2: поведение тяжелых и легких пользователей
Результаты RQ1 показали, что постоянно растущее количество подписчиков не обязательно приводит к постоянно растущему количеству постов и комментариев, но зависит от внешних событий. Здесь мы исследуем поведение тяжелых и легких пользователей (определено в разделе 3.2.1), чтобы понять, кто ведет изменения в объеме сообщений и комментариев. Мы также смотрим, когда пользователи сделали свой последний комментарий в SubredDit, чтобы оценить, перестали ли пользователи взаимодействовать с R/Antipwork или просто часто комментируют после собеседования на Fox News.
На рисунке 2 показано, что поведение публикации в основном обусловлено легкими плакатами, которые были ответственны за 29,6% постов по сравнению с 10,1% для тяжелых плакатов. На рисунке 4 показано, что доля постов, сделанных легкими и тяжелыми плакатами, была приблизительно равна до октября 2021 года, но затем начинает расходиться с почти половиной постов, поступающих с легких плакатов к концу июля 2022 года. Наоборот, рисунок 3
Показывает, что тяжелые комментаторы делают больше комментариев в совокупности, чем легкие комментаторы (29,8% против 4,7%). Однако, в отличие от поведения пользователей, среднее количество комментариев на пост оставался относительно постоянным с течением времени для обоих типов комментаторов, что, по -видимому, не зависит от всплеска подписчиков (см. Рисунок 5).
Наконец, на рисунке 6 мы исследовали, когда пользователи сделали свой последний комментарий к R/Antipwork (мы пропустили данные в прошлом месяце для Clarity, поскольку многие из этих пользователей будут продолжать комментировать в будущем). В период с октября 2021 года по январь 2022 года большинство пользователей, комментирующих в последний раз, были легкими комментаторами, то есть их последний комментарий - их первый и единственный комментарий. Доля тяжелых комментаторов, делающих свой последний комментарий, оставалась низкой до 26-28 января 2022 года, когда 4,4% тяжелых комментаторов сделали свой последний комментарий. После января 2022 года в равной степени вероятно, что тяжелые и легкие комментаторы перестали комментировать до мая 2022 года, когда тяжелые комментаторы стали более вероятными, чем легкие комментаторы R/Antipwork.
4.3 RQ3: анализ контента
В RQ1 мы показали, что объем сообщений и комментариев резко увеличился в октябре 2021 года, прежде чем рухнуть в январе 2022 года. Однако в RQ2 мы увидели, что растущая доля сообщений поступила от легких пользователей, то есть пользователей, которые публикуют только один раз. Мы хотим понять, как эти два явления повлияли на то, что обсуждалось на r/противодействие с использованием тематического моделирования. Мы исследуем оптимальное количество тем и контрастируем с распределением тем в течение трех периодов времени, определенных в разделе 3.2.2.
Мы использовали тематическую когерентность, чтобы определить оптимальное количество тем. На рисунке 7 показаны оценки когерентности для тематических моделей с 5-100 темами с шагом 5. Мы выполнили 5 или 10 повторностей для каждого количества тем за каждый период времени (больше повторов были запускаются для 15-75 тем, где показатель когерентности был максимизирован). Оптимальное количество тем было 25, 30 и 40 для периодов 1, 2 и 3 соответственно. Различное количество тем в каждый период времени, по -видимому, подтверждает наше решение разделить набор данных для моделирования темы и наводит на мысль о том, что обсуждаемые темы расширились с течением времени. Мы отмечаем, однако, что, хотя периоды 2 и 3 имеют аналогичное количество документов (комментарии, агрегированные по родительскому сообщению), период 1 значительно меньше (см. Раздел 3.4).
Таблица A1 показывает, какие темы присутствовали, их пропорция и ранжирование темы за каждый период времени. В периоды 1 и 3, тема Topranking былаУход, в то время как в периоде 2, когда сам r/противодействие появился в многочисленных новостях, главной темой былаRedditПолем Топ-3 темы для всех периодов времени были одинаковыми:УходВRedditиПсихиатрическийЗдоровьеи составлял 22,5-27,5% контента на R/Antipwork. В общей сложности 17 тем за все три периода времени приходилось 60,6-74,1% контента. Каждый период времени имел уникальные темы, многие из которых были основаны на сезонных событиях и основных историях в средствах массовой информации. Период 1 включенДосуг(т.е. хобби и свободное время) иСоциальное обеспечение(Инвалидность, благосостояние). Период 2 включенПраздники(Период 2 покрывал как благодарение, так и Рождество),Корпорации(Относительно, например, с профсоюзной деятельностью Келлогга) иПандемия(В частности, истории работы во время пандемии). Наконец, период 3 включал темы дляFox News ИнтервьюВРаботая из дома(В противоположность пост-пандемическому возвращению компаний в офисную политику) иРепродуктивные права(связано с просочившимся проектом Верховного суда США, чтобы перевернуть Роу против Уэйда). Однако темы, ограниченные одним периодом времени, имели тенденцию быть относительно незначительными и, как правило, присутствовали в длинном хвосте распределения тем.
Авторы:
(1) Алан Медлар, Университет Хельсинки, Финляндия (Alan.j.medlar@helsinki.fi);
(2) Ян Лю, Университет Хельсинки, Финляндия (yang.liu@helsinki.fi);
(3) Дорота Гловака, Университет Хельсинки, Финляндия (dorota.glowacka@helsinki.fi).
Эта статья естьДоступно на ArxivПод CC по лицензии 4.0.
[12] https://www.reddit.com/r/antiwork/comments/q82vqk/
Оригинал