programming gender-bias pair-programming remote-pair-programming distributed-pair-programming software-engineering-education gender-representation-in-stem twincode pair-programming-study

Борьба за измерение гендерного смещения в среде отдаленного программирования

26 июня 2025 г.

Таблица ссылок

Аннотация и 1 введение

1.1 Платформа Twincode

1.2 Пилотные исследования

1.3 Другие гендерные идентичности и 1.4 структура бумаги

2 Связанная работа

3 оригинальное исследование (Seville Dec, 2021) и 3,1 участников

3.2 Эксперимент. Выполнение

3.3 Факторы (независимые переменные)

3.4 Переменные ответа (зависимые переменные)

3.5 Смешающие переменные

3.6 Анализ данных

4 Первая репликация (Беркли, май, 2022)

4.1 участники

4.2 Эксперимент. Выполнение

4.3 Анализ данных

5 Обсуждение и угрозы достоверности и 5.1 Операционная конструкция причины - лечение

5.2 Операционализация конструкции эффекта - метрики

5.3 Отбор для населения - участники

6 Выводы и будущая работа

6.1 Репликация в разных культурных фонах

6.2 Использование чат-ботов в качестве партнеров и кодирование высказывания на основе искусственного интеллекта

Наборы данных, соблюдение этических стандартов, подтверждения и ссылки

A. Анкета № 1 и № 2.

B. Эволюция пользовательского интерфейса Twincode

C. Пользовательский интерфейс Tag-A-Chat

5 Обсуждение и угроза достоверности

В этом разделе обсуждаются исходное исследование и его внешняя репликация. Поскольку основные проблемы связаны с их угрозами экспериментальной обоснованности в отношении операционализации и отбора проб, обсуждение организовано вокруг таких угроз, особенно те, которые ранее не обсуждались в описании изменений репликации в разделах 4.1 и 4.2.

5.1 Операционная конструкция причины - лечение

Организация гендерного смещения в лечение не является тривиальной задачей, и, согласно полученным результатам, мы, возможно, не разработали наше лечение так же адекватно, как и мы, угрожая достоверности конструкции.

Учитывая наш экспериментальный дизайн, сообщив субъектам, что они собираются сотрудничать с мужчиной или женщиной, более явным образом могли бы вызвать во многих из них подозрение на то, чтобы быть замеченным об этом факте, ведут себя неестественно и, вероятно, упомянув его непреднамеренно во время общения в чате, обнаруживая, что они отвечают на гендерное положение и инвентаризируют исследование.

Однако, хотя силуэты аватаров в исходном эксперименте (см. Рисунок 9 (а)) имели эффективность, близкие к 60% (см. Таблицу 4), когда они были изменены при репликации на то, что, как мы считали, были более явными гендерными аватарами (см. Рисунок 9 (б)), их эффективность снизилась до 40% (см. Таблицу 6). Помимо изменения аватаров, это снижение эффективности лечения, вероятно, могло повлиять на другие факторы, такие как удаленная обстановка, которая увеличила вероятность отвлечения по сравнению с контролируемой средой, такой как лабораторная сессия, как прокомментировано в разделе 4.2.2. Other factors could have been the reduced duration of the in-pair tasks and the second and third questionnaires, as previously discussed in Section 4.2.3, and the so-called Zoom burnout [49], i.e., the fatigue and exhaustion caused by prolonged use of video conferencing platforms during the COVID–19 pandemic, which may have influenced the motivation and performance of students at UC Berkeley, who are also exposed to Очень высокий уровень стресса [41, 54].

Как прокомментировано в разделе 6.2, мы оцениваем использование чат-ботов вместе с дизайном внутри субъектов в будущих репликациях, чтобы улучшить лечение и, таким образом, смягчать эту угрозу для построения достоверности.

5.2 Операционализация конструкции эффекта - метрики

Основной целью нашей работы является изучение последствий гендерного предвзятости в программировании отдаленных пар. Благодаря этому предварительному характеру мы применили методологическую триангуляцию [13], наблюдая за феноменом из как можно большего количества точек зрения, с помощью операционализации, основанной на 45 переменных ответа различных типов, которые были измерены во время разумного времени взаимодействия.

Сказав, что во время кодирования высказываний в чате некоторые из авторов, которым в течение пятидесятых годов в момент написания этой статьи воспринимали сильные различия в том, как субъекты, которые являются молодыми поколениями [15], общаются по сравнению с тем, как мы это делали, когда мы были их возрастом. При всем предупреждениях и с учетом сильной социально-политической среды в Испании и США против какого-либо гендерной дискриминации, мы считаем, что наличие гендерного предвзятости у людей нашего поколения (поколение X) может снизить два поколения позже, хотя у нас не было достаточно доказательств, чтобы подтвердить его. Кроме того, если гендерная смещение сохраняется, возможно, что большинство субъектов самоцензуры, что препятствует обнаружению его последствий. Чтобы улучшить эту ситуацию, в настоящее время мы развиваем платформу Twincode, чтобы включить больше метрик, а также рассматриваем включение качественных исследований, которые могут привести к новым выводам в будущих повторениях путем расширения спектра собранной информации.

5.3 Отбор для населения - участники

5.3.1 Низкий процент женщин в первоначальном исследовании

К сожалению, небольшая доля женщин в исследованиях STEM является общей проблемой в большинстве высших учебных заведений [1, 51]. Низкое количество женщин -участников в первоначальном исследовании стало препятствием для изучения, является ли гендерная смещение в основном мужскую черту или оно также присутствовало у женщин каким -либо образом. Тем не менее, процент женщин значительно увеличился в первой репликации без значительных результатов взаимодействия пола субъекта с другими факторами.

5.3.2 Небольшой размер образца в репликации

Небольшой размер выборки в репликации и низкая эффективность лечения предполагали четкую угрозу для заключения достоверности, которую можно смягчить только путем принятия результатов как предварительные и выполнять больше репликаций с большими образцами и альтернативными экспериментальными проектами в будущем.

5.3.3 Использование студентов в качестве предметов

Хотя в других эмпирических исследованиях, в которых субъекты являются студенты -разработчиками программного обеспечения, результаты могут быть разумно обобщены для более широкого сообщества, поскольку экспериментальные задачи обычно не требуют высокого уровня промышленного опыта [43], а студенты, которые являются следующим поколением профессионалов, близки к исследуемому населению [19, 34, 45], международные различия в разделе 5.2 и в отсутствии заключенных результатов.

Авторы:

(1) Амадор Дюран, Институт I3US, Университет де Севилья, Севилья, Испания и лаборатория баллов, Университет де Севилья, Севилья, Испания (amador@us.es);

(2) Пабло Фернандес, Институт I3US, Университет де Севилья, Севилья, Испания и лаборатория баллов, Universidad de Sevilla, Севилья, Испания (pablofm@us.es);

(3) Беатрис Бернардес, Институт I3US, Университет де Севилья, Севилья, Испания и лаборатория баллов, Университет де Севилья, Севилья, Испания (beat@us.es);

(4) Натаниэль Вайнман, Отдел компьютерных наук, Калифорнийский университет, Беркли, Беркли, США (nweinman@berkeley.edu);

(5) Аслахан Акалин, Отдел компьютерных наук, Калифорнийский университет, Беркли, Беркли, США (Asliakalin@berkeley.edu);

(6) Армандо Фокс, Отдел компьютерных наук, Калифорнийский университет, Беркли, Беркли, США (Fox@berkeley.edu).

Эта статья естьДоступно на ArxivПод CC по лицензии 4.0.

Оригинал

Борьба за измерение гендерного смещения в среде отдаленного программирования

Таблица ссылок

5 Обсуждение и угроза достоверности

5.1 Операционная конструкция причины - лечение

5.2 Операционализация конструкции эффекта - метрики

5.3 Отбор для населения - участники

Recent Post

Небольшие коммиты, большие победы: как атомные изменения преобразуют жизнь разработчика

Начало работы с государственным управлением в Still.js

Однородность и нормальность: как проверить ваши экспериментальные данные

Революционизация QA: Мой путь к созданию уникального аудита, который сокращает затраты и повышает эффективность

Больше нет «корабля и молитвы»: тестирование биллинговых систем SaaS с тестовыми часами Playwright & Stripe

Categories