Плюсы и минусы парного программирования

Плюсы и минусы парного программирования

23 июня 2025 г.

Аннотация и 1. Введение

2. Контексты, методы и задачи

3. Смешанные результаты

3.1. Качество и 3,2 производительности

3.3. Обучение и 3,4 стоимости

4. Модераторы

4.1. Типы задач и сложность

4.2. Совместимость

4.3. Коммуникация

4.4. Сотрудничество

4.5. Логистика

5. Обсуждение и будущая работа

5.1. LLM, ваш парный программист?

5.2. LLM, лучший программист?

5.3. LLM, студенческий программист?

6. Заключение, подтверждение и ссылки

3 смешанные результаты

Литературные обзоры программирования пар человека-человека предложили различные преимущества, а также смешанные эффекты. В отраслевом контексте, по словам Алвеса де Лима Сальдж и Беренте [5], парные программирование улучшают качество кода, повышают производительность и повышают результаты обучения. Однако, согласно Hannay et al. [31], парное программирование улучшает качество и сокращает продолжительность, но оно увеличивает усилия, более высокое качество достигается за счет значительно больших усилий, а сокращение времени завершения сопровождается более низким качеством. В контексте образования парные программирование приносит преимущества, включая более качественное программное обеспечение, уверенность учащихся в решениях, повышенные оценки назначения, оценки экзаменов, показатели успеха/прохождения на вводных курсах и удержание [29, 52, 83]. Все обзоры программирования пар человека-мужанья признали, что, несмотря на то, что метаанализ может показать общую тенденцию и значительный размер эффекта, индивидуальные исследования могут сообщать о противоречивых результатах (см. Примеры в таблице 1).

Для программирования пар человеческой пары существующие работы в основном фокусируются на качестве, производительности и удовлетворенности, и уже продемонстрировали смешанные результаты в качестве качества и производительности [8, 35, 84] (см. Примеры в таблице 1). Кроме того, для комплексного обзора недостаточно исследований, поэтому мы еще не можем прийти к какому-либо выводу об эффективности программирования пар человеческой пары. Также трудно сравнивать литературу по программированию парней человека и человека-аи, поскольку они различаются по тем, какие результаты и измерения они принимают.

Поэтому в верхних рядах таблицы 1 мы перечислили наиболее распространенные переменные результата в обеих литературе (качество, производительность, удовлетворенность, обучение, ирасходы) и некоторые образцы работы, чтобы продемонстрировать смешанные результаты и различные меры. Мы подробно рассказываем о разнообразии способов измерения некоторых из перечисленных результатов следующим образом.

3.1 качество

В литературе по программированию пары человека человека качество может быть измерено с использованием плотности дефектов, мера восприятия, читабельности, функциональности, количества прошедших тестовых случаев, сложности кода, баллов, экспертных мнений и т. Д. [5, 70, 79].

3.2 Производительность

В литературе по программированию пары человека человека, продолжительность, усилия и производительность-все это виды результатов «эффективности», которые включают время и достижение. Производительность может быть измерена в терминах количества выполненных задач за фиксированную единицу времени, продолжительность может быть измерена как количество истекаемого или общего времени, используемого для завершения фиксированного числа

Table 1: Comparison of Outcome Variables and Moderators for Human-Human Pair Programming vs. Human-AI pAIr Programming

Задачи по определенному стандарту, и усилия могут быть измерены как вдвое больше продолжительности, необходимого лица и т. Д. [5]. Мы используем производительность в качестве агрегированной переменной результата различных мер, для согласованности с литературой по человеческому-аи.

В текущих работах Human-AI некоторые меры, возможно, слишком упрощены в качестве показателей оценки, например, Imai [35] использовал количество строк добавленного кода в качестве меры производительности; Тем не менее, характер взаимодействия с Copilot (TAB для принятия предложений), вероятно, способствует более добавленным линиям в условиях человека-копилота, и насколько он будет представлять собой понятие производительности сомнительным.

Обратите внимание, что некоторые исследователи изучали воспринимаемую производительность программистов при работе с вафером и обнаружили, что он наиболее сильно коррелирует с общим уровнем принятия кода, сгенерированного AI [90]. Это не включено в таблицу 1, чтобы оставаться в соответствии с литературой по программированию парней человека человека, поскольку воспринимаемая производительность-это не так, как фактическая производительность.

3.3 Обучение

В литературе по программированию парней человека человека обучение может быть оценено по количественным показателям, таким как оценки назначения, оценки экзаменов, скорость прохождения и уровень удержания, или качественные меры навыков мышления более высокого порядка [29, 52, 83].

3.4 Стоимость

С точки зрения затрат, существует наблюдение, что участники столкнулись с проблемами в понимании и отладке кода, созданного Copilot, что приводит к гипотезе о том, что программирование пар человеческой пары может стоить дополнительных усилий и препятствовать эффективности решения задач программистов [12, 84]. Однако Dakhel et al. [21] показывает, что, хотя код Copilot может быть менее правильным, чем человеческий код, его ошибки легче отладить, чем человеческие ошибки. В настоящее время не существует работы, которая экспериментально характеризует затраты на программирование пар человеческой пары.

Краткое содержание: Литература по программированию парных парных партий показала смешанные результаты во многих переменных результатов, включаякачествоВпроизводительностьВудовлетворениеВобучение, ирасходыПолем Для программирования пар человеческой пары, или в основном человеческого-запосоми в этой статье, все еще мало работ с неуместными мерами, но также наблюдается смешанный результат. Мы также рассмотрим потенциальные причины смешанных результатов обоих способов парного программирования в разделе 4.

Авторы:

(1) Qianou Ma (автор -корреспондент), Университет Карнеги -Меллона, Питтсбург, США (Qianouma@cmu.edu);

(2) Тонгшуанг Ву, Университет Карнеги -Меллона, Питтсбург, США (sherryw@cs.cmu.edu);

(3) Кеннет Кодингер, Университет Карнеги -Меллона, Питтсбург, США (koedinger@cmu.edu).


Эта статья естьДоступно на ArxivПод CC By-NC-SA 4.0 Лицензия.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE