Навигация по выбору и проектированию сети с помощью причинно-следственной кластеризации

Навигация по выбору и проектированию сети с помощью причинно-следственной кластеризации

1 февраля 2024 г.

:::информация Авторы:

(1) Давиде Вивиано, факультет экономики Гарвардского университета;

(2) Лихуа Лэй, Высшая школа бизнеса Стэнфордского университета;

(3) Гвидо Имбенс, Высшая школа бизнеса и факультет экономики Стэнфордского университета;

(4) Брайан Каррер, FAIR, Meta;

(5) Окке Шрийверс, Meta Central Applied Science;

(6) Лян Ши, Meta Central Applied Science.

:::

Таблица ссылок

Абстрактное и amp; Введение

Настройка

(Когда) следует кластеризовать?

Выбор дизайна кластера

Эмпирические иллюстрации и численные исследования

Рекомендации для практики

Ссылки

A) Обозначения

Б) Эндогенные эффекты коллег

C) Доказательства

6 практических рекомендаций

Наш алгоритм зависит от выбора сети и побочных эффектов. В заключение мы приводим краткое изложение нашего метода и четкие рекомендации для практики.

Выбор матрицы смежности Выбор сети должен зависеть от предварительных знаний исследователей о том, по каким измерениям распространяются побочные эффекты. Когда у исследователей есть только некоторое предварительное распределение по тому, какая сеть имеет наибольшее значение, наша структура напрямую распространяется на эти настройки, где цель должна усредняться по распределению сети. В этом случае исследователи могут вычислить ожидаемое смещение и ожидаемую дисперсию для нескольких сетей, сначала рассчитав смещение и дисперсию для каждой сети отдельно, как мы обсуждаем в разделе 3, а затем взяв средневзвешенное значение с некоторыми заранее заданными весами (например, равными весами). ).

Выбор между кластерным дизайном или дизайном Бернулли: явное эмпирическое правило Учитывая диапазон значений ξn и выбор сети, теорема 3.6 дает практическое правило для выбора между кластерным дизайном или дизайном Бернулли. . В таблице 1 предлагается эмпирическое правило φ¯ n √ Kn > 2.3 для бинарных результатов, когда ψ¯ = 4. На рисунке 2 представлен более широкий и конкретный диапазон значений побочных эффектов, которые мотивируют проведение кластерного эксперимента, на основе размера соседей, отнесенных к различным кластерам, и количества кластеров.< /п>

Выбор оптимальных кластеров Наконец, как только исследователи решают провести кластерный эксперимент, алгоритм 1 предоставляет явный алгоритм для оценки оптимальных кластеров с помощью полуопределенного программирования, выбирая как кластеризацию, так и количество кластеров.Выбор оптимальных кластеров. р>

:::информация Этот документ доступен на arxiv по лицензии CC 1.0.

:::


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE