Навигация по выбору и проектированию сети с помощью причинно-следственной кластеризации
1 февраля 2024 г.:::информация Авторы:
(1) Давиде Вивиано, факультет экономики Гарвардского университета;
(2) Лихуа Лэй, Высшая школа бизнеса Стэнфордского университета;
(3) Гвидо Имбенс, Высшая школа бизнеса и факультет экономики Стэнфордского университета;
(4) Брайан Каррер, FAIR, Meta;
(5) Окке Шрийверс, Meta Central Applied Science;
(6) Лян Ши, Meta Central Applied Science.
:::
Таблица ссылок
(Когда) следует кластеризовать?
Эмпирические иллюстрации и численные исследования
6 практических рекомендаций
Наш алгоритм зависит от выбора сети и побочных эффектов. В заключение мы приводим краткое изложение нашего метода и четкие рекомендации для практики.
Выбор матрицы смежности Выбор сети должен зависеть от предварительных знаний исследователей о том, по каким измерениям распространяются побочные эффекты. Когда у исследователей есть только некоторое предварительное распределение по тому, какая сеть имеет наибольшее значение, наша структура напрямую распространяется на эти настройки, где цель должна усредняться по распределению сети. В этом случае исследователи могут вычислить ожидаемое смещение и ожидаемую дисперсию для нескольких сетей, сначала рассчитав смещение и дисперсию для каждой сети отдельно, как мы обсуждаем в разделе 3, а затем взяв средневзвешенное значение с некоторыми заранее заданными весами (например, равными весами). ).
Выбор между кластерным дизайном или дизайном Бернулли: явное эмпирическое правило Учитывая диапазон значений ξn и выбор сети, теорема 3.6 дает практическое правило для выбора между кластерным дизайном или дизайном Бернулли. . В таблице 1 предлагается эмпирическое правило φ¯ n √ Kn > 2.3 для бинарных результатов, когда ψ¯ = 4. На рисунке 2 представлен более широкий и конкретный диапазон значений побочных эффектов, которые мотивируют проведение кластерного эксперимента, на основе размера соседей, отнесенных к различным кластерам, и количества кластеров.< /п>
Выбор оптимальных кластеров Наконец, как только исследователи решают провести кластерный эксперимент, алгоритм 1 предоставляет явный алгоритм для оценки оптимальных кластеров с помощью полуопределенного программирования, выбирая как кластеризацию, так и количество кластеров.Выбор оптимальных кластеров. р>
:::информация Этот документ доступен на arxiv по лицензии CC 1.0.
:::
Оригинал