Как Skycurtains переопределяет поиск звездных потоков

Как Skycurtains переопределяет поиск звездных потоков

18 июня 2025 г.

Аннотация и 1. Введение

2. Набор данных

3. Метод Skycurtains и 3.1 Countainsf4f

3.2. Обнаружение линии

4. Результаты

4.1. Метрики

4.2. Полное сканирование потока GD-1

5. Заключение, подтверждение, доступность данных и ссылки

Приложение A: Drainainsf4f обучение и сведения о настройке гиперпараметра

А1. Countainsf4f имеет предварительную обработку

A2 Настройка гиперпараметра

5 Заключение

В этой работе мы описали метод Skycurtains, модельный подход, основанный на данных на основе шаблонов, к обнаружению звездных потоков в Млечном пути с использованием данных GAIA DR2. Первоначально разработанный для обнаружения аномалий при физике с высокой энергией, Skycurtains объединяет ряды Via Machinae и Cwola, в поисках звездных потоков, что подчеркивает универсальность этих инструментов в их производительности в разных доменах. Синергизм между физикой высокой энергии, астрофизикой и другими сообществами следует дополнительно поощрять, чтобы определить аналогичные проблемы, которые могут быть решены с использованием тех же инструментов, разработанных в соответствующих областях.

Мы продемонстрировали производительность Skycurtains в потоке GD-1 и его способность идентифицировать линейную чрезмерную плотность в пространстве 𝜙-𝜆, которое соответствует потоку GD-1 с очень высокой чистотой в большинстве пятен. Основным преимуществом Skycurtains является минимальные предположения, которые он делает в отношении базового сигнала, что делает его универсальным инструментом для определения любых локализованных чрезмерных чрезмерностей (потоки, глобулярные кластеры, карликовые галактики) в пространстве функций звезд модельным агностическим образом. В этой работе мы выбрали поток GD-1, поскольку он обеспечивает хороший тестовый пример для Skycurtains и является известным потоком в Млечном пути, где мы показываем, что Skycurtains в настоящее время превосходит другие слабо контролируемые методы машинного обучения, такие как через Machinae и Cwola с точки зрения чистоты более чем на 10%. Для полного сканирования неба для потоков, где местоположения потоков неизвестны, метод должен будет сканировать большее количество 𝜇𝜆. В этом случае обучение двум условным моделям для каждого патча может быть невозможным. Тем не менее, модульность конструкции шага Chounainsf4f позволяет гораздо проще масштабировать. Базовый поток может быть обучен на всем пятнах и замороженных, а затем отдельные верхние потоки могут быть обучены соответствующим областям, представляющим интерес для эффективного масштабирования. Skycurtains создает шаблон, используя корреляции функций с правильными движениями, что приводит к более фоновому репрезентативному шаблону. Это позволяет методу использовать более дискриминационные функции, которые будут использоваться в нижнем потоке

Figure 8. Top: Comparison of PWB18 and the 753 SkyCURTAINs identified stream candidates. The first panel shows the PWB18 GD-1 stream members in the GD-1 stream stream aligned coordinate system (𝜙1, 𝜙2 ). The middle panel shows the potential members of the GD-1 stream stream in the GD-1 stream aligned coordinate system identified by the SkyCURTAINs method. The bottom panel is a comparison of the number of candidate stream stars identified by the SkyCURTAINs method (red) and the number of PWB18 (black) in the GD-1 stream in 𝜙1 bins of width 1◦. The shaded region to the left of the stream correspond to the patches which are excluded from the analysis due to their proximity to the galactic disk. The shaded region to the right of the stream correspond to the patches containing stars with very low proper motions, which reduces the signal sensitivity of the CurtainsF4F to potential streams. Bottom: Coverage plots in the 𝐺 vs 𝐺BP − 𝐺RP and 𝜇𝛼 vs 𝜇𝛼 cos 𝛿 space. The contours show the 68.2, 95.4 and 99.7 percentiles of the GD-1 stream members identified by PWB18. The SkyCURTAINs identified candidates are shown in red.

Задача независимо от их корреляции с надлежащими движениями, что в противном случае приведет к предвзятому классификатору и, следовательно, ложным срабатыванию.

Последующая работа будет включать в себя применение Skycurtains в полном поиске неба звездных потоков в Млечном пути и сравнение производительности метода с другими существующими методами. Последний выпуск данных GDR3 из GAIA содержит более 1,8 миллиарда источников с улучшенными астрометрическими и фотометрическими измерениями для значительно большего числа источников по сравнению с GDR2, что обеспечит более подробный взгляд на Млечный путь. Улучшенные измерения радиальных скоростей источников в GDR3 также позволят более подробное изучение кинематики потоков. Улучшения в качестве данных в GDR3, вероятно, еще больше улучшит производительность Skycurtains и, как таковой, является естественным следующим шагом для метода.

Благодарности

Мы хотели бы поблагодарить финансирование через SNSF Sinergia Grant CRSII5_193716 «Надежные модели глубокой плотности для высокоэнергетической физики частиц и анализа солнечной вспышки (Rodem)». Эта работа использовала данные из Миссии Европейского космического агентства (ESA) GAIA (https://www.cosmos.esa.int/ gaia), обработанной консорциумом и анализом данных GAIA (dpac, https://www.cosmos.esa.int/web/gaia/dpac/sortium). Финансирование DPAC было предоставлено национальными учреждениями, в частности, учреждениям, участвующими в многостороннем соглашении GAIA. Вычисления были выполнены в Женевском университете с использованием сервиса Baobab HPC. Особая благодарность Сэмюэлю Кляйн и Кинге Анне Возняк за их вклад во время разработки метода и этой рукописи.

Figure 9. GD-1 stream purity obtained by the SkyCURTAINs method as a function of PWB18 signal to background ratio (shown here in percentages).

Figure 10. Coverage plot for the GD-1 stream in the 𝐺 vs 𝐺BP − 𝐺RP space. The contours show the 68.2, 95.4 and 99.7 percentiles of the GD-1 stream members identified by PWB18. The 185 additional SkyCURTAINs identified candidates are shown in red.

Доступность данных

Skycurtains использует общедоступные данные GDR2. Куратор из 21 патча, используемых в этой работе, доступен наhttps://zenodo.org/records/7897936Полем Метки членства в потоке GD-1 взяты изhttps://zenodo.org/records/1295543Полем

Ссылки

Banik N., Bovy J., 2019, Ежемесячные уведомления Королевского астрономического общества, 484, 2009

Belokurov V., et al., 2006, The Astrophysical Journal, 642, L137 - L140

Бонака А., Хогг Д. У., Прай-Уилан А. М., Конрой С., 2019, Астрофизический журнал, 880, 38

Bonaca A., et al., 2020, Astrophysical Journal Letters, 892, L37

Borsato N.W., Martell S.L., Simpson J.D., 2019, Ежемесячные уведомления Королевского астрономического общества, 492, 1370–1384

Carlberg R.G., 2017, The Astrophysical Journal, 838, 39

Carlberg R.G., Grillmair C.J., Hetherington N., 2012, The Astrophysical Journal, 760, 75

Gaia Collaboration et al., 2018, A & A, 616, A1

Golling T., Klein S., Mastandrea R., Nachman B., Raine J.A., 2023, Phys. Rev. D, 108, 096018

Grillmair C.J., Dionatos O., 2006, The Astrophysical Journal, 643, L17

Хельми А., Уайт С. Д. М., 1999, Ежемесячные уведомления Королевского астрономического общества, 307, 495

Hough P. V., 1962, метод и средства для распознавания сложных закономерностей

Ибата Р., Льюис Г. Ф., Ирвин М., Тоттен Э., Куинн Т., 2001, Астрофизический журнал, 551, 294–311

Ибата Р. и др., 2021, Астрофизический журнал, 914, 123

Johnston K.V., 1998, The Astrophysical Journal, 495, 297–308

Johnston K.V., Zhao H., Spergel D.N., Hernquist L., 1999, The Astrophysical Journal, 512, L109 - L112

Koposov S.E., Rix H.W., Hogg D.W., 2010, The Astrophysical Journal, 712, 260–273

Малхан К., Ибата Р. А., 2018, Ежемесячные уведомления Королевского астрономического общества, 477, 4063–4076

Malhan K., Ibata R.A., Goldman B., Martin N.F., Magnier E., Chambers K., 2018, Ежемесячные уведомления Королевского астрономического общества, 478, 3862–3870

Meingast, Stefan Alves, João 2019, A & A, 621, L3

Meingast, Stefan Alves, João Fürnkranz, Verena 2019, A & A, 622, L13

Metodiev E.M., Nachman B., Thaler J., 2017, Journal of High Energy Physics, 2017

Nachman B., Shih D., 2020, Physical Review D, 101

Necib L., Lisanti M., Garrison-Kimmel S., Wetzel A., Sanderson R., Hopkins P.F., Faucher-Giguère C.-A., KereШ D., 2019, The Astrophysical Journal, 883, 27

Papamakarios G., Nalisnick E., Rezende D.J., Mohamed S., Lakshminarayanan B., 2021, Journal of Machine Learning, 22, 1

Pettee M., Thanvantri S., Nachman B., Shih D., Buckley M.R., Collins J. H., 2023, слабоосложное обнаружение аномалий по Млечному пути (Arxiv: 2305.03761)

Прайс-Уилан А. М., Бонака А., 2018, Астрофизические журнальные буквы, 863, L20

Purcell C. W., Zentner A.R., Wang M.-Y., 2012, Journal of Cosmology and Astroparticle Physics, 2012, 027–027

Рейн Дж. А., Кляйн С., Сенгупта Д., Голлинг Т., 2023, границы в больших данных, 6

Сандерс Дж. Л., Бинни Дж., 2013, Ежемесячные уведомления Королевского астрономического общества, 433, 1813

Sanders J.L., Bovy J., Erkal D., 2016, Ежемесячные уведомления Королевского астрономического общества, 457, 3817–3835

Sengupta D., Klein S., Raine J.A., Golling T., 2023, Шторы потоки для потоков: построение ненаблюдаемых областей с оценкой максимальной вероятности (ARXIV: 2305.04646)

Shih D., Buckley M.R., Necib L., Tamanas J., 2021, Ежемесячные уведомления Королевского астрономического общества, 509, 5992

Shih D., Buckley M.R., Necib L., 2023, Via Machinae 2.0: Full-Sky, ModelAgnostic Search для звездных потоков в Gaia DR2 (Arxiv: 2303.01529)

Варгезе А., Ибата Р., Льюис Г. Ф., 2011, Ежемесячные уведомления Королевского астрономического общества, 417, 198–215

Vera-Casanova A., et al., 2022, Ежемесячные уведомления Королевского астрономического общества, 514, 4898

Yuan Z., Chang J., Banerjee P., Han J., Kang X., Smith M.C., 2018, The Astrophysical Journal, 863, 26

A1 Courtainsf4f имеет предварительную обработку

Первым шагом в обучении модели Chounainsf4f является определение областей SR и SB в 𝜇𝜆. В этой работе мы выбрали SR в данном патче, чтобы гарантировать, что поток GD-1 полностью содержится. Область SB, определяемая как область, прилегающая к SR, выбран как шириной 6 мАС/год. Это обеспечивает достаточную статистику обучения для базы и модели верхнего потока. Особенности, используемые для обучения модели Chounainsf4f, являются: [𝜙, 𝜆, 𝐺, 𝐺bp - 𝐺rp, 𝜇 ∗ 𝜙], а условная особенность равен 𝜇𝜆. Поскольку эти функции имеют разные динамические диапазоны, мы предпочитаем дополнительно масштабировать их, чтобы обеспечить стабильную подготовку модели. Все функции сначала масштабируются, чтобы быть в диапазоне [0, 1]. Функция 𝐺 имеет резкую отсечку на 20,2, что является сложной функцией для генеративных моделей. Чтобы смягчить это, мы применяем преобразование логита к функции 𝐺. Преобразование логита определяется как:

Наконец, все функции масштабируются, чтобы быть в диапазоне [-3, 3].

Данные для базового и высшего обучения потока делятся на наборы обучения и валидации в соотношении 80: 20.

А2 Гиперпараметрическая настройка

Гиперпараметры для базового и верхнего потока перечислены в таблице A1, где было обнаружено, что гиперпараметры для базовых потоков дают надежную производительность независимо от патча и, таким образом, оставались постоянными. Для верхних потоков может быть значительное различие в производительности, связанных с выбором гиперпараметра в зависимости от патча, и поэтому настройка гиперпараметра была выполнена, чтобы найти значения, которые работали хорошо независимо от патча. Как основание, так и верхний поток был ограничен максимальным числом 150 и 100 эпох соответственно. В то время как базовый поток, по -видимому, улучшался с большим количеством эпох, верхний поток сходился гораздо быстрее на 30 - 40 эпох тренировок.

Table A1. Hyperparameters for CurtainsF4F Training

Авторы:

(1) Debajyoti Sengupta, Département de Physique Nucléaire et Corpusculaire, Женевский университет, Швейцария (debajyoti.sengupta@unige.ch);

(2) Стивен Маллиган, департамент De Physique Nucléaire et Corpusculaire, Женевский университет, Швейцария;

(3) Дэвид Ши, NHETC, Департамент физики и астрономии, Рутгерс, Пискатауэй, Нью -Джерси 08854, США;

(4) Джон Эндрю Рейн, Département de Physique Nucléaire et Corpusculaire, Женевский университет, Швейцария;

(5) Тобиас Голлинг, Département de Physique Nucléaire et Corpusculaire, Женевский университет, Швейцария.


Эта статья естьДоступно на ArxivПод CC по лицензии 4.0.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE