Ложные позитивы, ушли! Skycurtains очищает небо для охотников за галактическим потоком

Ложные позитивы, ушли! Skycurtains очищает небо для охотников за галактическим потоком

18 июня 2025 г.

Авторы:

(1) Debajyoti Sengupta, Département de Physique Nucléaire et Corpusculaire, Женевский университет, Швейцария (debajyoti.sengupta@unige.ch);

(2) Стивен Маллиган, департамент De Physique Nucléaire et Corpusculaire, Женевский университет, Швейцария;

(3) Дэвид Ши, NHETC, Департамент физики и астрономии, Рутгерс, Пискатауэй, Нью -Джерси 08854, США;

(4) Джон Эндрю Рейн, Département de Physique Nucléaire et Corpusculaire, Женевский университет, Швейцария;

(5) Тобиас Голлинг, Département de Physique Nucléaire et Corpusculaire, Женевский университет, Швейцария.

Аннотация и 1. Введение

2. Набор данных

3. Метод Skycurtains и 3.1 Countainsf4f

3.2. Обнаружение линии

4. Результаты

4.1. Метрики

4.2. Полное сканирование потока GD-1

5. Заключение, подтверждение, доступность данных и ссылки

Приложение A: Drainainsf4f обучение и сведения о настройке гиперпараметра

А1. Countainsf4f имеет предварительную обработку

A2 Настройка гиперпараметра

АБСТРАКТНЫЙ

Мы представляем Skycurtaines, метод, управляемый данными и модель, для поиска звездных потоков в галактике Млечного пути, используя данные из телескопа Gaia. Skycurtains - это слабо контролируемый алгоритм машинного обучения, который строит шаблон обогащенного фона в области сигнала, используя корреляцию характеристик источника с их правильным движением в небе. Это допускает более репрезентативный шаблон фона в области сигнала и уменьшает ложные срабатывания в поиске звездных потоков. Минимальные допущения модели в методе Skycurtains позволяют обеспечить гибкий и эффективный поиск различных видов аномалий, таких как потоки, глобулярные кластеры или карликовые галактики непосредственно из данных. Мы проверяем производительность Skycurtains в потоке GD-1 и показываем, что он способен восстановить поток с чистотой 75,4%, что составляет более 10% по сравнению с существующими методами, основанными на машинном обучении при сохранении эффективности сигнала 37,9%.

1 Введение

Когда меньшие гравитационные системы, такие как глобулярные кластеры или спутниковые карликовые галактики, разрушаются их галактикой -хозяином, звезды в этих системах снимаются. Это приводит к потоку звезд, названных Stellar Streams, которые со временем прослеживают орбиту системы предшественников. Поскольку взаимодействие между этими крупными гравитационными системами происходят в течение очень длительного времени, наблюдения за этими событиями в реальном времени невозможно. Следовательно, звездные потоки являются отличным альтернативным зондом в истории слияний этих систем (Johnston 1998; Helmi & White 1999; Carlberg 2017; Vera-Casanova et al. 2022; Belokurov et al. 2006). Кроме того, орбиты этих потоков чувствительны к гравитационному потенциалу галактики хозяина и, таким образом, могут использоваться для ограничения массового распределения в нем (Johnston et al. 1999; Ibata et al. 2001; Koposov et al. 2010; Sanders & Binney 2013; Banik & Bovy 2019). Со временем, из -за гравитационного взаимодействия с окружающим веществом, форма этих потоков изменяется, и возмущения в нем плотность, такие как пробелы и шпоры, также могут дать представление о распределении темных веществ в галактике (Carlberg et al. 2012; Varghese et al. 2011; Sanders et al. 2016; 2012; 2019). Таким образом, изучение звездных потоков имеет решающее значение для понимания формирования и эволюции галактик и его содержания.

Миссия GAIA (Gaia Collaboration et al. 2018) предоставила беспрецедентный набор данных звезд в Млечном пути с точными астрометрическими и фотометрическими измерениями. Это богатство данных позволило разработать несколько методов обнаружить звездные потоки (Malhan & Ibata 2018; Malhan et al. 2018; Yuan et al. 2018; Meingast, Stefan & Alves, João 2019; Borsato et al. 2019; Meingast, Stefan et al. 2019; Ibata et al. Et al. В целом, эти методы используют астрофизику звездных потоков, таких как их группировка в химическом составе и кинематике, для идентификации кандидатов в потоку. Например, алгоритм Streamfinder (Malhan & Ibata 2018; Malhan et al. 2018) предполагает специфическую модель для гравитационного потенциала галактики Млечного Пути и ищет звезды, занимающие одни и те же гипердимерные трубки через шестимерное позиционное пространство и скорости.

Совсем недавно для обнаружения звездных потоков были использованы несколько методов машинного обучения. В частности, через Machinae (Shih et al. 2021, 2023) и CWOLA (Pettee et al. 2023) полностью приведены в центре внимания и имеют очень минимальные модельные предположения о потоках. Эти методы были первоначально введены в контексте физики высокой энергии, чтобы найти локализованную чрезмерность в пространстве объектов. Ожидается, что в случае кинематически холодных звездных потоков звезды участники будут производить локализованную чрезмерность в правильной функции движения. Можно определить область сигнала (SR), основанную на правильном движении, где наблюдается увеличенная популяция звезд звездного потока, а побочные полосы (SB1, SB2) с обеих сторон SR, где ожидается, что члены потока не будут присутствовать (или с гораздо более низкой скоростью, по сравнению с SR).

Можно обойти этот смещение, если подходящий шаблон фона построен для использования в методе CWOLA. Мы предлагаем Skycurtains, которые строят обогащенный фоном шаблон звезд в SR в управляемом данными.Skycurtainesоснован на oncurtainsf4f, методе, первоначально разработанном для обнаружения аномалий в физике с высокой энергией, введенной в (Raine et al. 2023; Sengupta et al. 2023). Curtainsf4f-это слабо контролируемая стратегия, управляемая данными, которая расширяет метод CWOLA, чтобы смягчить проблему корреляции дискриминационных признаков с правильной функцией движения. Мы используем корреляцию функций с правильным движением для генерации шаблона в области сигнала с помощью боковых полос. Это облегчает необходимость выборки данных из SB для CWOLA и приводит к шаблону, который более репрезентативен для фона в SR. Затем можно использовать метод CWOLA, чтобы пометить звезды в SR, обучая классификатор на шаблоне данных SR, за которым следует алгоритм поиска линии для идентификации потока.

Создание шаблона обогащенного фона значительно снижает ложные срабатывания, что является большим преимуществом метода Skycurtains над автономным методом CWOLA. Как мы увидим в разделе 3 Skycurtains имеет модульную конструкцию, а его эффективность данных в обучении позволяет эффективно масштабировать метода до большего количества пятен.

2 набор данных

Мы демонстрируем метод Skycurtains в наборе данных GAIA Data Release 2 (GDR2) (GAIA Collaboration et al. 2018). GDR2 содержит подробную астрометрическую и фотометрическую информацию для более чем 1,3 миллиарда источников в галактике Млечного пути. Набор данных характеризует источник с помощью правого восхождения (𝛼) и склонения (𝛿), параллакса (𝜛), правильных движений в правом восхождении (𝜇𝛼) и склоне (𝜇𝛿), кажущейся величине (𝐺) и информации о цвете в форме полос GBP и GRP (𝐺BP - 𝐺RP). Более новый выпуск данных GAIA (GDR3) поставляется с улучшенными измерениями радиальных скоростей, но, поскольку метод Skycurtains не использует эту информацию, мы используем набор данных GDR2. Это позволяет прямо сравнить с методами VIA Machinae и Cwola, которые были разработаны с использованием набора данных GDR2.

Кинематические сокращения применяются для отклонения отдаленных звезд, которые вызывают чрезмерную плотность в правильном движении при ∼ 0 MAS/YR и снижают чувствительность модели к чрезмерной интенсивности, вырабатываемой звездными потоками. Разрешение на величину удаляет звезды, которые слишком тусклые и гарантируют, что у нас есть равномерное покрытие звезд из набора данных GAIA. Вырезание на цветных изоляции старых звезд с низкой металличностью, которые с большей вероятностью будут звездными элементами потока.

Эта статья естьДоступно на ArxivПод CC по лицензии 4.0.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE