Эффект смещения класса, вызванного расширением данных, зависит от данных и регуляризации
2 сентября 2024 г.Авторы:
(1) Атанасиос Ангелакис, Медицинский центр Амстердамского университета, Амстердамский университет - Центр научных данных, Амстердамский научно-исследовательский институт общественного здравоохранения, Амстердам, Нидерланды
(2) Андрей Расс, Ден Хааг, Нидерланды.
Таблица ссылок
- Аннотация и 1 Введение
- 2. Эффект смещения класса, вызванного расширением данных, зависит от данных, регуляризации и архитектуры.
- 2.1. Разведка надежности дополнения данных
- 2.2 Специфика смещения, вызванного аугментацией влияния данных
- 2.3 Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией
- 2.4 Альтернативные архитектуры оказывают разное влияние на смещение, вызванное аугментацией
- 3 Заключение и ограничения, а также ссылки
- Приложения A-L
2. Эффект смещения класса, вызванного расширением данных, зависит от данных, регуляризации и архитектуры.
В этом разделе подробно описывается анализ нашего исследования, ориентированный на данные и модель, явлений, первоначально наблюдавшихся в (Balestriero, Bottou и LeCun 2022). Во-первых, мы устанавливаем практическую основу для воспроизведения таких экспериментов в разделе 2.1. После этого мы используем модель ResNet50, обученную с нуля с помощью DA Random Cropping и Random Horizontal Flip, чтобы обеспечить ориентированный на данные анализ смещения, специфичного для класса, вызванного DA, на трех наборах данных (Fashion-MNIST, CIFAR-10 и CIFAR-100) в разделе 2.2. Затем мы делаем шаг назад в разделе 2.3, чтобы оценить потенциальные побочные эффекты включения дополнения Random Horizontal Flip, как это было сделано в оригинальном исследовании. Наконец, мы завершаем, демонстрируя, как альтернативные архитектуры компьютерного зрения взаимодействуют с явлением, проиллюстрированным в предыдущих разделах. Эти результаты имеют ключевое значение, поскольку они углубляют наше понимание потенциальных опасностей внедрения DA в задачи компьютерного зрения с целью повышения общей производительности модели, одновременно показывая, как можно смягчить или предотвратить проблему смещения, специфичного для класса.
Эта статьядоступно на arxivпо лицензии CC BY 4.0 DEED.
Оригинал