Эффект смещения класса, вызванного расширением данных, зависит от данных и регуляризации

Эффект смещения класса, вызванного расширением данных, зависит от данных и регуляризации

2 сентября 2024 г.

Авторы:

(1) Атанасиос Ангелакис, Медицинский центр Амстердамского университета, Амстердамский университет - Центр научных данных, Амстердамский научно-исследовательский институт общественного здравоохранения, Амстердам, Нидерланды

(2) Андрей Расс, Ден Хааг, Нидерланды.

  • Аннотация и 1 Введение
  • 2. Эффект смещения класса, вызванного расширением данных, зависит от данных, регуляризации и архитектуры.
  • 2.1. Разведка надежности дополнения данных
  • 2.2 Специфика смещения, вызванного аугментацией влияния данных
  • 2.3 Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией
  • 2.4 Альтернативные архитектуры оказывают разное влияние на смещение, вызванное аугментацией
  • 3 Заключение и ограничения, а также ссылки
  • Приложения A-L

2. Эффект смещения класса, вызванного расширением данных, зависит от данных, регуляризации и архитектуры.

В этом разделе подробно описывается анализ нашего исследования, ориентированный на данные и модель, явлений, первоначально наблюдавшихся в (Balestriero, Bottou и LeCun 2022). Во-первых, мы устанавливаем практическую основу для воспроизведения таких экспериментов в разделе 2.1. После этого мы используем модель ResNet50, обученную с нуля с помощью DA Random Cropping и Random Horizontal Flip, чтобы обеспечить ориентированный на данные анализ смещения, специфичного для класса, вызванного DA, на трех наборах данных (Fashion-MNIST, CIFAR-10 и CIFAR-100) в разделе 2.2. Затем мы делаем шаг назад в разделе 2.3, чтобы оценить потенциальные побочные эффекты включения дополнения Random Horizontal Flip, как это было сделано в оригинальном исследовании. Наконец, мы завершаем, демонстрируя, как альтернативные архитектуры компьютерного зрения взаимодействуют с явлением, проиллюстрированным в предыдущих разделах. Эти результаты имеют ключевое значение, поскольку они углубляют наше понимание потенциальных опасностей внедрения DA в задачи компьютерного зрения с целью повышения общей производительности модели, одновременно показывая, как можно смягчить или предотвратить проблему смещения, специфичного для класса.

Эта статьядоступно на arxivпо лицензии CC BY 4.0 DEED.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE