Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией

Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией

2 сентября 2024 г.

Авторы:

(1) Атанасиос Ангелакис, Медицинский центр Амстердамского университета, Амстердамский университет - Центр научных данных, Амстердамский научно-исследовательский институт общественного здравоохранения, Амстердам, Нидерланды

(2) Андрей Расс, Ден Хааг, Нидерланды.

  • Аннотация и 1 Введение
  • 2. Эффект смещения класса, вызванного расширением данных, зависит от данных, регуляризации и архитектуры.
  • 2.1. Разведка надежности дополнения данных
  • 2.2 Специфика смещения, вызванного аугментацией влияния данных
  • 2.3 Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией
  • 2.4 Альтернативные архитектуры оказывают разное влияние на смещение, вызванное аугментацией
  • 3 Заключение и ограничения, а также ссылки
  • Приложения A-L

2.3 Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией

Поскольку частью цели этой работы было подтверждение влияния DA на компромисс смещения-дисперсии проблем классификации изображений, как показано в Balestriero, Bottou и LeCun (2022), мы также решили глубже изучить специфику политики DA, реализованной в оригинальной статье. В частности, мы чувствовали, что она упускает из виду возможные эффекты, которые могло внести ее универсальное применение случайного горизонтального переворота (далее «RHF») в качестве дополнительного DA. Чтобы исследовать это, мы снова провели серию экспериментов, аналогичных разделу 2.2, на этот раз исключив RHF.

Наши испытания показали (см. Рисунок 3 и приложения F, J и K) схожие тенденции и результаты по сравнению с Разделом 2.1. Однако, как и следовало ожидать от удаления незначительного источника регуляризации, такого как RHF, общая средняя производительность была незначительно хуже во всех трех наборах данных. Кроме того, похоже, что пороговые значения α (после которых общая и класс-специфическая производительность начинает падать, а также при которых достигаются наилучшая точность по классу и средняя точность) в целом увеличились - например, наилучшая производительность «Sandal» составляет до 40% с 36% по сравнению с предыдущим разделом. Таким образом, мы видим, что RHF соединяется с масштабирующим случайным кадрированием DA, выступая в качестве «постоянного» источника дополнительной регуляризации, сохраняя, если и ускоряя, динамику точности тестового набора по мере роста α. Учитывая это, Балестриеро, Ботту и ЛеКун (2022) подтверждают свою правоту, поскольку выводы, сделанные в работе, скорее всего, не были бы изменены, если бы

Figure 3: The results in this figure employ official ResNet50 models from Tensorflow trained from scratch on the Fashion-MNIST, CIFAR-10 & CIFAR-100 datasets respectively, with the Random Crop but no Random Horizontal Flip DA applied. All results in this figure are averaged over 4 runs. During training, the proportion of the original image obscured by the augmentation varies from 100% to 10%. We observe that while the trends from Figure 2 are generally maintained, the removal of Random Flip seems to decrease the speed at which class-specific bias manifests as α is increased. Only a subset of classes is shown for CIFAR-100 for legibility purposes.

RHF был опущен. Хотя это не имеет серьезных последствий, это открытие должно служить напоминанием о том, что следует проявлять осторожность при объединении множества дополнений данных. Хотя такой подход является стандартной практикой в ​​современных задачах компьютерного зрения, он может быстро увеличить сложность, и контроль влияния данного дополнения на смещение, специфичное для класса, может стать затруднительным.

Эта статьядоступно на arxivпо лицензии CC BY 4.0 DEED.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE