Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией
2 сентября 2024 г.Авторы:
(1) Атанасиос Ангелакис, Медицинский центр Амстердамского университета, Амстердамский университет - Центр научных данных, Амстердамский научно-исследовательский институт общественного здравоохранения, Амстердам, Нидерланды
(2) Андрей Расс, Ден Хааг, Нидерланды.
Таблица ссылок
- Аннотация и 1 Введение
- 2. Эффект смещения класса, вызванного расширением данных, зависит от данных, регуляризации и архитектуры.
- 2.1. Разведка надежности дополнения данных
- 2.2 Специфика смещения, вызванного аугментацией влияния данных
- 2.3 Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией
- 2.4 Альтернативные архитектуры оказывают разное влияние на смещение, вызванное аугментацией
- 3 Заключение и ограничения, а также ссылки
- Приложения A-L
2.3 Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией
Поскольку частью цели этой работы было подтверждение влияния DA на компромисс смещения-дисперсии проблем классификации изображений, как показано в Balestriero, Bottou и LeCun (2022), мы также решили глубже изучить специфику политики DA, реализованной в оригинальной статье. В частности, мы чувствовали, что она упускает из виду возможные эффекты, которые могло внести ее универсальное применение случайного горизонтального переворота (далее «RHF») в качестве дополнительного DA. Чтобы исследовать это, мы снова провели серию экспериментов, аналогичных разделу 2.2, на этот раз исключив RHF.
Наши испытания показали (см. Рисунок 3 и приложения F, J и K) схожие тенденции и результаты по сравнению с Разделом 2.1. Однако, как и следовало ожидать от удаления незначительного источника регуляризации, такого как RHF, общая средняя производительность была незначительно хуже во всех трех наборах данных. Кроме того, похоже, что пороговые значения α (после которых общая и класс-специфическая производительность начинает падать, а также при которых достигаются наилучшая точность по классу и средняя точность) в целом увеличились - например, наилучшая производительность «Sandal» составляет до 40% с 36% по сравнению с предыдущим разделом. Таким образом, мы видим, что RHF соединяется с масштабирующим случайным кадрированием DA, выступая в качестве «постоянного» источника дополнительной регуляризации, сохраняя, если и ускоряя, динамику точности тестового набора по мере роста α. Учитывая это, Балестриеро, Ботту и ЛеКун (2022) подтверждают свою правоту, поскольку выводы, сделанные в работе, скорее всего, не были бы изменены, если бы
RHF был опущен. Хотя это не имеет серьезных последствий, это открытие должно служить напоминанием о том, что следует проявлять осторожность при объединении множества дополнений данных. Хотя такой подход является стандартной практикой в современных задачах компьютерного зрения, он может быстро увеличить сложность, и контроль влияния данного дополнения на смещение, специфичное для класса, может стать затруднительным.
Эта статьядоступно на arxivпо лицензии CC BY 4.0 DEED.
Оригинал