machine-learning machine-learning data-augmentation computer-vision class-specific-bias image-data-augmentation ml-bias-mitigation data-augmentation-robustness convolutional-neural-networks

Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией

2 сентября 2024 г.

Авторы:

(1) Атанасиос Ангелакис, Медицинский центр Амстердамского университета, Амстердамский университет - Центр научных данных, Амстердамский научно-исследовательский институт общественного здравоохранения, Амстердам, Нидерланды

(2) Андрей Расс, Ден Хааг, Нидерланды.

Таблица ссылок

Аннотация и 1 Введение
2. Эффект смещения класса, вызванного расширением данных, зависит от данных, регуляризации и архитектуры.
2.1. Разведка надежности дополнения данных
2.2 Специфика смещения, вызванного аугментацией влияния данных
2.3 Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией
2.4 Альтернативные архитектуры оказывают разное влияние на смещение, вызванное аугментацией
3 Заключение и ограничения, а также ссылки
Приложения A-L

2.3 Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией

Поскольку частью цели этой работы было подтверждение влияния DA на компромисс смещения-дисперсии проблем классификации изображений, как показано в Balestriero, Bottou и LeCun (2022), мы также решили глубже изучить специфику политики DA, реализованной в оригинальной статье. В частности, мы чувствовали, что она упускает из виду возможные эффекты, которые могло внести ее универсальное применение случайного горизонтального переворота (далее «RHF») в качестве дополнительного DA. Чтобы исследовать это, мы снова провели серию экспериментов, аналогичных разделу 2.2, на этот раз исключив RHF.

Наши испытания показали (см. Рисунок 3 и приложения F, J и K) схожие тенденции и результаты по сравнению с Разделом 2.1. Однако, как и следовало ожидать от удаления незначительного источника регуляризации, такого как RHF, общая средняя производительность была незначительно хуже во всех трех наборах данных. Кроме того, похоже, что пороговые значения α (после которых общая и класс-специфическая производительность начинает падать, а также при которых достигаются наилучшая точность по классу и средняя точность) в целом увеличились - например, наилучшая производительность «Sandal» составляет до 40% с 36% по сравнению с предыдущим разделом. Таким образом, мы видим, что RHF соединяется с масштабирующим случайным кадрированием DA, выступая в качестве «постоянного» источника дополнительной регуляризации, сохраняя, если и ускоряя, динамику точности тестового набора по мере роста α. Учитывая это, Балестриеро, Ботту и ЛеКун (2022) подтверждают свою правоту, поскольку выводы, сделанные в работе, скорее всего, не были бы изменены, если бы

RHF был опущен. Хотя это не имеет серьезных последствий, это открытие должно служить напоминанием о том, что следует проявлять осторожность при объединении множества дополнений данных. Хотя такой подход является стандартной практикой в современных задачах компьютерного зрения, он может быстро увеличить сложность, и контроль влияния данного дополнения на смещение, специфичное для класса, может стать затруднительным.

Эта статьядоступно на arxivпо лицензии CC BY 4.0 DEED.

Оригинал

Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией

Таблица ссылок

2.3 Добавление случайного горизонтального переворота способствует смещению, вызванному аугментацией

Recent Post

Мы построили двигатель AI, который выбирает лучшую диаграмму для ваших данных

ИИ в классе обещает эффективность, но при какой цене обучения?

ИИ является окончанием устойчивости?

Что может сделать ИИ и что мы можем построить

Почему обучение роботов в Fortnite может быть самой умной идеей в технологии

Categories