
Несколько выстрелов в дистанционном зондировании: тенденции, пробелы и будущие направления
11 июня 2025 г.Таблица ссылок
- Аннотация и введение
- Фон
- Тип данных датчика дистанционного зондирования
- Clarkmark Demote Sensing Dataets для оценки моделей обучения
- Метрики оценки для нескольких ударов дистанционного зондирования
- Недавние методы обучения в дистанционном зондировании
- Обнаружение и сегментация объекта на основе нескольких выстрелов в дистанционном зондировании
- Обсуждения
- Численные эксперименты нескольких выстрелов в наборе данных на основе БПЛА
- Объяснимый ИИ (XAI) в дистанционном зондировании
- Выводы и будущие направления
- Благодарности, декларации и ссылки
8 обсуждений
В этом разделе мы стремимся выделить интересные наблюдения, общие тенденции и потенциальные пробелы в исследованиях, основанные на углубленном анализе существующих методов классификации меньшего размера в трех доменах данных дистанционного зондирования. Понимание, обсуждаемые в этом разделе, может служить руководством как для нынешних, так и для будущих исследователей в этой области.
• Большинство методов, описанных в литературе, используют различные модели извлечения признаков, причем модели на основе CNN часто служат основой, как мы уже говорили. Модели с небольшим выстрелом на основе свертки по-прежнему популярны для классификационных задач во всех трех областях. Эти модели способны быстро адаптироваться к новым классам с небольшим количеством обучения, что делает их подходящими для реальных приложений. Тем не менее, методы, основанные на графиках, становятся более популярными для классификации изображений SAR, и они только недавно использовались для классификации изображений VHR. Методы, основанные на графиках, выгодны, потому что они способны улавливать пространственные отношения между объектами, что важно для классификации изображений SAR и VHR. Недавно методы, основанные на трансформаторах, основанные на зрении и постепенные методы обучения, стали альтернативами для классификации гиперспектральной изображения. Эти методы показали перспективу в достижении высокой точности с минимальными учебными данными, что делает их привлекательными для приложений, где маркированные данные ограничены.
• В оценке обсуждаемых работ в классификации гиперспектральных изображений обычно используются три обычно используемые метрики: общая точность (ОА), средняя точность (AA) и коэффициент каппа (κ). Эти метрики часто используются для оценки эффективности классификации предлагаемых алгоритмов. Напротив, для классификации изображений на основе VHR и SAR точность классификации (ОА) часто используется в качестве основного показателя оценки, хотя есть несколько исключений. Более того, в большинстве стратегий оценки, принятых исследователями, предлагаемые алгоритмы работают несколько раз вместе с самыми современными методами (SOTA), и сообщается о соответствующей средней точности и его стандартном отклонении. Этот подход обеспечивает более надежную и надежную оценку эффективности классификации с учетом любых потенциальных изменений в результатах, полученных в нескольких прогонах.
• В отличие от гиперспектральной классификации, было отмечено, что в настоящее время существует немало или вообще не имеет никаких методов классификации на основе вида, предложенных для изображений SAR и VHR. Это может быть связано с проблемами, связанными с получением достаточных наборов данных для реализации эффективных и точных архитектур на основе Vit для изображений SAR. Аналогичным образом, для изображений VHR, хотя существующие модели, которые используют классификацию на основе VIT, они представляют собой не выстрел подходы, такие как модель на основе ванили, предложенную Zhang et al. [3]. Следовательно, у исследователей существуют значительные возможности изучить потенциал нескольких выстрелов подходов к решению проблем, связанных с классификацией данных дистанционного зондирования VHR.
• Текущее состояние исследований по нескольким выстрелам подходов к классификации в области дистанционного зондирования, по-видимому, не включает в себя много работы над изображениями БПЛА или на основе самолетов на низкой высоте, насколько свидетельствует текущие знания. Это может быть связано с уникальной природой таких изображений, которые были указаны в предыдущих исследованиях, таких как [95]. Различия в размерах и перспективах объектов, а также ограниченные вычислительные ресурсы, доступные для операций на основе БПК, могут способствовать нехватке исследований в этой области. Кроме того, относительно меньший размер наборов данных на основе БПЛА может создавать проблемы для нескольких выстрелов, которые часто требуют достаточно большого набора данных для изучения значимых представлений признаков. Тем не менее, с увеличением доступности данных на основе БПК, могут быть возможности для разработки новых методов классификации нескольких выстрелов, которые могут эффективно использовать такие данные.
• Кроме того, в то время как в контексте контролируемой классификации широко изучалось несколько выстрелов, существует также потенциал для изучения его применения в других задачах дистанционного зондирования, таких как неконтролируемое или полуотделенное обучение, обнаружение объектов и семантическую сегментацию. Несколько выстрелов может обеспечить эффективные средства использования ограниченных меченных данных в этих задачах, что потенциально может привести к более точным и эффективным алгоритмам для приложений дистанционного зондирования. В целом, хотя был достигнут значительный прогресс при применении нескольких выстрелов для удаленных данных, в результате пробелов в исследованиях и возможностях для дальнейших исследований есть много пробелов в исследованиях. Исследование новых подходов к нескольким выстрелам, а также расширение существующих методов на новые приложения и области может привести к более точным и эффективным алгоритмам для задач дистанционного зондирования.
• Использование методологий XAI в сочетании с несколькими выстрелами моделей обучения для приложений дистанционного зондирования может значительно повысить интерпретацию таких моделей, тем самым увеличивая их применимость в доменах, которые чувствительны к потенциальным рискам. Однако, несмотря на значительное обещание, которое дает XAI для нескольких выстрелов в дистанционном зондировании, нынешний объем исследований в этой области остается относительно зарождающимся, и дальнейшие усилия необходимы для полного реализации его потенциальных преимуществ.
8.1 Вычислительные соображения в нескольких выстрелах обучения
Несколько выстрелов, как ниша в более широком домене машинного обучения, требует уникальных вычислительных требований. Эти требования становятся особенно актуальными, когда приложения имеют ограничения в реальном времени. Одним из наиболее важных приложений в реальном времени лежит мониторинг стихийных бедствий с использованием БПЛА. Непосредственность обратной связи в таких сценариях может резко повлиять на результаты, подчеркивая значение времени обработки.
Глубокое обучение, которое формирует основу для многих методов обучения, по своей природе требует высоких вычислительных ресурсов. Методы, такие как
CNN печально известны своей вычислительной интенсивностью как на этапах обучения, так и на этапах вывода. Эта вычислительная стоимость иногда может быть узким местом, особенно когда быстрые ответы необходимы. Тем не менее, развивающийся ландшафт обучения с несколькими выстрелами показал появление стратегий, направленных на смягчение этих вычислительных проблем:
• Мета-обучение, иллюстрируемое такими подходами, как MAML [125], предлагает инновационное решение. Оптимизируя параметры модели, чтобы обеспечить быструю адаптацию к новым задачам, эти методы значительно снижают вычислительные накладные расходы. Это гарантирует, что модели могут быть эффективно настроены, даже когда они сталкиваются с новыми наборами данных.
• Предложение Wang et al. [70] о использовании легких модельных архитектур в сочетании с методами дистилляции знаний становится еще одной жизнеспособной стратегией. Минимизируя избыточность и ненужные параметры, эти модели оптимизированы, чтобы они были более эффективными в вычислительном отношении, без ущерба для их прогнозирующей мощности.
• Методологии, основанные на графиках, такие как график [50], и дальнейшие расширения в подходы на основе GNN [80], предоставляют альтернативы традиционным CNN. Эти методы в определенных контекстах набора данных продемонстрировали сниженную вычислительную сложность, что делает их привлекательными вариантами.
Несмотря на эти достижения, примечательно, что значительная часть методологий обучения с несколькими выстрелами не была явно адаптирована для оптимизации времени обработки. Признавая этот пробел, будущие исследования могут погрузиться в создание архитектур, специально предназначенных для применений БПЛА в реальном времени. Несколько возможностей можно было бы использовать для повышения эффективности вычислительной техники. Они включают в себя использование методов сжатия модели, таких как обрезка и квантование [126], использование эффективных методов поиска нейронной архитектуры [127] и изучение стратегий совместного обеспечения оборудования [128] для моделей тонкой настройки для конкретных вычислительных платформ. Во всех этих усилиях всеобъемлющая цель остается последовательной: достижение быстрого времени вывода без жертвоприношения точности модели.
Авторы:
(1) Гао Ю Ли, Школа электротехники и электронных инженеров, Нанянг Технологический университет, 50 Нанянг -авеню, 639798, Сингапур (Gaoyu001@e.ntu.edu.sg);
(2) Плотина Танмой, Школа машиностроения и аэрокосмической инженерии, Технологический университет Наняна, 65 Нанянг Драйв, 637460, Сингапур и Департамент компьютерных наук, Университет Нью -Орлеана, Новый Орлеан, 2000 Лейкшор Драйв, LA 70148, США (США (США.tanmoy.dam@ntu.edu.sg);
(3) MD Meftahul Ferdaus, Школа электротехники и электронного инженера, Нанянг Технологический университет, 50 Nanyang Ave, 639798, Сингапур (mferdaus@uno.edu);
(4) Даниэль Пуйу Понар, Школа электротехники и электронных инженеров, Технологический университет Наняна, пр. Наняна, 639798, Сингапур (Epdpuiu@ntu.edu.sg);
(5) Vu N. Duong, Школа машиностроения и аэрокосмической инженерии, Nanyang Technological University, 65 Nanyang Drive, 637460, Сингапур (vu.duong@ntu.edu.sg)
Эта статья есть
Оригинал