Верхние наборы данных дистанционного зондирования для обучения и оценки моделей ИИ

Верхние наборы данных дистанционного зондирования для обучения и оценки моделей ИИ

10 июня 2025 г.
  1. Аннотация и введение
  2. Фон
  3. Тип данных датчика дистанционного зондирования
  4. Clarkmark Demote Sensing Dataets для оценки моделей обучения
  5. Метрики оценки для нескольких ударов дистанционного зондирования
  6. Недавние методы обучения в дистанционном зондировании
  7. Обнаружение и сегментация объекта на основе нескольких выстрелов в дистанционном зондировании
  8. Обсуждения
  9. Численные эксперименты нескольких выстрелов в наборе данных на основе БПЛА
  10. Объяснимый ИИ (XAI) в дистанционном зондировании
  11. Выводы и будущие направления
  12. Благодарности, декларации и ссылки

4 базовые наборы данных удаленного зондирования для оценки моделей обучения

В этом разделе мы предоставим краткий обзор часто используемых наборов данных контрольных данных, которые оценивают алгоритмы в дистанционном зондировании. Наборы данных классифицируются и перечислены на основе типа данных дистанционного зондирования и платформ, из которых они были собраны. Важно отметить, что эти наборы данных часто используются исследователями для оценки и оценки своих алгоритмов, и, хотя они не включены в работы по опросам [8], они необходимы для этого обзора.

4.1 Набор данных гиперспектрального изображения

4.1.1 Спутниковые данные

Большинство наборов данных, описанных здесь, более адаптированы для класса многопользовательской классификации изображений, хотя существует несколько наборов данных на основе единых меток.

Павия[20, 21]: Исследовательская группа Университета Павия создала набор данных гиперспектрального изображения с изображениями, состоящими из 610 × 610 пикселей и 103 спектральных полос. Каждое изображение в наборе данных представляет собой классификационную карту с 9 классами, которые включают в основном городские контексты, такие как битум, кирпич и асфальт. Набор данных содержит 42 776 помеченных изображений и специально разработан для классификации с несколькими маршрутами.

ИндийскийСосны[20, 22]: набор данных содержит гиперспектральные изображения конкретного ландшафта в Индиане. Это набор данных классификации с несколькими маркировкой, где каждая карта состоит из 145 × 145 пикселей и 224 спектральных полос. Для каждой карты доступны 16 семантических метке, а набор данных имеет в общей сложности 10 249 образцов.

СалинасДолина[20]: Набор данных долины Салинас состоит из гиперспектральных изображений, собранных из Калифорнии, с многопользовательскими картами классификации пикселей размером 512 × 217 и 224 спектральных полос, аналогичных набору данных индийских Pines. Есть 16 семантических классов с 54 129 образцами. Подмножество набора данных Salinas, называемая Salinas-A, включает в себя только 86 × 86 пикселей изображения из 6 классов, в общей сложности 5 348 образцов.

Хьюстон[18]: Группа анализа гиперспектральных изображений в сотрудничестве с Центром по борьбе с воздушным лазерным картированием, финансируемым NSF (NCALM), приобрела изображения в Университете Хьюстона. Этот набор данных включает в себя 16 семантических классов городских объектов, таких как автомагистрали, железные дороги и теннисные корты, в отличие от наборов данных Ботсваны, индийских сосен и Салинас -Вэлли. Изображения имеют 144 спектральные полосы в области от 380 нм до 1050 нм, и каждое изображение имеет размер пикселя 349 × 1905. Набор данных предназначен для оценки классификации многоучанозой.

BIGEARTHNET[23]: набор данных состоит из пар с кандидатом-2, снятыми многоспектральным датчиком, с 590326 пар, собранные из 10 европейских стран. Каждое изображение в паре имеет размер 120 × 120 пикселей и покрывает 13 спектральных полос. Набор данных аннотирован с несколькими классами или метками на земле, что делает его подходящим для оценки классификации с несколькими маршрутами.

Евросат[24]: набор данных состоит из изображений, полученных со спутника Sentinel2, охватывающих 13 спектральных полос с 10 классами и 27 000 маркированных образцов. Он используется для оценки классификации наземного покрова и землепользования на основе одной марки. Каждое изображение имеет размер пикселя 64 × 64.

SEN12MS[25]: набор данных содержит 180 662 изображений, снятых из Sentinel-1 и Sentinel-2, с четырьмя типами покрытия, классифицированными с использованием различных схем классификации. Каждое изображение имеет размер 256 × 256 и содержит разные спектральные полосы. Изображения аннотируются с несколькими мечениями на земле, но основная цель состоит в том, чтобы использовать эти этикетки, чтобы сделать вывод общего контекста сцены, такого как лес, луга или саванна, что делает его подходящим для классификации сцены на основе одной этикетки. Важно отметить, что изображения Sentinel1 являются изображениями SAR, что делает набор данных полезным для классификации карт на основе SAR.

4.1.2 Набор данных на основе беспилотника

• Whu-Hi[26]: набор данных WHU-HI, который означает гиперспектральный изображение Wuhan, передаваемое БПК, состоит из изображений различных типов урожая, собранных в районах сельского хозяйства в провинции Хубэй, Китай. Он делится на три субдоса: whu-hi-longkou, whu-hi-hanchuan и whu-hihonghu, каждый из которых с разными размерами изображений, числами меток/-классов и спектральных полос, которые объясняются в таблице 2. Набор данных подходит для оценки альгоритмов класса многоветрой.

4.2 Набор данных на основе изображений VHR

4.2.1 Спутниковые наборы данных

UC Merced Landuse[27]: набор данных был разработан для одновязок-классификации землепользования и включает 2100 изображений RGB, каждый из которых размером 256 × 256 пикселей. Набор данных состоит из 21 класса, в основном связанных с городским землепользованием.

ISPRSПотсдам[28]: Международное общество фотограмметрии и дистанционного зондирования (ISPRS) разработало набор данных для алгоритмической оценки классификации многопользовательских карт. Набор данных состоит из 38 патчей/изображений. Размер пикселя каждого патча составляет 6000 × 6000.

ISPRSВайшин[28]: набор данных был создан для классификации карт с несколькими маршрутами и включает 33 патча/изображения различных размеров. Размер пикселя каждого патча составляет 2494 × 2064.

RESISC45[29]: Северо-западный политехнический университет (NWPU) создал набор данных для одновязок-сцены. Набор данных содержит 31 500 изображений, классифицированных на 45 классов, причем каждый класс состоял из 700 изображений. Размер пикселя каждого изображения составляет 256 × 256.

• WHU-RS19[30]: набор данных создается с использованием спутниковых изображений, полученных из Google Earth и содержит 19 семантических классов, с приблизительно 50 образцами на класс. Образцы из того же класса извлекаются из разных областей с различными разрешениями, масштабами, ориентациями и освещением. Каждое изображение в наборе данных составляет 600 x 600 пикселей размер. Он предназначен для целей классификации сцены на основе одной метки.

ПОМОГАТЬ[31]: база данных воздушного изображения (AID) представляет собой коллекцию из 10 000 спутниковых изображений, собранных из Google Earth, в каждом размере 600 × 600 пикселей. Набор данных включает в себя 30 классов, в основном связанных с городской средой. Как и в случае с наборами данных RESISC45 и WHU-RS19, помощь используется для целей классификации сцены с одной маркой.

4.2.2 Набор данных на основе беспилотника

Прохождение[12]: База данных воздушного изображения для экстренного реагирования (Aider) представляет собой коллекцию из 8540 изображений беспилотников, классифицированных на четырех категориях стихийных бедствий - разрушенные здания, пожарные, наводнения и дорожные аварию, а также категорию нендишастеров, помеченные как «нормальные» [32]. Это один из первых наборов данных на основе БПК, который можно использовать в качестве эталона для визуальной гуманитарной помощи или поисковых и спасений в спектре RGB.

Сама-Втол[33]: Набор данных Aerial Image Sama-VTOL-это новый набор данных, разработанный из изображений, снятых БПЛА. Этот набор данных был создан для поддержки широкого спектра научных проектов в области дистанционного зондирования. Это особенно полезно для исследовательских проектов, ориентированных на моделирование 3D -объекта, городское и сельское картирование, а также на обработку цифровых моделей высоты и поверхности. Цель состоит в том, чтобы предоставить недорогие данные высокого разрешения, которые способствуют лучшему пониманию как городских, так и в сельских сценах для различных приложений.

4.3 SAR набор данных на основе изображений

MSTAR[34]: Этот набор данных состоит из 5950 спектральных изображений 5950 X-диапазона, каждый с размером 128 × 128 пикселей и классифицированные на 10 классов. Он разработан специально для распознавания и классификации военных объектов.

OpenSarship[35]: Набор данных включает в себя 11 346 чипов кораблей, снятых с изображениями SAR SAR-диапазона C, принадлежащих 17 типам кораблей, и собираемых на 41 изображение. Каждый чип помечен сообщениями автоматической идентификации, указывающими различные условия окружающей среды. Размеры изображения чипов варьируются от 30 × 30 до 120 × 120 пикселей.

Очевидно, что меньше наборов данных на основе SAR по сравнению с наборами данных изображений на основе гиперспектра или VHR. Согласно Fu et al. [36], сбор изображений на основе SAR с тонкой аннотацией является более сложным из-за сложности приобретения и утомительного и трудоемкого процесса интерпретации и маркировки таких изображений. Кроме того, Rostami et al. [37] заявили, что устройства, используемые для генерации изображений SAR, являются дорогостоящими, а доступность данных строго регулируется из -за ее классификации.

Table 1 Summary of some datasets commonly utilized for few-shot learning algorithmic evaluation in the domain of remote sensing.

В таблице 2 мы суммировали обсуждение доступных наборов данных, выделяя тип данных, количество изображений и классов, размеров пикселей, спектральных полос (если есть), платформу и метод классификации.

Авторы:

(1) Гао Ю Ли, Школа электротехники и электронных инженеров, Нанянг Технологический университет, 50 Нанянг -авеню, 639798, Сингапур (Gaoyu001@e.ntu.edu.sg);

(2) Плотина Танмой, Школа машиностроения и аэрокосмической инженерии, Технологический университет Наняна, 65 Нанянг Драйв, 637460, Сингапур и Департамент компьютерных наук, Университет Нью -Орлеана, Новый Орлеан, 2000 Лейкшор Драйв, LA 70148, США (США (США.tanmoy.dam@ntu.edu.sg);

(3) MD Meftahul Ferdaus, Школа электротехники и электронного инженера, Нанянг Технологический университет, 50 Nanyang Ave, 639798, Сингапур (mferdaus@uno.edu);

(4) Даниэль Пуйу Понар, Школа электротехники и электронных инженеров, Технологический университет Наняна, пр. Наняна, 639798, Сингапур (Epdpuiu@ntu.edu.sg);

(5) Vu N. Duong, Школа машиностроения и аэрокосмической инженерии, Nanyang Technological University, 65 Nanyang Drive, 637460, Сингапур (vu.duong@ntu.edu.sg)


Эта статья естьДоступно на ArxivПод CC By-NC-SA 4,0 лицензия.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE