Эмпирическая оценка модели IFRP-T2P с использованием набора данных Kitti360

Эмпирическая оценка модели IFRP-T2P с использованием набора данных Kitti360

16 июля 2025 г.

Аннотация и 1. Введение

  1. Связанная работа

  2. Метод

    3.1 Обзор нашего метода

    3.2 грубое извлечение текстовых клеток

    3.3 Оценка прекрасной позиции

    3.4 Цели обучения

  3. Эксперименты

    4.1 Описание набора данных и 4.2 Подробная информация

    4.3 Критерии оценки и 4.4 результаты

  4. Анализ производительности

    5.1 Исследование абляции

    5.2 Качественный анализ

    5.3 Анализ встраивания текста

  5. Заключение и ссылки

Дополнительный материал

  1. Подробная информация о наборе данных Kitti360
  2. Больше экспериментов по экстрактору запроса экземпляра
  3. Анализ космического пространства текстовых клеток
  4. Больше результатов визуализации
  5. Анализ устойчивости точек

Анонимные авторы

  1. Подробная информация о наборе данных Kitti360
  2. Больше экспериментов по экстрактору запроса экземпляра
  3. Анализ космического пространства текстовых клеток
  4. Больше результатов визуализации
  5. Point Cloud Robustness Analysis

4 эксперименты

4.1 Описание набора данных

Мы оцениваем нашу модель IFRP-T2P в наборе данных Kitti360 [21]. Этот набор данных охватывает сцены облака 3D-точек из девяти городских районов, охватывающих городское пространство 15,51 квадратных километров и состоят из 43 381 парных описаний и позиций. Мы используем пять областей для нашего обучения и одна для проверки. Оставшиеся три области используются для тестирования. Каждая трехмерная ячейка в этом наборе данных представлена кубиком, размером 30 метров с каждой стороны, с 10-метровой шагом между каждой ячейкой. Более подробная информация предоставляется в дополнительном материале.

4.2 Детали реализации

Наш подход начинается с предварительного обучения экстрактора запроса экземпляра. Это достигается с помощью объектива сегментации экземпляра, как указано в разделе 3.2. В нашем магистрали функции используется разреженная свертка U-Net, в частности, Minkowski Res16unet34c [10] с 0,15-метровым размером вокселя. Чтобы соответствовать требованиям конфигурации Kitti360, мы используем облака ячейки, каждый из которых охватывает 30 -метровое кубическое пространство в качестве нашего ввода. Обучение простирается более 300 эпох, используя оптимизатор Adamw. На грубой стадии мы тренируем модель поиска текстовых клеток с Adamw Optimizer с уровнем обучения 1E-3. Модель обучена в общей сложности 24 эпоха, а скорость обучения разрушается 10 в

Table 1: Performance comparison on the KITTI360Pose dataset. First three methods utilize ground-truth instances as input. Other methods take raw point cloud data directly.

Table 2: Performance comparison for coarse text-cell retrieval on the KITTI360Pose dataset.

Table 3: Performance comparison of the fine-stage models on the KITTI360Pose dataset. Normalized Euclidean distance is adopted as the metric. All methods directly take raw point cloud as input.

12-я эпоха. На прекрасном этапе мы обучаем регрессионную модель с Adam Optimizer с уровнем обучения 3E-4 для 12 эпох.

Авторы:

(1) Lichao Wang, FNII, Cuhksz (wanglichao1999@outlook.com);

(2) Zhihao Yuan, FNII и SSE, Cuhksz (zhihaoyuan@link.cuhk.edu.cn);

(3) Jinke Ren, FNII и SSE, Cuhksz (jinkeren@cuhk.edu.cn);

(4) Shuguang Cui, SSE и FNII, Cuhksz (shuguangcui@cuhk.edu.cn);

(5) Чжэнь Ли, автор -соответствующий автор из SSE и FNII, Cuhksz (lizhen@cuhk.edu.cn).


Эта статья естьДоступно на Arxivв соответствии с CC BY-NC-ND 4.0 DEED (Атрибуция-Нонкоммерка-Noderivs 4.0 International).


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE