tech-stories human-robot-interaction vision-language-models cross-modal-ai 3d-point-cloud-navigation spatial-language-grounding instance-free-localization ai-in-robotics

Эмпирическая оценка модели IFRP-T2P с использованием набора данных Kitti360

16 июля 2025 г.

Таблица ссылок

Аннотация и 1. Введение

Связанная работа
Метод
3.1 Обзор нашего метода
3.2 грубое извлечение текстовых клеток
3.3 Оценка прекрасной позиции
3.4 Цели обучения
Эксперименты
4.1 Описание набора данных и 4.2 Подробная информация
4.3 Критерии оценки и 4.4 результаты
Анализ производительности
5.1 Исследование абляции
5.2 Качественный анализ
5.3 Анализ встраивания текста
Заключение и ссылки

Дополнительный материал

Подробная информация о наборе данных Kitti360
Больше экспериментов по экстрактору запроса экземпляра
Анализ космического пространства текстовых клеток
Больше результатов визуализации
Анализ устойчивости точек

Анонимные авторы

Подробная информация о наборе данных Kitti360
Больше экспериментов по экстрактору запроса экземпляра
Анализ космического пространства текстовых клеток
Больше результатов визуализации
Point Cloud Robustness Analysis

4 эксперименты

4.1 Описание набора данных

Мы оцениваем нашу модель IFRP-T2P в наборе данных Kitti360 [21]. Этот набор данных охватывает сцены облака 3D-точек из девяти городских районов, охватывающих городское пространство 15,51 квадратных километров и состоят из 43 381 парных описаний и позиций. Мы используем пять областей для нашего обучения и одна для проверки. Оставшиеся три области используются для тестирования. Каждая трехмерная ячейка в этом наборе данных представлена кубиком, размером 30 метров с каждой стороны, с 10-метровой шагом между каждой ячейкой. Более подробная информация предоставляется в дополнительном материале.

4.2 Детали реализации

Наш подход начинается с предварительного обучения экстрактора запроса экземпляра. Это достигается с помощью объектива сегментации экземпляра, как указано в разделе 3.2. В нашем магистрали функции используется разреженная свертка U-Net, в частности, Minkowski Res16unet34c [10] с 0,15-метровым размером вокселя. Чтобы соответствовать требованиям конфигурации Kitti360, мы используем облака ячейки, каждый из которых охватывает 30 -метровое кубическое пространство в качестве нашего ввода. Обучение простирается более 300 эпох, используя оптимизатор Adamw. На грубой стадии мы тренируем модель поиска текстовых клеток с Adamw Optimizer с уровнем обучения 1E-3. Модель обучена в общей сложности 24 эпоха, а скорость обучения разрушается 10 в

Table 1: Performance comparison on the KITTI360Pose dataset. First three methods utilize ground-truth instances as input. Other methods take raw point cloud data directly.

Table 2: Performance comparison for coarse text-cell retrieval on the KITTI360Pose dataset.

Table 3: Performance comparison of the fine-stage models on the KITTI360Pose dataset. Normalized Euclidean distance is adopted as the metric. All methods directly take raw point cloud as input.

12-я эпоха. На прекрасном этапе мы обучаем регрессионную модель с Adam Optimizer с уровнем обучения 3E-4 для 12 эпох.

Авторы:

(1) Lichao Wang, FNII, Cuhksz (wanglichao1999@outlook.com);

(2) Zhihao Yuan, FNII и SSE, Cuhksz (zhihaoyuan@link.cuhk.edu.cn);

(3) Jinke Ren, FNII и SSE, Cuhksz (jinkeren@cuhk.edu.cn);

(4) Shuguang Cui, SSE и FNII, Cuhksz (shuguangcui@cuhk.edu.cn);

(5) Чжэнь Ли, автор -соответствующий автор из SSE и FNII, Cuhksz (lizhen@cuhk.edu.cn).

Эта статья естьДоступно на Arxivв соответствии с CC BY-NC-ND 4.0 DEED (Атрибуция-Нонкоммерка-Noderivs 4.0 International).

Оригинал

Эмпирическая оценка модели IFRP-T2P с использованием набора данных Kitti360

Таблица ссылок

4 эксперименты

4.1 Описание набора данных

4.2 Детали реализации

Recent Post

Качественный и количественный анализ относительных трансформаторов, усиленных положением

Эмпирический анализ уязвимых умных контрактов Ethereum и их финансового воздействия

Оценка T5, Roberta и Clip в задачах выравнивания облака текста-точка

В разреженных облаках и неоднозначных текстах эта модель ИИ все еще находит свой путь

Как 24 специальных запроса оптимизировали показатель отзыва нейронной сети

Categories