Как 24 специальных запроса оптимизировали показатель отзыва нейронной сети

Как 24 специальных запроса оптимизировали показатель отзыва нейронной сети

17 июля 2025 г.

Аннотация и 1. Введение

  1. Связанная работа

  2. Метод

    3.1 Обзор нашего метода

    3.2 грубое извлечение текстовых клеток

    3.3 Оценка прекрасной позиции

    3.4 Цели обучения

  3. Эксперименты

    4.1 Описание набора данных и 4.2 Подробная информация

    4.3 Критерии оценки и 4.4 результаты

  4. Анализ производительности

    5.1 Исследование абляции

    5.2 Качественный анализ

    5.3 Анализ встраивания текста

  5. Заключение и ссылки

Дополнительный материал

  1. Подробная информация о наборе данных Kitti360
  2. Больше экспериментов по экстрактору запроса экземпляра
  3. Анализ космического пространства текстовых клеток
  4. More Visualization Results
  5. Анализ устойчивости точек

Анонимные авторы

  1. Подробная информация о наборе данных Kitti360
  2. Больше экспериментов по экстрактору запроса экземпляра
  3. Анализ космического пространства текстовых клеток
  4. Больше результатов визуализации
  5. Анализ устойчивости точек

1 Подробная информация о наборе данных Kitti360

Figure 1: Visualization of the KITTI360Pose dataset. The trajectories of five training sets, three test sets, and one validation set are shown in the dashed borders. One colored point cloud scene and three cells are shown in the middle.

Еще 2 эксперимента на экстракторе запроса экземпляра

Мы проводим дополнительный эксперимент, чтобы оценить влияние количества запросов на производительность нашего экстрактора запроса экземпляра. Как подробно описано в таблице 1, мы оцениваем частоту отзыва локализации с использованием 16, 24 и 32 запросов. Результат демонстрирует, что использование 24 запросов дает наивысшую частоту отзыва локализации, то есть 0,23/0,53/0,64 на наборе валидации и 0,22/0,47/0,58 в тестовом наборе. Этот вывод свидетельствует о том, что оптимальное количество запросов для максимизации эффективности нашей модели составляет 24.

Table 1: Ablation study of the query number on KITTI360Pose dataset.

3 Анализ космического пространства текстовых клеток

На рис. 2 показано выровненное пространство встраивания текстовых клеток через T-SNE [? ] Под сценарием без экземпляра мы сравниваем нашу модель с Text2Loc [? ] Использование предварительно обученной модели сегментации экземпляра, mask3d [? ], как предыдущий шаг. Можно наблюдать, что Text2loc приводит к менее дискриминационному пространству, где положительные клетки относительно далеки от функции текстового запроса. Напротив, наш IFRP-T2P эффективно снижает расстояние между положительными элементами клеток и функциями текстовых запросов в пространстве встраивания, тем самым создавая более информативное пространство встраивания. Это улучшение в пространстве встраивания имеет решающее значение для повышения точности поиска текстовых клеток.

Figure 2: T-SNE visualization for the text features and cell features in the coarse stage.

Авторы:

(1) Lichao Wang, FNII, Cuhksz (wanglichao1999@outlook.com);

(2) Zhihao Yuan, FNII и SSE, Cuhksz (zhihaoyuan@link.cuhk.edu.cn);

(3) Jinke Ren, FNII и SSE, Cuhksz (jinkeren@cuhk.edu.cn);

(4) Shuguang Cui, SSE и FNII, Cuhksz (shuguangcui@cuhk.edu.cn);

(5) Чжэнь Ли, автор -соответствующий автор из SSE и FNII, Cuhksz (lizhen@cuhk.edu.cn).


Эта статья естьДоступно на Arxivв соответствии с CC BY-NC-ND 4.0 DEED (Атрибуция-Нонкоммерка-Noderivs 4.0 International).


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE