Post

StageInteractor: Query-based Object Detector with Cross-stage Interaction

StageInteractor: Query-based Object Detector with Cross-stage Interaction

ICCV 2023, 2024-01-23 기준 2회 인용

Task

  • Object Detection
  • DETR

Contribution

  • 기존 DETR의 one-to-one matching 방법들은 모델에게 strong fine-grained discrimination 을 요구하게 된다
  • Cross-stage interaction 구조를 제안
  • Reuse dynamic operators with lightweights adapters (Adamixer)

alt

본 논문에서 제안하고 있는 방법을 적용했을 경우 성능이 향상된다

Motivation

alt

This strict bipartite matching would ask the detector to capture details to distinguish the predictions

Figure 2(a) 에서 Stage1 의 white box는 GT와 할당되어 Positive로 정확하게 예측
하지만 red box 는 GT와 많이 겹침에도 불구하고 GT와 할당되지 않아 negative로 예측
Stage 6 에서는 반대가 되는 문제도 보여준다

본 논문에서 제안하고자 하는 것은 이런 문제를 해결하여 두 query에 대한 결과가 모두 정확하게 하는 것

Proposed Method

alt

Cross-stage Label Assignment

alt

stage $i$ 에서 다른 stage $j$ 결과를 활용
논문에서는 $i-1$ 부터 $L$ stage 까지를 사용

다른 stage $j$ 에서 GT와 매칭된 query index를 활용
query index에 대한 stage $i$ 에서의 Query의 prediction 결과와 GT와의 IoU 값이 threshold 를 넘을 경우 진행
해당 GT 를 Candidate Bags에 넣어준다
그리고 one-hot vectors 로 stage $i$ classification logits 와 BCE Loss
이를 통해서 Figure 2와 같은 문제를 해결하려고 한다

Cross-stage Dynamic Filter Reuse

alt

해당 제안 방법은 AdaMixer에 대한 개선 방법

alt

AdaMixer 정리해둔 내용 캡처

Adpative channel mixing 을 위해서 content query 를 활용하여 weights를 생성

$i$ stage 에서 $d$ 번째 content vector 에 대한 weights
$W^{(i)}_d \in \mathbb{R}^{D_C \times D_C}$

이 과정에서 파라미터가 $D \times {D_C}^2$ 만큼 필요하다

필요한 파라미터를 줄이기 위해서 Filter Bank 에 값들을 저장하면서 재사용하는 방법을 제안

alt

Filter Adaptor $W^{(1)}_j$, $W^{(2)}_j$

$M_j$ - 전 stage 에서 저장된 값

필요한 파라미터 수 - $2{D_C}^2$

Experimental Results

기본적으로 AdaMixer 방법에 제안하는 방법을 적용

alt

제안하는 방법을 AdaMixer에 적용했을 때 성능이 제일 좋다

alt

다른 방법들과 비교했을때도 성능이 좋다

alt

Cross-Stage Label Assignment (CSLA) 방법이 성능 향상에 더 크게 기여한다

This post is licensed under CC BY 4.0 by the author.