1

나는 시각적 단어의 가방을 분류에 사용하고 있습니다. 각 이미지에 대해 SIFT 설명자를 100 단어로 양자화하고 이미지의 히스토그램을 인코딩하고 분류를 완료했습니다.시각적 단어의 가방에 감지기 결합

이제 두 개의 서로 다른 설명자와 감지기, 즉 SIFT와 SURF를 결합하려고합니다. 즉, 키 포인트 수가 같지 않거나 디스크립터 차원 (SIFT 128D 및 SURF 64D)이 아님을 의미합니다.

그들을 결합하는 가장 쉬운 방법은 무엇입니까?

각 이미지에 대해 SIFT (100x1 히스토그램) 및 SURF (또 다른 100x1)에 대해 하나의 히스토그램을 인코딩 한 다음 함께 스택하여 200x1 막대 그래프를 만들면 정확할까요?

다른 방법이 있습니까?

미리 감사드립니다.

답변

0

단어 모음에서 키 포인트의 수나 설명자 크기는 중요하지 않습니다. 코드 북을 생성하면 크기가 코드북 크기에 따라 달라지는 막대 그래프가 나타납니다. 다시 히스토그램은 정규화되었으므로 이미지 당 감지 된 피쳐의 수에 의존하지 않습니다. SIFT 및 SURF 기능이 있다고 가정하면 2 개의 코드북을 생성하고 연결하여 피쳐 벡터를 얻는 것뿐입니다.

방법에 대한 간략한 개요는 여기에 언급되어 http://en.wikipedia.org/wiki/Bag-of-words_model_in_computer_vision

+0

감사합니다. 나는 SIFT와 SURF의 원래 성능이 비교 될 수 있도록 조합으로 시도해 왔지만 개선 된 결과 만 얻습니다. – Wajahat