2010-01-30 3 views
5

큰 데이터베이스에서 비슷한 이미지 나 텍스트를 빠르게 쿼리 할 때 어휘집에 대해 많이 읽습니다. 그러나 그러한 어휘의 나무가 무엇인지, 그리고 기능 중 하나를 만드는 방법에 대한 좋은 (이해하기 쉬운) 설명을 찾을 수 없었습니다.어휘 트리 란 무엇이며 어떻게 구성합니까?

답변

1

어휘 트리는 이미지 검색을 수행하는 간결한 방법입니다. 이 알고리즘을 구현하는 기본적으로 3 가지 단계가 있으며, 이는 다른 컴퓨터 시각 기술에 크게 의존한다. SIFT 기능.

첫 번째 단계는 시프트 디스크립터를 사용하여 kmeans 트리를 만드는 것입니다. 이 트리의 리프 노드에는 설명 표식의 "봉지"가 있습니다. 두 번째 단계는 첫 번째 단계에서 작성한 어휘 트리를 사용하여 이미지 데이터베이스를 작성하는 것입니다. 이 프로세스를 이미지를 벡터 공간으로 양자화하는 것으로 볼 수 있습니다. 그런 다음 세 번째 단계는 이미지 데이터베이스에 대해 이미지를 쿼리하는 것입니다. 물론 역역리스트와 같은 몇 가지 상세한 기술이 있습니다.

다음은 어휘집 - libvot의 좋은 구현 예입니다. 기본적으로 위에서 설명한 세 단계를 따릅니다. C++ 11 표준 다중 스레드 라이브러리를 사용하여 빌드 프로세스를 가속화하므로 매우 빠르게 실행됩니다.

여기에 대한 원래 연구 paper입니다. 그것은 컴퓨터 비전 커뮤니티에 큰 영향을 미쳤습니다.

1

Showing BOF representation

어휘 트리 클러스터로 시각적 인 단어를 클러스터링에 의해 이루어집니다 무언가이다. 이를 위해 나무 구조가 적용되어 어휘집이됩니다. 다음 다이어그램은 모든 것을 명확하게 해줍니다.

도 확인하십시오. this: