2012-01-25 3 views
3

Whoosh를 사용하여 문서의 유사성 척도를 얻으려면 어떻게해야합니까?Whoosh Python을 사용한 문서 비교/유사성 검색 라이브러리

문서와 유사성이 높은 이전에 인덱싱 된 다른 문서의 순위를 지정하는 "관련"기능을 만들고 싶습니다.

문서를 긴 쿼리 문자열로 입력합니까? 문서를 색인에 추가하고 거기에서 어떻게 든 유사성 쿼리 결과를 추출합니까?

감사

답변

1

붕 수색자 클래스는 'more_like()'라는 메소드가 있습니다.

이 도구를 사용하면 문서를 다른 인덱싱 된 문서와 비교하고 인덱싱 할 수 있으며 지정된 문서와 비슷한 문서 목록을 반환 할 수 있습니다.

그리고 class whoosh.searching.Hit은 순위와 점수를 부여 할 수 있습니다.