2017-05-15 3 views
2

lucene있는 경우 "blom"필드가있는 문서가 바이트 배열입니다 [0 1 0 1 1 1 1]이 문서에 대한 쿼리를 수행하는 방법이 있습니다 andquery (값 : [1 1 1 1 1 1 1], 일치 : [1 1 1 1 1 1 1 1])와 같은 비트 연산이나 orquery, notquery 등의 필드를 사용합니다.Lucene.Net 비트 필터 블룸 필터

대용량의 해시 (블룸 필터)를 효율적으로 인코딩하고 쿼리하는 것이 기본 목표입니다. 쿼리에서 일치해야 할 100 + bool 필드를 만드는 것을 피하려고합니다.

답변

0

필터 [0 1 0 1 1 1 1]을 (를) 문자열 '0101111'로 인코딩하고 wildcard queries을 사용하여 '0? 0 ??? 1'의 여러 해시를 검색 할 수 있습니다. 또한, 당신의 유스 케이스에서 유용하다고 생각합니다 fuzzy searching, Levenshtein 거리를 기반으로 문자열의 다른 요소의 번호를 고려합니다.