Lucene을 사용하여 상점 검색 API를 연구 중입니다.Lucene 검색 결과 그룹화 및 카테고리 별 빈도 계산
나는 예를 들어 .... 괄호 안의 주파수와 각시, 주 조합에 대한 매장 검색 결과를 표시해야합니다 :
지금 현재로Los Angles,CA (450)
Atlanta,GA (212)
Boston, MA (78)
.
.
.
내 검색 결과에서, 7000 개 루씬 문서 주위에 반환 사용자가 "모든 상점보기"라고 말하면 평균입니다. 이 사용 사례에서는 위의 그림과 같이 약 800 개의 고유 한 도시 레코드를 보여줍니다.
나는 HitCollector
클래스의 Collect
메서드를 재정의하고 다음과 같이 벡터를 검색하고 있습니다 :
var vectors = _reader.GetTermFreqVectors(doc);
가 그럼 난이 컬렉션을 통해 반복하고 각각의 고유 한 도시, 주 조합에 대해 주파수를 계산합니다.
그러나 이것은 매우 성능이 매우 느립니다. Lucene에서 검색 결과를 그룹화하고 빈도를 계산하는 더 좋은 방법이 있습니까? 코드 조각은 .... 내가 어떤 다른 기술/팁을 사용하여 내 루씬 검색 코드를 최적화 할 수 있는지 제안 해주십시오,
또한 읽기
덕분에 매우 도움이 될 것입니다!
난 당신이 현재 루씬이 OOTB을 할 수 있다고 생각하지 않습니다
답변 해 주실 수 있습니까? http://stackoverflow.com/questions/899542/problem-using-same-instance-of-indexsearcher-for-multiple-requests –