우리는 SOLR 4.3.1을 실행 중이며 SOLR이 특정 문서의 점수를 얻는 방법을 제어하는 것에 대한 질문이 있습니다.SOLR (4.3) - "poor"품질 (매우 짧은) 문서의 줄이기
경우에 따라 "품질이 좋지 않은"색인 된 문서가 있습니다.이 경우 설명 필드에는 3 ~ 4 단어 만있을 수 있습니다. 다른 문서는 훨씬 더 나은 설명을 가질 수 있습니다. 이 문제는 검색이 수행 될 때 발생하며 검색된 용어가 "양호한"(더 긴) 문서와 "부족한"(더 짧은) 문서에서 발견됩니다.
SOLR은 검색된 용어가 단지 3 또는 4 단어 중 하나 일 수 있으므로 더 짧은 짧은 문서의 일치 항목에 점수를 매기는 것처럼 보이므로 더 긴 설명이있는 문서보다 높은 비율을 나타냅니다. 1 단어 또는 2 단어 만 100 단어로 검색됩니다 (예 :).
정말 짧은 문서의 점수를 어떻게 든 부과하거나 줄일 수 있습니까? 나는 매우 짧은 문서가 괜찮을 수도 있지만, 일반적으로 우리의 경우에는 매우 짧은 문서가 일반적으로 "품질이 나쁘다"는 것을 알고 있습니다.
제안 사항?
edismax 검색을 사용하고 있습니다.
감사합니다,
빌
감사합니다. 피터! 나는 이것을 실험 할 것이다. 귀하의 철저한 답변을 부탁드립니다! – user3302110