2016-09-01 7 views
0

SOLR에서 KStem 필터 팩토리 (KStemFF)를 사용하고 있습니다. KStemFF가 100 % 정확하지 않다는 것을 깨달았습니다.SOLR KStemFilterFactory가 "카드"라는 단어를 "카드"로 줄이지 않는 이유는 무엇입니까?

예를 들어, "카드"라는 단어를 "카드"로 줄이지는 않습니다.

"사운드 카드"와 "사운드 카드"가 다른 결과를 반환합니다.

KStemFF를 사용하여이 기능을 사용할 수 있습니까? 나는 porter-stemmer와 같은 다른 형태자를 사용하는 것이이 경우에 도움이 될 수 있다는 것을 깨달았지만 프로젝트에서 여러 줄기를 사용하고 싶지는 않습니다.

+0

KStemFilter를 사용중인 필드의 정의는 무엇입니까? – MatsLindh

+0

@MatsLindh 간단한 text_en을 사용하고 있습니다. 내 필드 유형은 : 내 필터 클래스이다 <필터 클래스 = " sol.KStemFilterFactory "/> –

답변

0

KStem은 단어 형태소 분석에서 PorterStem보다 덜 공격적이므로 특정 복수형을 규칙에 따라 변환하지 않아도됩니다. 선택하기 전에 성능과 결과에 따라 몇 줄기를 비교할 수 있습니다. 한 줄기는 100 % 정확도와 원하는 결과를 제공 할 수 없으며 결과에 따라 가장 적합해야합니다.

+1

고맙습니다. 나는 SOLR에서 "EngMinStem"을 사용하여 끝냈다. 이것은 다른 것들보다 좋아 보인다. 원래의 질문에, 당신은 똑같은 100 % 정확하지 않습니다. –