2016-06-07 3 views
0

나는 그 필드를 줄이기 위해 SnowballPorterFilterFactory를 사용한 시나리오가 있습니다. 이 형태소가형태소 분석에 기초한 Solr 검색

Actor in mumbai 

Actors in mumbai 

모두를 사용하여 검색 나에게 도움이 배우, 댄서, 가수, 모델 등

:

는 이제 전 같은 모든 재능의 종류를 저장 .

는 지금은 가수 노래

show all who sings in mumbai 

가 어떻게 일치시킬 수와 검색 할 ?? 그것은 지금은 일치하지 않습니다

..

답변

0

사용 SOLR 관리 인터페이스의 "분석"페이지가 singer 수행되는 스테 밍 것을 볼 수 있습니다. 이를 통해 두 용어에 대한 각 단계를 볼 수 있으며 singsinger에 대한 최종 결과는 무엇입니까?

차이점은 노래가 동사 인 반면 가수는 주제이고 실제로는 동일한 단어가 아니기 때문에 동일한 단어를 버리면 나쁜 결과를 초래할 수 있다는 사실에 기인합니다. 이 경우 동의어 목록을 사용하면 더 나은 결과를 얻을 수 있습니다. singer의 정확한 형태소 분석은 아마도 singer (가수, 가수) 일 것입니다.

+0

의견을 보내 주셔서 감사합니다. 이 필터는 2 개의 필터 팩터 리를 사용하여 자체 필드 유형 ** text_stemming **을 작성하여이 문제를 해결했습니다. ** solr.SnowballPorterFilterFactory ** 및 ** solr.EdgeNGramFilterFactory **. 이제 스노우 볼은 ** 가수 ** ** ** 가수 **와 같은 형태소 분석에 사용되며 EdgeNGramFilterFactory는 부분 검색에 도움이됩니다. 감사 –