2017-10-06 26 views
0

다음 설정을 사용하여 ES 색인을 만들었습니다. 원래 문자열을 대체하는 탄성 검색에서 줄무늬 표시

"settings": { 
    "analysis" : { 
     "analyzer" : { 
      "my_analyzer" : { 
       "tokenizer" : "standard", 
       "filter" : ["standard", "lowercase", "my_stemmer"] 
      } 
     }, 
     "filter" : { 
      "my_stemmer" : { 
       "type" : "stemmer", 
       "name" : "english" 
      } 
     } 
    } 
} 

은 내가 형태소 분석기를 분석하면서 것은 막아야 단어로 원래 문자열을 대체하는 것으로 나타났습니다. 원래 문자열과 두 줄기를 모두 색인하는 방법이 있습니까?

당신은 "preserve_original"예를 들어, 발견 할 것이다 :

답변

1

귀하의 질문은 stemmer token filter에 대해 "preserve_original"매개 변수에 관한 것입니다 Word Delimiter Token Filter에 대한 것이지만 줄기 토큰 필터에는 해당되지 않습니다.

원본 단어가 필요한 경우 집계를 위해 copy 필드를 적합한 분석기로 다른 필드로 연결할 수 있습니다.

색인의 동일한 위치에 원본이 필요한 경우 줄기를 감싸고 자신의 분석기를 plugin으로 작성해야합니다.