2017-01-14 4 views
0

모든 인덱스에서 액세스 할 수있는 방식으로 사용자 지정 스톱 워드 목록을 전역으로 정의하는 방법은 무엇입니까?Elasticsearch의 사용자 정의 미리 정의 된 스톱 워드 목록

단지 우리가 미리 정의 된 언어 별 중지 단어 목록을 사용하는 방식처럼이 스톱 워드리스트를 사용하는 것이 이상적 일 것이다 :

PUT /my_index 
{ 
    "settings": { 
     "analysis": { 
      "filter": { 
       "my_stop": { 
        "type":  "stop", 
        "stopwords": "_my_predefined_stopword_list_" 
       } 
      } 
     } 
    } 
} 

답변

1

공식 elastcisearch 문서는 중지 단어의 목록이 포함 된 사용자 정의 필터를 만드는 방법에 대해 설명합니다. 여기에 대한 설명을 찾을 수 있습니다

https://www.elastic.co/guide/en/elasticsearch/guide/current/using-stopwords.html

PUT /my_index 
{ 
    "settings": { 
    "analysis": { 
     "filter": { 
     "spanish_stop": { 
      "type":  "stop", 
      "stopwords": [ "si", "esta", "el", "la" ] 
     }, 
     "light_spanish": { 
      "type":  "stemmer", 
      "language": "light_spanish" 
     } 
     }, 
     "analyzer": { 
     "my_spanish": { 
      "tokenizer": "spanish", 
      "filter": [ 
      "lowercase", 
      "asciifolding", 
      "spanish_stop", 
      "light_spanish" 
      ] 
     } 
     } 
    } 
    } 
} 

이 필터를 정의한 후 spanish_stop 당신은 당신의 인덱스의 정의에 사용할 수 있습니다.