2016-08-24 6 views
0

그래서 온톨로지에서 추가 용어를 추가하는 사용자 정의 작성기가 있습니다. 또한 색인을 생성하기 전에 용어의 형태를 없애고 싶습니다. 다음은 elasticsearch head plugin에서 가져온 index metadata입니다. 나는 porter_stem 필터를 사용했다 때까지ElasticSearch에서 인덱싱되는 용어 분석

{ 
    "state": "open", 
    "settings": { 
     "index": { 
      "refresh_interval": "1000s", 
      "number_of_shards": "5", 
      "creation_date": "1471931611750", 
      "analysis": { 
       "filter": { 
        "owlfilter": { 
         "type": "owl", 
         "indexName": "ontoowl", 
         "expansionType": "RDFSLABEL", 
         "owlFile": "/home/tannys/elasticsearch-2.3.0/ontologyWorkTrial/myownowl.owl" 
        } 
       }, 
       "analyzer": { 
        "owlanalyzer": { 
         "filter": ["owlfilter","porter_stem"], 
         "type": "custom", 
         "tokenizer": "standard" 
        } 
       } 
      }, 
      "number_of_replicas": "1", 
      "uuid": "d8Ub8A0eSm65geMK_bpdvw", 
      "version": {"created": "2030099"} 
     } 
    }, 
    "mappings": { 
     "mytype": { 
      "properties": { 
       "nameortitle": { 
        "search_analyzer": "standard", 
        "analyzer": "owlanalyzer", 
        "store": true, 
        "type": "string" 
       }, 
       "description": { 
        "search_analyzer": "standard", 
        "analyzer": "owlanalyzer", 
        "store": true, 
        "type": "string" 
       } 
      }, 
      "aliases": [ ] 
     } 
    } 
} 

문제의 아이러니이며, 결과가 더 좋았다. 그래서 나는 잘 모르겠다. 무엇이 잘못되었는지. 색인이 생성되는 용어를보고 싶습니다. Lucene에 루크가 어떤 역할을하는지와 같이 분석기의 성능을 어떻게 확인할 수 있습니까? 안내.

답변

1

용어 벡터 API here을 사용할 수 있습니다. 그러면 문서의 입력란에 대한 용어가 표시되거나 동일한 방법으로 multi-term API을 사용하여 여러 문서의 용어를 볼 수도 있습니다.