ElasticSearch 5 키워드로 정렬 필드 대소 문자를 구분하지 않음

우리는 ElasticSearch 5를 사용하고 있습니다. 나는 맞춤형 분석기와 다음 매핑을 사용하여 city 필드를 가지고 있습니다. 나는 도시의 필드를 구분하지 않는 정렬 경우를 할 수 있도록ElasticSearch 5 키워드로 정렬 필드 대소 문자를 구분하지 않음

분석기

 "analysis": { 
      "analyzer": { 
      "lowercase_analyzer": { 
       "filter": [ 
       "standard", 
       "lowercase", 
       "trim" 
       ], 
       "type": "custom", 
       "tokenizer": "keyword" 
      } 
}

매핑

"city": { 
    "type": "text", 
    "analyzer": "lowercase_analyzer" 
    }

나는이 일을하고있다. 여기에 내가 여기

{ 
    "query": { 
    "term": { 
     "email": { 
     "value": "[email protected]" 
     } 
    } 
    }, 
"sort": [ 
    { 
     "city": { 
     "order": "desc" 
     } 
    } 
    ] 
}

를 실행하려고 예를 들어 쿼리는 내가 점점 오전 오류입니다 :

"Fielddata은 기본적으로 텍스트 필드에서 사용할 수 없습니다 [도시에 fielddata = 사실 을 설정합니다. ] 역 색인을 반전하여 메모리에 필드 데이터를로드 할 수 있습니다. 그러나 이것은 상당한 메모리를 사용할 수 있습니다. "

FieldData을 켜고 ElasticSearch에서 성능이 저하되기를 원하지 않습니다. 대/소문자를 구분하지 않는 Keyword 필드를 갖고 싶습니다. 더 의미있는 집계 및 정렬을 수행 할 수 있습니다. 이것을 할 방법이 없습니까?

출처

2016-12-09 Vadim Rybak

예, 이것을 수행하는 방법은 multi_fields입니다. 분석 및 검색을 위해 사용될 수있는 전방 Elasticsearch 5.0

, 두 개의 유형으로 string field types were split out, text 필드 유형, 분석되지 않고, 정렬 집계하고 정확한 값 일치하는 용도에 적합한 keyword 필드 타입. Elasticsearch 5.0에서 동적 매핑으로

(즉 Elasticsearch 문서 속성에 매핑되어야하는 유형 추론하자) 즉 "키워드"의 서브 필드로, string 속성이 text 필드 유형에 매핑 된 JSON을 keyword 필드 유형으로 매핑되고 설정은 ignore_above:256입니다.

NEST 5.x 자동 매핑을 사용하면 POCO의 string 속성이 Elasticsearch의 동적 매핑과 동일한 방식으로 자동 매핑됩니다 (예 : 다음 문서

public class Document 
{ 
    public string Property { get; set; } 
}

automapping it

var pool = new SingleNodeConnectionPool(new Uri("http://localhost:9200")); 
var defaultIndex = "default-index"; 
var connectionSettings = new ConnectionSettings(pool) 
     .DefaultIndex(defaultIndex); 

var client = new ElasticClient(connectionSettings); 

client.CreateIndex(defaultIndex, c => c 
    .Mappings(m => m 
     .Map<Document>(mm => mm 
      .AutoMap() 
     ) 
    ) 
);

주어진 이제 Field(f => f.Property.Suffix("keyword")를 사용하여 정렬 property을 사용할 수 있습니다

{ 
    "mappings": { 
    "document": { 
     "properties": { 
     "property": { 
      "fields": { 
      "keyword": { 
       "ignore_above": 256, 
       "type": "keyword" 
      } 
      }, 
      "type": "text" 
     } 
     } 
    } 
    } 
}

생산하고 있습니다. 더 많은 예제를 보려면 Field Inference을보십시오.

keyword 필드 유형에는 기본적으로 doc_values이 사용됩니다. 즉, 컬럼 시간 데이터 구조가 인덱스 시간에 작성되며 이는 효율적인 정렬 및 집계를 제공합니다.

인덱스 작성시 사용자 정의 분석기를 추가하려면, 우리는 이전과 오토,하지만 우리가

{ 
    "settings": { 
    "analysis": { 
     "analyzer": { 
     "lowercase_analyzer": { 
      "type": "custom", 
      "filter": [ 
      "standard", 
      "lowercase", 
      "trim" 
      ], 
      "tokenizer": "keyword" 
     } 
     } 
    } 
    }, 
    "mappings": { 
    "document": { 
     "properties": { 
     "property": { 
      "type": "text", 
      "fields": { 
      "keyword": { 
       "type": "keyword", 
       "ignore_above": 256 
      } 
      }, 
      "analyzer": "lowercase_analyzer" 
     } 
     } 
    } 
    } 
}

생산과 .Properties()

client.CreateIndex(defaultIndex, c => c 
    .Settings(s => s 
     .Analysis(a => a 
      .Analyzers(aa => aa 
       .Custom("lowercase_analyzer", ca => ca 
        .Tokenizer("keyword") 
        .Filters(
         "standard", 
         "lowercase", 
         "trim" 
        ) 
       ) 
      ) 
     ) 
    ) 
    .Mappings(m => m 
     .Map<Document>(mm => mm 
      .AutoMap() 
      .Properties(p => p 
       .Text(t => t 
        .Name(n => n.Property) 
        .Analyzer("lowercase_analyzer") 
        .Fields(f => f 
         .Keyword(k => k 
          .Name("keyword") 
          .IgnoreAbove(256) 
         ) 
        ) 
       ) 
      ) 
     ) 
    ) 
);

에 대한 매핑을 제어하려는 분야에 대한 재정의를 제공 할 수 있습니다

출처

2016-12-10 00:59:14

ElasticSearch 5 키워드로 정렬 필드 대소 문자를 구분하지 않음

답변

관련 문제