2017-01-06 6 views
0

현재 전체 텍스트 검색에 SOLR을 사용하고 있습니다. 이제 SOLR에서 ElasticSearch로 이동할 계획입니다. 우리가이 과정에 있었을 때 SOLR-ElasticSearch에서 데이터를 마이그레이션 할 수있는 몇 가지 플러그인을 사용할 수 있다고 읽었습니다. 그러나 SOLR에 저장되지 않은 레코드는 마이그레이션 할 수 없습니다. 그렇다면 SOLR에서 저장된 검색되지 않은 색인 데이터를 탄성 검색으로 마이그레이션 할 수있는 플러그인이 있습니다. 알려 주시면 알려주세요.SOLR의 저장된 색인 데이터를 Elastic 검색으로 마이그레이션 할 수 있습니까?

현재 SOLR-to-ES 플러그인을 사용하고 있지만 저장되지 않은 색인 데이터는 이전하지 않습니다.

감사

답변

2

필드가 저장되어 있지 않다면, 당신은 원래의 값이 없습니다. 색인을 생성했다면 분석 체인을 통과 한 후 값이있는 것이므로 원래의 단어와 다른 것입니다 (즉, 스톱 어구가 없거나, 소문자가 아닐 수도 있고, 어쩌면 스터드 드 (stuffed) 될 수도 있습니다 ...). 저장되지 때

는 원본 콘텐츠를 가질 수 있도록 수있는 가능성의 몇 가지가 있습니다

  1. 인덱스 필드 :이 분석 된 경우 바로 keyword tokenizer : 다음 인덱스 값은 원래 값입니다 .
  2. 필드의 docValues ​​값이 true이면 원래 값도 저장됩니다. 이 기능은 나중에 소개되었으므로 색인에서 사용하지 않을 수 있습니다.

일반적인 플러깅은 stored = true가 완전히 필요하지 않은 경우를 활용하지 않을 수도 있습니다. 그들을 확인해야합니다.

+0

감사합니다. 제 경우에는 공백 문자 토큰 화 도구를 사용합니다. 저장되지 않은 색인을 마이그레이션하는 데 도움이 될 것입니다. 데이터 마이그레이션을위한 몇 가지 플러그인을 거쳤으므로 SOLR에서 JSON 출력을 인덱싱하지만, 데이터는 저장되지 않으므로 출력에서는 사용할 수 없으며 탄성 검색에서는 인덱싱 할 수 없으므로 여기서는 JSON 출력을 인덱싱합니다. 이것을 달성 할 수있는 다른 방법이 있습니까? –

+0

아니요, 해당 토크 나이저를 사용하는 경우 원본 콘텐츠가 없습니다. 공백이있는 토큰을 추가 할 수는 있지만 더 이상 원래 내용이 아닙니다. 당신에게 중요 할 수도 있고 중요하지 않을 수도 있습니다. 또한이를 위해 일부 응용 프로그램 코드를 작성해야합니다. – Persimmonium