2017-09-13 19 views
0

나는 신축성있는 검색을 처음 사용합니다. 문서의 입력란에 대한 부스트 값의 조정 및 크기 조정을 이해하는 데 문제가 있습니다. 예상대로 필드에서 증폭 값을 결정하는 방법은 무엇입니까? 나는 몇몇 온라인 블로그와 es 문서를 살펴 보았다. es가 정규화와 값을 높이기위한 내부 최적화를 수행한다고 썼다. 어떻게 작동합니까?부스팅의 정규화 및 내부 최적화는 어떻게 작동합니까? 그게 관련성에 어떤 영향을 줍니까?

예 : Google 문서에서 태그, 제목, 이름 및 텍스트 입력란을 사용하는 경우 이러한 입력에 대한 부스팅 값을 어떻게 결정해야합니까?

답변

0

Elasticsearch는 부울 모델을 사용하여 문서를 일치시킨 다음 관련성 (즉, 순위)을 결정하는 채점 모델을 사용합니다. 채점 모델은 TF/IDF 점수와 몇 가지 추가 기능을 활용합니다. 이러한 TF/IDF 점수는 쿼리 내의 일치하는 각 필드에 대해 계산 된 다음 집계되어 문서의 전체 점수를 산출합니다. 이 과정을 파헤 치기 위해 검색어에 explain을 실행하여 각 필드의 점수가 문서의 전반적인 관련성에 어떤 영향을 미치는지 확인하는 것이 좋습니다.

데이터 전문가로서 문서의 관련성에 가장 많이 영향을주는 필드를 결정하는 가장 좋은 위치에 있습니다. 필드에 맞는 부스트 값을 찾는 것은 원하는 결과를 가장 잘 표현하는 수식을 찾을 때까지 레버를 조정하는 것입니다 (또한 사용자가있는 경우 A/B 테스트가 도움이 될 수 있음).