elasticsearch에서 인덱싱 된 두 문서의 유사성을 계산하고 싶습니다. 용어 벡터를 사용하여 lucene에서 수행 할 수 있음을 알고 있습니다. 직접적인 방법은 무엇입니까?문서 ElasticSearch의 유사성
내가 유사성 모듈이하고 있다는 것을 발견 정확히 : http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/index-modules-similarity.html
가 어떻게 내 시스템이 통합합니까? elasticsearch 명령을 호출하기 위해 pyelasticsearch를 사용하고 있지만 필요할 경우 유사성을 위해 REST API를 사용하고 있습니다.
내가 나에게 당신이 질문을주고, 내 대답은 도움 바랍니다 :
여기에 대략 KNN 솔루션의 평가를위한 훌륭한 자원이다. –
@ Michaelatqbox.io 대답은 내가 직면하고있는 문제를 해결하지 못했습니다. MLT 쿼리와 MLT API 모두 "가까운"문서를 검색하는 데 도움이됩니다. 두 문서 사이의 친밀도를 측정하고 싶습니다. 첫 번째 문제는 더 어렵다는 것을 알아야하지만 두 번째 문제를 해결할 방법이 없습니다. 귀하의 회신을 기대하겠습니다. 이 문제는 http://grokbase.com/t/gg/elasticsearch/131b9aa8xg/term-vectors-for-computing-document-similarity –
에도 기록됩니다. Javanna는 MLT 쿼리와 MLT API의 차이점에 대한 훌륭한 글을 가지고 있습니다. . 이렇게하면 차이를 분명히하고 작동 방식에 대한 자세한 정보를 얻을 수 있습니다. http://stackoverflow.com/a/15320512/3075507 –