lucene 쿼리의 결과에서 벡터 공간 모델 (tf-idf 가중치 사용)을 얻어야하고 어떻게 할 수 있는지 알아 내야합니다 그것. 그것은 단순해야하며,이 단계에서 여러분 중 한 명이 올바른 방향으로 나를 가리킬 수 있습니다.lucene 인덱스의 쿼리에서 벡터 공간 모델 (tf-idf) 얻기
나는 이것을 잘하는 동안 어떻게하는지 알아 내려고 노력해 왔으며, 내가 읽은 것들이 내가 필요한 것 (또는 그 이상)이되는 방법을 찾지 못했거나 해결책이 없다. 내 특정 문제에 게시되었습니다. 나는 심지어 쿼리 결과에서 직접 VSM을 계산하려고 시도했지만, 내 솔루션은 끔찍한 복잡성을 가지고 있습니다.
편집 : 이것에 걸림돌이있는 다른 사람에게는 훨씬 명확한 질문이 있습니다. here IndexReader.getTermFreqVector (String field, int docid) 메서드를 사용하여 필요한 정보를 얻을 수 있습니다.
불행하게도 이것은 내가 자주 사용하는 색인이 용어 빈도 벡터를 저장하지 않았기 때문에 나에게 도움이되지 않는다. 그래서 나는 아직도 이것에 대한 더 많은 도움을 찾고 있다고 생각한다!
Tf-idf 값을 인덱싱 할 수 있습니까? 과학적 관점에서? –