1
제 생각에 따르면 Lucene은 역 색인을 사용합니다. 내가 루씬 6.xx의를 사용하고 난 어떤 쉬운 방법에 대해 확실하지 오전하지만 해결책이없는 것보다 낫다역 색인 형식의 lucene 인쇄
term1 <doc1, doc100, ..., doc555>
term1 <doc1, ..., doc100, ..., do89>
term1 <doc3, doc2, doc5, ...>
.
.
.
termn <doc10, doc43, ..., dock>
이 솔루션은 효율적이지 않습니다 (예 : 3 일간의 트윗 색인에 영원히 소요됨). – sareem
** 3 일간의 트윗 색인 **은 부적절합니다. 문서 수를 언급하십시오. 또한, 당신이 물어 보는 논리 때문에 내가 경험하지 못했다는 것을 분명히했습니다. 성능 각도는 내가 보지 않은 것입니다. 나는 성능면에서도 살펴볼 것입니다. 작은 문서 세트에서 이것이 올바르게 작동한다면, 그 논리를 확장 성있게 만드는 것에 대해 생각해보십시오. –