2017-12-26 19 views
-1

위키피디아 덤프의 한 쌍의 단어가 포함 된 특정 문장을 검색하는 데 관심이 있습니다. 한 가지 방법은 덤프 XML을 추출한 후 모든 문서를 탐색하는 것입니다. 더 나은 해결책이 있습니까?java의 Wikipedia 덤프에서 텍스트를 검색하는 가장 좋은 방법은 무엇입니까?

+0

은 어쩌면 당신은 루씬과 같은 몇 가지 검색 엔진을 시도 할 수 있습니다 : 당신은 여기 루씬 인덱스를 사용하는 예이다 등 루씬, 탄성 검색, SOLR,

를 사용할 수 있습니다. – zhh

답변