나는 무엇을 100Gb 텍스트 문서로 조작 할 것인가? 각 문서의 크기는 2Kb - 100Kb입니다.Lucene은 100Gb 이상의 원본 문서를 색인에 저장할 수 있습니까?
먼저 으로 MySQL 또는 Firebird와 같은 DBMS을 사용하여 원시 문서를 lucene의 색인에 저장하여 저장하십시오. 이 접근법에는 몇 가지 단점이 있습니다. 예를 들어, 데이터베이스 트랜잭션은 lucene 인덱스에 대해 아무것도 모르고 그 반대도 마찬가지입니다. 그래서 그들을 동기화해야합니다.
그러면 Lucene이 할 수있는 것은 무엇입니까? 전체 문서를 인덱스에 저장합니다. 그래서 나는 regulary 인덱스의 백업을 생성해야합니다. 하지만 너무 쉽습니다. 색인으로 전체 카탈로그를 복사 할 수 있습니다. 나는 일종의 SQL 스토리지 없음 (예 : Lucene)을 사용합니다. 그리고 DBMS를 사용하지 않을 수도 있습니다.
인덱스에 원본 문서를 저장하는 것이 가장 좋은 방법은 무엇입니까? 나는 그런 목적으로 DBMS를 사용하고 싶지 않다. 가능한가?
solr 및 탄성 검색을 살펴보십시오. 또한 더 큰 매장을 위해 설계되었으며 쉽게 관리하고 쉽게 확장 할 수 있습니다. Bart가 언급 한 것은 유효하지만 검색 가능한 데이터 만 색인에 문서를 저장하지 마십시오. – Dreamwalker