우리는 강력한 RDBMS에 보관 된 2 개의 소스 테이블에서 데이터를 읽는 일괄 처리 SQL 작업을 하루 1 회 실행합니다. 원본 테이블은 거대 (> 100TB)이지만 결합 된 필드가 10 개 미만입니다.인덱싱 된 플랫 파일
2 개의 원본 테이블을 압축 및 인덱싱 된 플랫 파일로 보관하면 전체 작업이 훨씬 빨라지고 저장소에 저장되어 낮은 사양의 서버에서 실행될 수 있습니다. 또한 이러한 압축되고 인덱싱 된 플랫 파일에 대해 쿼리와 같은 SQL을 실행할 수 있습니까? 이 작업을 수행하는 방법에 대한 지침은 매우 유용 할 것입니다.
SQLite는 하나의 휴대용 플랫 파일을 사용하여 단일 데이터베이스의 개체를 저장합니다. 그것은 인덱스와 SQL 인터페이스를 지원합니다. 그러나 최대 데이터베이스 크기는 14TB에 불과합니다. – Raihan
JSON 또는 YAML 기반 텍스트 파일을 사용하여 테이블을 저장할 수 있습니다. 최대 파일 크기는 OS가 허용하는 크기 일 수 있습니다. JSON과 YAML 모두 Java/Ruby와 다른 많은 프로그래밍 인터페이스가 있습니다. 그러나 어떤 임프레이션도 아직 색인 생성을 지원하지 않는다고 생각합니다. 그리고 SQL 인터페이스가 없습니다. – Raihan