gzip으로 압축 된 파일에 임의 액세스 할 수 있기를 바랍니다. 전처리 결과가 파일 자체보다 훨씬 작다면 사전 처리 (예 : 일종의 색인 작성)를 할 여유가 있습니다.랜덤 액세스 gzip 스트림
어떤 조언이 필요합니까?
내 생각과 같다 : 기존 GZIP 구현에
- 해킹 및 압축 된 데이터의 모든 말하자면, 1메가바이트의 압축 상태를 직렬화. 그런 다음 무작위 액세스를 수행하려면 압축 해제 상태를 deserialize하고 메가 바이트 경계에서 읽습니다. 이것은 특히 Java로 작업 중이므로 순수한 gzip 구현을 찾을 수 없기 때문에 힘들어 보입니다. (
- 1Mb 청크로 파일을 다시 압축하고 이중화의 단점이 있습니다. 필요한 디스크 공간
- 압축 해제를 수행하지 않고 블록 경계 만 탐지하고 색인화하는 gzip 형식의 간단한 구문 분석기를 작성하십시오 (아직 블록이 없으면 gzip 형식 설명을 읽지 않았습니다)
감사에서 봐 가지고, 그 멋지다! – jkff
@jkff : 교차 플랫폼 배포가 필요하지 않은 경우 JNA를 확인하십시오. 놀랍게도 C 라이브러리를 호출하는 방법으로 사용하기가 쉽습니다. –
다시 한번 감사드립니다. 나는 그렇게했고 매력처럼 작동합니다!Rex, 너 덕분에, 나는 JNA를 사용했다. :) – jkff