2016-08-26 6 views
0

저는 하둡 (Hadoop)을 처음 사용하고 몇몇 시퀀스 파일을 보았습니다. Sequence File을 읽으면서 시퀀스 파일을 만드는 3 가지 방법이 있습니다. 이제 시퀀스 파일을 가지고 있는데, 어떤 종류의 시퀀스 파일인지를 어떻게 알 수 있습니까? 그것에 관한 메타 정보를 어떻게 읽습니까? 왜냐하면, 시퀀스 파일을 가지고 있고 비슷한 시퀀스 파일을 생성 할 것으로 예상되기 때문입니다.어떤 종류의 시퀀스 파일인지 어떻게 알 수 있습니까?

이 정보를 확인하는 데 사용할 수있는 hadoop 명령이 있습니까?

답변

0

SequenceFile은 2 진 키/값 쌍으로 구성된 플랫 파일입니다. SequenceFile.Reader은 브리지 역할을하며 SequenceFile 형식 중 하나를 읽을 수 있습니다.

당신은 SequenceFile.Reader에 SequenceFile 형식을 언급 기본적으로 독자 인스턴스가 파일 형식으로 볼 수있는 코덱에 따라 이러한 정보를 얻을하고 파일을 압축 해제 할 필요가 없습니다. 여기

체크 아웃 예 :