나는 이상한 문제로 부풀어 오르지 못하고/압축 된/압축 된 파이썬 lzo 모듈에서 압축 된 자바에서 lzo 압축 된 데이터를 실행하지 못하고있다. 둘 다 동일한 네이티브 lzo 코덱 구현을 사용하고있는 것처럼 보이지만 . 같은 바이트 "는"자바를 사용하여 https://github.com/jd-boyd/python-lzo
간단한 바이트 "는"수익률 im
sqoop을 사용하여 hdfs에서 mysql로 일부 데이터를 내보내려고합니다. 문제는 제대로 압축되지 않은 파일을 내보내려고 할 때이지만 lzo 압축으로 압축 된 동일한 파일을 내보내려고하면 sqoop 작업이 실패합니다. 나는 표준 cloudera CDH4 VM 환경에서 그것을 시도하고있다. 파일의 열은 탭으로 구분되며 널 (NULL)은 '\ N'으로
나는 LZO 압축 파일 /data/mydata.lzo을 가지고 있으며, MapReduce 코드가 약간 있지만 이것을 실행하고 싶습니다. 내가 먼저 다음 명령으로 hadoop-lzo 패키지를 사용하여 인덱스 파일을 만듭니다이 성공적으로 17/01/04 11:06:31 INFO mapreduce.Job: Running job: job_1472572940387_