Apache Pig를 배우고 있습니다. 돼지 데이터를로드하려고합니다. vi 편집기에서 txt 파일을 볼 때 다음과 같은 (샘플) 행을 찾습니다.Apache Pig - 돼지 관계로로드하는 동안 숫자 데이터가 누락되었습니다.
[애보트, 디디 W의 9-12 교사 52,122.10 0 LBOE ATLANTA INDEPENDENT SCHOOL SYSTEM 2010].
다음 명령을 사용하여 데이터를 돼지 관계에로드합니다.
(애보트, 디디 W, 9-12 학년을 : 내가 분산 환경에서 돼지에서 덤프를 수행 할 때 (행이 위에서 언급 한 경우) 그러나
A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage() as (name:chararray, prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);
는, 나는 다음과 같은 결과를 찾을 수 교원, 0.0, LBOE, ATLANTA는 별도로 SCHOOL SYSTEM, 2010).
숫자 데이터 "52,122.10 "
이 누락 된 것 같습니다.
도와주세요.
파일 구분자는 무엇입니까? 탭이 맞습니까? –
예 무랄 리, 탭으로 구분됩니다. – Nemichandra
PigStorage ('\ t') 로딩 시도 –