2017-02-27 5 views
0

Apache Pig를 배우고 있습니다. 돼지 데이터를로드하려고합니다. vi 편집기에서 txt 파일을 볼 때 다음과 같은 (샘플) 행을 찾습니다.Apache Pig - 돼지 관계로로드하는 동안 숫자 데이터가 누락되었습니다.

[애보트, 디디 W의 9-12 교사 52,122.10 0 LBOE ATLANTA INDEPENDENT SCHOOL SYSTEM 2010].

다음 명령을 사용하여 데이터를 돼지 관계에로드합니다.

(애보트, 디디 W, 9-12 학년을 : 내가 분산 환경에서 돼지에서 덤프를 수행 할 때 (행이 위에서 언급 한 경우) 그러나

A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage() as (name:chararray, 
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int); 

는, 나는 다음과 같은 결과를 찾을 수 교원, 0.0, LBOE, ATLANTA는 별도로 SCHOOL SYSTEM, 2010).

숫자 데이터 "52,122.10 "이 누락 된 것 같습니다.

도와주세요.

+0

파일 구분자는 무엇입니까? 탭이 맞습니까? –

+0

예 무랄 리, 탭으로 구분됩니다. – Nemichandra

+0

PigStorage ('\ t') 로딩 시도 –

답변

0

돼지에서 돼지 내장 함수는 인자로 레코드 구분 기호를 사용합니다. 여기에 탭 -> \ t

A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage('\t') as (name:chararray, 
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int); 
+0

도움을 주셔서 감사합니다. 잘 됐네. – Nemichandra

+0

@ Nemichandra : 도움이된다면이 대답을 받아 들일 수 있습니다. –