2017-10-22 9 views
0

나는 두 개의 CSV 파일을했습니다와 돼지 두 관계에 참여하는 방법 :여러 필드

1 Fertiltiy.csv :

enter image description here

2 생명 Expectency.csv :

enter image description here

결과가 다음과 같이되도록 돼지에 가입하고 싶습니다.

나는 돼지에 새로운 오전

enter image description here

, 나는 정답을 얻을 수 있지만, 여기에 내 코드 없습니다 :

enter image description here

: 여기
fertility = LOAD 'fertility' USING org.apache.hcatalog.pig.HCatLoader(); 

lifeExpectency = LOAD 'lifeExpectency' USING org.apache.hcatalog.pig.HCatLoader(); 

A = JOIN fertility by country, lifeExpectency by country; 

B = JOIN fertility by year, lifeExpectency by year; 

C = UNION A,B; 

DUMP C; 

내 코드의 결과입니다

답변

1

국가 및 연도별로 가입하여 최종 출력물에 필요한 열을 선택하십시오.

fertility = LOAD 'fertility' USING org.apache.hcatalog.pig.HCatLoader(); 
lifeExpectency = LOAD 'lifeExpectency' USING org.apache.hcatalog.pig.HCatLoader(); 

A = JOIN fertility by (country,year), lifeExpectency by (country,year); 
B = FOREACH A GENERATE fertility::country,fertility::year,fertility::fertility,lifeExpectency::lifeExpectency; 
DUMP B; 
+0

감사합니다. DUMP C를 DUMP B로 바꿔서 정답으로 받아 들일 수 있습니다. –

+0

@AliZuhair 업데이트되었습니다. 동의 해 주셔서 미리 감사드립니다. –