2017-11-30 28 views
0

나는 형식의 데이터 집합을 가지고아파치 돼지 학생 마크 평균 계산

student_id|name|subject|marks 

2   John English 50 

3   mark Maths  50 

3   mark English 50 

가이 데이터는 HDFS에로드, 나는이 될 것입니다 무슨, 돼지를 사용하여 각 학생에 대한 모든 과목의 평균을 계산해야 돼지 방법론. 학생이

답변

1

그룹과는 average.Assuming 당신은 관계 A.에 데이터를로드 한 얻을

B = GROUP A BY (student); 
C = FOREACH B GENERATE group,AVG(A.marks); 
DUMP C;