2017-05-06 4 views
0

테이블이 있는데 열의 합계 값을 쿼리하고 싶습니다.돼지의 열에서 최대 값을 얻는 방법은 무엇입니까?

grunt>teams_raw = load '/usr/input/Teams.csv' using org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'UNIX', 'SKIP_INPUT_HEADER'); 
grunt>teams = foreach teams_raw generate $0 as year:int, $1 as lgID, $2 as tmID, $8 as g:float, $9 as w:float, $11 as t:float, $18 as name; 
grunt> describe teams 
teams: {year: bytearray,lgID: bytearray,tmID: bytearray,g: bytearray,w: bytearray,t: bytearray,name: bytearray}; 
grunt> gry_by_team = group teams by tmID; 

teams 테이블에서 g의 합계 값을 얻기 위해 시도 할 때 나는 오류가 아래에있어 : ​​아래 표 자세한 정보입니다

grunt> win = foreach grp_by_team generate group, SUM(teams.g) as win; 
grunt>DUMP win 
17/05/06 15:32:14 ERROR mapreduce.MRPigStatsUtil: 1 map reduce job(s) failed! 
17/05/06 15:32:14 ERROR grunt.Grunt: ERROR 1066: Unable to open iterator for alias win 
Details at logfile: /Users/joey/dev/bigdata/pig_1494048371690.log 

로그 파일에, 나는 예외 아래를 참조하십시오.

grunt>dump teams 
... 
(1994,NHL,TBL,48,17,3,Tampa Bay Lightning) 
(1994,NHL,TOR,48,21,8,Toronto Maple Leafs) 
(1994,NHL,VAN,48,18,12,Vancouver Canucks) 
(1994,NHL,WAS,48,22,8,Washington Capitals) 
(1994,NHL,WIN,48,16,7,Winnipeg Jets) 
(1995,NHL,ANA,82,35,8,Mighty Ducks of Anaheim) 
(1995,NHL,BOS,82,40,11,Boston Bruins) 
(1995,NHL,BUF,82,33,7,Buffalo Sabres) 
(1995,NHL,CAL,82,34,11,Calgary Flames) 
... 

grunt>dump gry_by_team 
... 
(1912,NHA,TBS,20,9,0,Toronto Blueshirts),(1916,NHA,TBS,14,7,0,Toronto Blueshirts),(1914,NHA,TBS,20,8,0,Toronto Blueshirts)}) 
(TO1,{(1912,NHA,TO1,20,7,0,Toronto Tecumsehs)}) 
(TOA,{(1917,NHL,TOA,22,13,0,Toronto Arenas),(1918,NHL,TOA,18,5,0,Toronto Arenas)}) 
(TOB,{(1916,NHA,TOB,14,7,0,228th Battalion)}) 
(TOO,{(1913,NHA,TOO,20,4,0,Toronto Ontarios),(1914,NHA,TOO,20,7,0,Toronto Ontarios/Shamrocks)}) 
... 

내 코드와 무엇을 잘못 알고하지 않습니다 아래

================================================================================ 
Pig Stack Trace 
--------------- 
ERROR 1066: Unable to open iterator for alias win 

org.apache.pig.impl.logicalLayer.FrontendException: ERROR 1066: Unable to open iterator for alias win 
     at org.apache.pig.PigServer.openIterator(PigServer.java:1019) 
     at org.apache.pig.tools.grunt.GruntParser.processDump(GruntParser.java:747) 
     at org.apache.pig.tools.pigscript.parser.PigScriptParser.parse(PigScriptParser.java:376) 
     at org.apache.pig.tools.grunt.GruntParser.parseStopOnError(GruntParser.java:231) 
     at org.apache.pig.tools.grunt.GruntParser.parseStopOnError(GruntParser.java:206) 
     at org.apache.pig.tools.grunt.Grunt.run(Grunt.java:66) 
     at org.apache.pig.Main.run(Main.java:564) 
     at org.apache.pig.Main.main(Main.java:176) 
     at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 
     at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62) 
     at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 
     at java.lang.reflect.Method.invoke(Method.java:498) 
     at org.apache.hadoop.util.RunJar.run(RunJar.java:234) 
     at org.apache.hadoop.util.RunJar.main(RunJar.java:148) 
Caused by: java.io.IOException: Job terminated with anomalous status FAILED 
     at org.apache.pig.PigServer.openIterator(PigServer.java:1011) 
     ... 13 more 
================================================================================ 

teamsgry_by_team의 덤프 데이터입니다. 코드 열 g 데이터 유형에서

$ pig --version 
Apache Pig version 0.16.0 (r1746530) 
compiled Jun 01 2016, 23:10:49 

$ hadoop version 
Hadoop 2.8.0 
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r 91f2b7a13d1e97be65db92ddabc627cc29ac0009 
Compiled by jdu on 2017-03-17T04:12Z 
Compiled with protoc 2.5.0 
From source with checksum 60125541c2b3e266cbf3becc5bda666 
This command was run using /usr/local/Cellar/hadoop/2.8.0/libexec/share/hadoop/common/hadoop-common-2.8.0.jar 
+0

돼지 버전과 Hadoop 버전을 지정할 수 있습니까? –

+0

예 내 게시물에 버전을 추가했습니다. –

+0

돼지 병에 접근 할 수있는 권리가 있으시기 바랍니다. 또한 나는 오류와 함께 대답을 업데이 트했습니다. –

답변

0
win = foreach grp_by_team generate group, SUM(teams.g) as win; 

bytearray입니다 :

다음은 내가 사용하고있는 하둡과 돼지 버전입니다.

SUM 다음 데이터 형식을 사용할 수 있습니다 : int, long, float, double, bigdecimal, biginteger or bytearray cast as double.. 여기에 bytearraydouble으로 전송해야합니다. 자세한 내용은 pig documentation을 참조하십시오.

코드 grunt>teams = foreach teams_raw generate $0 as year:int, $1 as lgID, $2 as tmID, $8 as g:float, $9 as w:float, $11 as t:float, $18 as name;에 정의한 스키마가 선택되지 않았습니다. 따라서로드 문과 함께 스키마를 지정하는 것이 좋습니다.

예 : A = LOAD 'data' AS (a:chararray, b:int, c:int);

+0

'$ 8을 g : float'로 지정했는데 왜 g 데이터 형이 'bytearray'입니까? –

+0

로드 문에서 스키마를 지정하지 않았으므로 모든 데이터 열은 기본 데이터 유형이 'bytearray'입니다. 당신은 statement :'describe teams_raw'에 의해 이것을 확인할 수 있습니다. –

+0

나는 시도하지는 않았지만이 링크에서 답변을 수락 할 수 있습니다. http://stackoverflow.com/questions/15324747/pig-changing-schema-to-required-type –