아래의 단일 원시 파일이 있으며 파일을 다른 관계로 분할해야합니다. 라인은 0으로 시작하는 경우, 전체 라인 오도 관계 '헤더' 라인 1로 시작하는 경우, 전체 라인해야 오도 관계 "금지" 라인이 시작되면 (2)에 의해, 작성해야 선해야 고토 관계 '하위' 라인은 3로 시작하면, 전체 라인을해야 고토 관계 '항목을' 라인은 4로 시작하면, 전체 라인을해야
입력을 튜플로 받아서 튜플을 반환하는 필터 UDF를 작성하려고하지만 Gruntt 셸에서 함수를 정의 할 때 구문 분석에 실패한 오류 메시지가 표시됩니다. 내가 잘못 여기서 뭐하는 거지 곳 REGISTER /home/filterUDF.jar;
DEFINE filDist 'FilterDistrictUdf/FilterDistrict'
package Fi
입력 : I는 상기와 키 데이터를 그룹화 한 (11111111,{(A,MARK,APPLE,ABC1,11111111),(B,PAUL,AMAZON,ABC2,11111111),(C,TIM,FIVN,ABC3,11111111),(D,LIN,MULESFT,ABC4,11111111),(E,YEP,UHG,ABC5,11111111),(F,QIN,ATT,ABC6,111111
나는 7369,SMITH,CLERK,800.00,null,20
7499,ALLEN,SALESMAN,1600.00,300.00,30
스크립트 emp_bag = LOAD '/home/training/dvs/emp.csv' using PigStorage(',') AS (eno:int, ename:chararray, job:chararray, sal:int,
돼지의 UDF를 사용하여 다른 컬럼에 대해 하나의 컬럼을 카테고리 화하려고합니다. 데이터는 내가이 Id,name,age
1,jhon,31
2,adi,15
3,sam,25
4,lina,28
예상 출력 1,jhon,31,30-35
2,adi,15,10-15
3,sam,25,20-25
4,lina,28,25-30
당신은 UDF없이이 작업을 수
입력 : IDS : 1111,2222,3333,4444
직원 : 내가 id가 주어진 목록에있는 직원을 필터링 할 {"name":"abc","id":"1111"} {"name":"xyz","id":"10"}
{"name":"z","id":"100"} {"name":"m","id":"99"}
{"name":"pqr","id":"3333"}
. 예상
아래는 내 돼지 스크립트입니다. 매우 간단합니다. 일부 데이터로드 중. 열로 데이터 필터링. 데이터 유형으로 스키마 생성. 하이브 테이블에 데이터 저장. 내가 데이터를 실행하고 때 나는 그것이 아래 오류를 던지고, 데이터를 실행하고 때 , 그것의 emp = load '/root/emp.nulls' using PigStorage(',');
filt = fi