2017-05-08 4 views
0

하이브 udf 내부에서 여러 행을 어떻게 처리 할 수 ​​있습니까? 함수 내에서 전체 열 name이 필요하므로 UDF 내부의 ArrayList에 추가 할 수 있습니다. 다음은 열 이름입니다.하이브 udf에서 여러 행 처리

Name 
jhon 
jone 
mike 

UDF 내부의 열에있는 모든 이름을 가져 오려고합니다.

+0

collect_set() 및 collect_list() return array – leftjoin

답변

0

집계 기능을 찾고있는 것처럼 보입니다.

먼저, 필요로 할 수있는 기존 집계 함수가 있는지 확인하십시오 (Built-in Aggregate Functions). 아무도없는 경우

, 당신이 당신을 필요로 정의 UDAF, 만들 수 있습니다 자신의 평가자 및 확인자 쓰기

  • (이 튜토리얼 참조 - Custom UDAF)를
  • 그들을 컴파일,
  • 하이브 클래스 패스에
  • 하이브의 레지스터 기능을 CREATE FUNCTION (Create Function)과 함께 추가하십시오.