4 개의 열을 포함하는 데이터 프레임이 있습니다.맞춤형 사용자 정의 집계 고유 함수를 생성하는 방법
Dataframe 샘플 행에 데이터의 2 개 종류가있다
id1 id2 id3 id4
---------------
a1 a2 a3 a4
b1 b2 b3 b4
b1 b2 b3 b4
c1 c2 c3 c4
b2
c1
a3
a4
c1
d4
중 모든 열 데이터 또는 단지 하나의 열을 갖는다.
행 사이의 값을 비교하는 동안과 같이 모든 열에 고유 한 기능을 수행하려는 경우 행에있는 값만 비교하고 null 값은 고려하지 않습니다.
dataframe 출력은 I 스파크 UDAF에 여러 예를 보았다
id1 id2 id3 id4
a1 a2 a3 a4
b1 b2 b3 b4
c1 c2 c3 c4
d4
이어야한다. 그러나 따라 수정할 수 없습니다.
가 왜 네 개의 컬럼에 필터 방법을 사용하지 않는? –
필터가 어떻게 도움이 될 수 있습니까? – Kaushal
아래의 내 대답을 참조하십시오. –