어떤 상황에서 Spark가 UDAF 기능의 일부로 병합을 수행하는지 알고 싶습니다. 동기 부여 : 내 Spark 프로젝트에서 많은 UDAF 기능을 사용하고 있습니다. 종종 다음과 같은 질문에 답하고 싶습니다 : 30 일 동안 현재 거래가 이루어진 국가에서 신용 카드 거래가 몇 번 있었습니까? 창이 현재 트랜잭션에서 시작되지만 카운트에 포함되지 않습니다. 지
상수 매개 변수를 사용할 수있는 사용자 지정 UDF (UDAF/UDTF)를 작성하고 싶습니다. 예를 들어, COL은 최대 값을 찾을 값의 모음이고 i는 위치 (즉, i = 1, 가장 높은 것을 찾습니다. i)는 MAX (COL, i) = 2처럼 하이브 쿼리 보인다 있도록, 등), 두 번째로 높은 찾기 : 이것은 단지 MAX위한 것이 아닙니다 SELECT
나는 (다음에 평균을 계산하기 위해) 날짜별로 값을 계산하고 합계하는 함수를 작성하려고합니다. 나는 이것을 멀리 가지고있다 : CREATE OR REPLACE FUNCTION state_group_count_and_sum(state map<timestamp, frozen<tuple<bigint,double>>>, timestamp timestamp, val
SQL Server 2008에 대한 일부 사용자 지정 .Net 확장을 작성하고 있습니다. 그 중 하나는 10 진수 집합을 십진수로 집계해야하는 사용자 정의 집계입니다 . 내 문제의 범위를 좁히기 위해 간단한 Const 집계를 사용하고 있는데, 단순히 상수 10 진수 값을 반환합니다. SQL Server에 대한 사용자 정의 집계로이를 추가 할 때 반환되는 값