hive-udf

0열

1답변

HiveUDF + saxon 9.1.0.8 + Java8 = XPathFactory를 만들지 못했습니다.

코드에 정의 된 UDF가 없으면 HiveContext와 Saxon을 사용하는 Spark 작업이 정상적으로 작동합니다. UDF 구현의 경우 - HiveContext 초기화가 오류와 함께 실패했습니다. 나는 중앙 받는다는 저장소에 아직 무료 버전을 출시되지 색슨 9.5.1.5에서 해결 색슨 \ java8 호환성에가, 거기에 들었 Caused by: java.l

0열

1답변

pyspark EMR 5.x에서 Java로 작성된 하이브 UDF를 실행하면 오류가 발생합니다.

java로 작성된 하이브 UDF가 있고 pespark 2.0.0에서 사용하려고합니다. 아래의 단계 1. 복사 EMR 2. jar 파일은 pyspark --jars ip-udf-0.0.1-SNAPSHOT-jar-with-dependencies-latest.jar 3. UDF가 from pyspark.sql import SparkSession from p

0열

1답변

하이브 UDF는 TOP 연료 소모량

위해 우리는 스마트 데이터 액세스 EX: Select top 10 from hana.table join hive.table 하나 지원 TOP의 연료 소모량하지만 하이브 나던에서 하나와 하이브와 뷰 생성 쿼리 테이블을 조인하고 있습니다. Hive에 TOP와 비슷한 기존 UDF가 있습니까? 하이브에서 우리는 LIMIT을 가지고 있지만 우리는 하나와 비슷한

0열

2답변

누구나 특정 열을 잘라내려면 하이브 udf 코드를 제공 할 수 있습니까?

이중 값 42.2223을 포함하는 열이 있습니다. 이 특정 열의 마지막 네 자리를 자릅니다. 이 시나리오에서 하이브 UDF를 제공 할 수 있습니까?

0열

1답변

GenericUDF의 초기화 된 메소드가 여러 번 호출되었습니다

저는 GenericUDF를 확장하는 HiveUDF를 가졌습니다. spark.sql을 통해 udf를 호출하면 정확한 결과를 얻었지만 초기화 된 메소드는 여러 번 호출됩니다. 왜 이런 일이 벌어지고 있는지 이해할 수 없습니까?

0열

1답변

하이브 udf에서 여러 행 처리

하이브 udf 내부에서 여러 행을 어떻게 처리 할 수 있습니까? 함수 내에서 전체 열 name이 필요하므로 UDF 내부의 ArrayList에 추가 할 수 있습니다. 다음은 열 이름입니다. Name jhon jone mike UDF 내부의 열에있는 모든 이름을 가져 오려고합니다.