val trim: String => String = _.trim.replace("[\\r\\n]", "")
def main(args: Array[String]) {
val spark = ... ...
import spark.implicits._
val trimUDF = udf[String,String](trim)
val df = spark.read.json(df_path) ...
val fixed_dblogs_df = df.withColumn("qp_new", trimUDF('qp)) ...
}
이 TypeTag 오류를 제공합니다. 왜 이런 일이 일어나는지 모르겠습니다. 이전에 udf 함수를 사용했지만이 오류가 발생했습니다. 나는 Spark 2.1.1을 사용했다.제거 줄 바꿈 내가 컴파일 시간 오류가이 코드를 실행하면
코드의 목적은
재현 가능한 예를 보여주세요 – mtoto
함수를'trim'으로 정의했지만 udf에서는'betterTrimmer'를 사용하고 있습니까? – Psidom
죄송합니다. 읽을 수 있도록 일부 줄을 제거하고 일부 변수의 이름을 변경했습니다. 난 그냥 문자열 형식의 필드가있는 데이터 프레임을 읽고 난 그 문자열 필드에있는 라인의 끝을 제거하고 싶습니다. 나는 또한 트림 기능을 수정했습니다. –