그래서 나는이 streming 데이터 프레임을 가지고 있으며이 'customer_ids'열을 간단한 문자열로 변환하려고합니다. 다음은이 변환하고자하는MapType (StringType, StringType)의 열을 StringType으로 변환하는 방법은 무엇입니까?
는schema = StructType()\
.add("customer_ids", MapType(StringType(), StringType()))\
.add("date", TimestampType())
original_sdf = spark.readStream.option("maxFilesPerTrigger", 800)\
.load(path=source, ftormat="parquet", schema=schema)\
.select('customer_ids', 'date')
이
original_sdf.groupBy('customer_ids')\
.agg(max('date')) \
.writeStream \
.trigger(once=True) \
.format("memory") \
.queryName('query') \
.outputMode("complete") \
.start()
처럼 최대 (날짜)에 의해이 열 및 agregate에 의해 그룹화 해,하지만 난 주조 수있는 방법이 예외
AnalysisException: u'expression `customer_ids` cannot be used as a grouping expression because its data type map<string,string> is not an orderable data type.
있어 이런 종류의 스트리밍 DataFrame 열 또는 다른 방법으로 groupBy이 열?
일부 입력/출력 데이터를 제공하십시오. – Suresh