1

아래 링크에서 사용할 수있는 좋은 해결책이 다음 JavaRdd의 경우 파일에서 사용할 수있는 XML 데이터, 실제 파일을로드하여 데이터 집합에 코드 변환 XML 아래 https://github.com/databricks/spark-xmlRDD 문자열 (xml 형식)을 spark java의 데이터 프레임으로 변환하는 방법은 무엇입니까?

..

Dataset<Row> df = sqlContext.read().format("com.databricks.spark.xml") 
            .option("rowTag", "book") 
            .load("file:///C:/books.xml"); 

그러나 만약

XML 데이터 사용 가능 Dataset으로 변환하는 방법?

답변

0

이 대답 Question에 대한 대답이 도움이 될 것입니다. 사용중인 스파크 버전에 따라 적절한 해결 방법을 사용하십시오. 코드 스 니펫은 스칼라 형식이므로 자바로 변환하면 큰 변화가 없어야합니다.