2017-12-07 13 views
0

는 I 한 열과 다른 많은 열을 50 개 포함 스파크 스칼라 샘플 dataframe 있고 ID 폭발해야공간 구분 열을 폭발시키는 방법은 무엇입니까?

예 데이터 :

id    name address 
234 435 567 auh aus 
345 123  muji uk 

출력 데이터 :

id    name address 
234   auh aus 
435   auh aus 
567   auh aus 
345   muji uk 
123   muji uk 

을 제발 누군가 도와 줄 수 있니?

답변

2

이 시도 :

import org.apache.spark.sql.functions._ 

scala> df.withColumn("id", explode(split($"id", " "))).show 
+---+----+-------+ 
| id|name|address| 
+---+----+-------+ 
|234| auh| aus| 
|435| auh| aus| 
|567| auh| aus| 
|345|muji|  uk| 
|123|muji|  uk| 
+---+----+-------+