으로 변환합니다. 일부 열에 문자열 배열이 있고 하나의 열에 중첩 배열이있는 pyspark 데이터 프레임이 있습니다. 따라서 데이터 프레임을 CSV에 쓸 수 없습니다.배열 <string>을 문자열 pyspark 데이터 프레임
+-------+--------------------+---------+
|ID | emailed| clicked
+-------+--------------------+---------+
|9000316|[KBR, NRT, AOR] |[[AOR]]
|9000854|[KBR, NRT, LAX] | Null
|9001996|[KBR, JFK] |[[JFK]]
+-------+--------------------+---------+
나는 다음과 같은 구조를 좀하고 싶습니다
를 CSV로 저장하기 - 여기
내가 처리하고있는 dataframe의 예입니다.+-------+--------------------+---------+
|ID | emailed| clicked
+-------+--------------------+---------+
|9000316|KBR, NRT, AOR | AOR
|9000854|KBR, NRT, LAX | Null
|9001996|KBR, JFK | JFK
+-------+--------------------+---------+
나는 아주 새로운 pyspark입니다. 귀하의 도움을 크게 주시면 감사하겠습니다. 고맙습니다!
'clicked '열은 항상'[[value]]'형식이거나'[[val1, val2 ...]]'형식일까요? –