2017-10-02 7 views
0

처음에는 설명이 유감 스럽다.매트릭스가 데이터 프레임의 rdd 행에 있음

안녕하세요, 데이터 형식으로 일부 데이터 (RDD 형식)를 변환하려고하는데 다소 복잡합니다.

필자는 각 항목이 기능이라고하는 행렬 (목록 목록)과 레이블이라는 목록이있는 ROW() 인 RDD를 가지고 있습니다.

이 RDD를 각 행이 단일 기능 목록이고 레이블 인 스칼라 인 Dataframe으로 변환하려고합니다. 알 수 있듯이 RDD의 기능은 매트릭스가 아닌 벡터로 구성된다는 점에서 문제가 발생합니다.

덕분에,

+0

단계별로 시도해보고 싶습니다. 먼저 RDD를 DF로 변환 한 다음 DF의 작업을 수행하십시오 ... 아니요? – jgp

+0

Row()의 요소를 여러 요소로 확장하는 작업은 무엇입니까? –

+0

map, for each ... – jgp

답변

0
flatMap(lambda row: [(f,l) for f, l in zip(row.feature, row.label)]) 

솔루션은 각 행의 기능과 레이블을 flatMap했다. (RDD에서)