Jupyter 노트북에서 Spark를 실행 중입니다 (jupyter-scala 커널 사용). String 유형의 열이있는 데이터 프레임을 가지고 있고 이러한 값을 Int 유형으로 사용하여 새로운 데이터 프레임을 원합니다. 이 게시물의 모든 답변을 시도했습니다 : How to change column types in Spark SQL's DataFrame?.
여기에서 추가 질문이 있습니다 https://stackoverflow.com/a/32557330/5235052 열에 기능 및 레이블이있는 데이터 프레임에서 labledPoints를 작성하려고합니다. 기능은 모두 1/0으로 부울 값입니다. 여기 는 dataframe에서 샘플 행입니다 : | 0| 0| 0| 0| 0| 0| 1| 0| 0
spark에서 Kyro와 비즈니스 로직 및 모델 클래스가있는 클래스를 등록합니다. public class KyroSerializer implements KryoRegistrator {
@Override
public void registerClasses(Kryo kryo) {
kryo.register(People.class