나는 두 배의 배열을 포함하는 JavaRDD를 가지고 있습니다. 이제 각 배열 사이의 피어슨 계수를 계산하고 싶습니다. 그러나 rdd를 벡터로 변환하고 statistics.corr()을 적용하면 함수는 열을 계산하지만 행을 계산하려고합니다. 아무도 그 칼럼에 corr() 함수를 적용 할 수 있도록 내 데이터를 변환하는 방법을 제안 할 수 있습니까?스파크 데이터 세트에서 피어슨 상관 관계 계산
편집 : statistics.corr() 함수는 javadd <을 입력으로 사용합니다.