1
spark에서 사용자 정의 파 티셔를 작성하려고하고 Java에서 작업 중입니다.Spark Java에서 사용자 정의 파티션
그러나 javaRDD 클래스 (또는 Dataset 클래스)에는 scala와 같은 partitionBy (Partitioner) 메소드가 없다는 것을 알았습니다. javaPairRDD만이 수행합니다. 이 방법없이 RDD 나 데이터 세트를 어떻게 분할해야합니까?
따라서 partitionBy를 사용하는 이러한 온라인 예제는 모두 동등한 PairRDD 스칼라 클래스 용입니까? 감사! 유형이 명시 적으로 스칼라로 명시되지 않았으므로 나에게 분명하지 않습니다. – user3161227