예를 들어, 우리는 두 개의 파일 인 a.txt와 b.txt 파일을 추가하려고한다. 함께. 어쩌면 내 경우는 추가가 아니며, 스파크의 여러 인수를 사용하여 함수를 처리하는 방법 만 테스트하려는 경우 인수의 데이터는 로컬 파일에서 생성 된 rdd에서 가져온 것입니다.여러 가지 인자로 함수를 다루는 방법, 인자의 데이터는 로컬 파일에서 생성 된 rdd에서 나온다.
우리는 코드로, 하나 개의 파일의 데이터에 번호를 추가 할 수 있습니다
a_data = sc.textFile("a.txt")
a_data.map(lambda x: x + 5)
어떻게 스파크 RDD와 함께 두 파일의 데이터를 추가?
두 개의 RDD [Int]/RDD [Double] 값을 하나의 RDD에 함께 추가 하시겠습니까? – Shaido
답장을 보내 주셔서 감사합니다. 어쩌면 내 설명이 명확하지 않을 수 있습니다. 문제의 설명을 수정합니다. –