0
sc.textFile("somefile.xml")
가령와 아파치 스파크 큰 파일을 처리하는 것이 실행기에서 병렬 처리를 분할하거나, 이는 하나의 청크에서와 같이 처리한다 수행 한 명의 유언 집행자?는 단일 작업자에 점화 프로세스 큰 파일 하는가Databricks의
implicit XMLContext
으로 데이터 프레임을 사용할 때 그러한 대규모 데이터 세트 처리를 위해 미리 최적화 된 최적화가 있습니까?
이 질문에는 splittable 파일을 병렬로 처리 할 수 있고, bzip을 제외한 압축 파일을 병렬 처리 할 수없는 등의 답변이 있습니다. Mr.Know-it-all * 2, 아래로 표시하도록 선택하십시오. –