spark-shell에서 2 분이 소요되는 데이터 프레임로드는 emp-5.0.0Spark-shell에서 2 분 걸리는 Dataframe로드 Zeppelin에서 영원히 가져옴
을 사용하여 단일 노드 Master를 실행하는 Zeppelin에서 영원히 계속됩니다.
0
A
답변
0
Spark-Shell은 이전 버전의 하드웨어 (m1-medium)에서 내 쿼리를 실행할 수 있었지만 Zeppelin은 동일한 데이터를 가상으로 실행하기 위해 메모리 최적화 하드웨어 (r3.2xlarge)가 필요했습니다!
+0
이 세부 사항은 위의 원래 질문의 지원 정보의 일부 여야합니다. – Kristian
0
은 분명히 작업이 생성되고 다양한 컨텍스트 사이의 쿼리를 실행할 때 실행하는 방법에 차이가 있습니다. 코드를 붙여 넣으면 차이점을 알 수 있습니다.
스파크 쉘을 실행 중일 때 스파크 제출과 달리 컨텍스트가 설정되는 방법에는 약간의 차이가 있음을 알 수 있습니다.
애플리케이션 코드 스 니펫을 붙여주세요. – Kristian