Spark-shell에서 2 분 걸리는 Dataframe로드 Zeppelin에서 영원히 가져옴

을 사용하여 단일 노드 Master를 실행하는 Zeppelin에서 영원히 계속됩니다.

애플리케이션 코드 스 니펫을 붙여주세요. – Kristian

Spark-Shell은 이전 버전의 하드웨어 (m1-medium)에서 내 쿼리를 실행할 수 있었지만 Zeppelin은 동일한 데이터를 가상으로 실행하기 위해 메모리 최적화 하드웨어 (r3.2xlarge)가 필요했습니다!

2016-08-30 09:30:58 user2849678

이 세부 사항은 위의 원래 질문의 지원 정보의 일부 여야합니다. – Kristian

은 분명히 작업이 생성되고 다양한 컨텍스트 사이의 쿼리를 실행할 때 실행하는 방법에 차이가 있습니다. 코드를 붙여 넣으면 차이점을 알 수 있습니다.

스파크 쉘을 실행 중일 때 스파크 제출과 달리 컨텍스트가 설정되는 방법에는 약간의 차이가 있음을 알 수 있습니다.

2016-08-30 19:53:51 Kristian

답변