qubole을 통해 실행중인 pyspark 작업이 다음 오류와 함께 실패합니다."예외 읽기 매퍼 출력을 다시 시도 중입니다"와 함께 qubole에서 pyspark 작업이 실패합니다.
Qubole > Shell Command failed, exit code unknown
Qubole > 2016-12-03 17:36:53,097 ERROR shellcli.py:231 - run - Retrying exception reading mapper output: (22, 'The requested URL returned error: 404 Not Found')
Qubole > 2016-12-03 17:36:53,358 ERROR shellcli.py:262 - run - Retrying exception reading mapper logs: (22, 'The requested URL returned error: 404 Not Found')
작업은 다음과 같은 구성으로 실행됩니다 :
--num-executors 38 --executor-cores 2 --executor-memory 12288M --driver-memory 4000M --conf spark.storage.memoryFraction=0.3 --conf spark.yarn.executor.memoryOverhead=1024
클러스터는 30 슬레이브 수를 포함합니다. m2.2xlarge
, 4 코어 마스터 및 슬레이브 노드
문제의 근본 원인에 대한 통찰력이 유용 할 것입니다.
읽는 것은 무엇이든 사용할 수없는 것 같습니다. – ksindi