ref 말한다 각 점화 동작에 대한 모든 파티션의 직렬화 결과 총 크기spark.driver.maxResultSize 란 무엇입니까?
제한 (예를 들어 수집). 최소 1M 이상이어야합니다 ( 은 무제한). 전체 크기가이 제한을 초과하면 작업이 중단됩니다. 한계가 높으면 드라이버에 메모리 부족 오류가 발생할 수 있습니다 (spark.driver.memory의 및 JVM의 객체에 대한 메모리 오버 헤드에 따라 다름). 에 적절한 제한을 설정하면 메모리 부족 오류로부터 드라이버를 보호 할 수 있습니다.
이 속성은 정확히 무엇을합니까? 처음에는 (메모리 부족으로 인해 실패한 직업과 싸우지 않기 때문에) 나는 그것을 늘려야한다고 생각했습니다.
두 번째로 생각해 보면이 속성은 작업자가 드라이버에 보낼 수있는 결과의 최대 크기를 정의하는 것으로 보이므로 기본값 (1G)으로두면 드라이버를 보호하는 가장 좋은 방법이됩니다.
하지만이 경우 작업자가 더 많은 메시지를 보내야하므로 오버 헤드는 작업이 느려지는 것일뿐입니다.
나는 노동자가 (무제한 spark.driver.maxResultSize
로 대신 1) 4 메시지를 보낼 원인, 다음 spark.driver.maxResultSize=1G
을 갖는 근로자가 드라이버에 데이터의 4G를 보내려고한다는 것입니다 가정, 제대로 이해하고
그러나 여전히 위의 질문이 남아 있습니다. 1M을 설정하면 가장 방역하는 방법일까요?