2017-05-06 4 views
0

클러스터의 노드가 비정상 상태가되는 이유는 무엇입니까?클러스터의 비정상적인 노드

제한된 이해에 따라 일반적으로 주어진 노드의 HDFS 사용이 임계 값을 초과하면 발생합니다. 이 임계 값은 max-disk-utilization-per-disk-percentage 속성으로 정의됩니다.

메모리 집약적 인 스파크 작업이 spark-sql에서 트리거되거나 pyspark 노드를 사용하면 비정상적인 상태가되는 경우가 있습니다. 추가로 나는 건강에 해로운 상태에있는 노드에서 ssh를 실행했고 실제로 dfs 사용률이 75 % 미만이고 위에서 언급 한 속성에 대해 설정된 값이 내 클러스터에서 99임을 발견했습니다.

그래서 나는 기본적으로이 동작을 일으키는 다른 실종 사실을 추측합니다.

미리 도움을 주셔서 감사합니다. 각 하둡 노드 (슬레이브)에

마니 메라

답변

0

YARN의 Nodemanager 건강 검사기에 의해 결정 휴리스틱에 기초한 노드 비정상을 표시한다. 기본적으로 디스크 검사기가됩니다. 설정된 경우 외부 상태 검사기가 될 수도 있습니다. 디스크 (들)은 건강에 해로운 노드를 표시합니다 90 % 이상 가면

https://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/NodeManager.html#Health_checker_service

기본 Disk Checker 검사 노드의 디스크 여유 공간이하고있다. (기본값이며 yarn.nodemanager.disk-health-checker.max-disk-disk-per-disk-percentage에서 설정 됨)

귀하의 경우, 노드를 가로 지르는 HDFS 사용을 확인하는 것 같습니다. "df -h"를 사용하여 개별 노드의 디스크 사용량을 확인하여 해당 노드의 디스크 사용량을 확인해야합니다./mnt /와 같은 볼륨이 99 % 이상 표시되면 건강에 좋지 않은 것으로 표시됩니다.

대부분의 디스크 공간을 차지하는 최상위 디렉토리를 찾아 그에 따라 적절한 조치를 취해야합니다. 노드에서 디스크를 사용하는 HDFS (dfs.data.dir을 사용하여 설정)는 작업 실행 중 사용률이 매우 높으면 노드가 비정상적으로 될 수 있습니다. 그러나 노드는 높은 HDFS 사용률 없이는 건강에 해 롭습니다.