답변

1

가장 좋은 건 Kubernetes와 같은 것을 사용하는 것입니다. 이것은 진행중인 작업이지만 분산 된 교육에 대한 지원도 포함되어 있다고 생각합니다 (https://github.com/tensorflow/k8s).

은 또한 더 낮은 기술 자동화 옵션, 이들은

  1. 당신은 여전히 ​​SSH를 사용하여 원격으로 스크립트를 실행하는 스크립트를 가질 수 ... 떠오른다.
  2. 개별 작업자가 파일을 다운로드하고 스크립트를 실행하기위한 신호로 사용할 파일의 공유 위치를 폴링하게 할 수 있습니다.
-1

추정 자에 의해 구문 분석 될 환경 변수 TF_CONFIG을 설정할 수 있습니다.

+0

어떻게 작동하는지 알 수 있습니다. 그러나 가장 쉬운 방법은 무엇입니까? 나는 모든 머신에 ssh를 넣고 git pull을하고 스크립트를 직접 실행하고 싶지 않다 ... –