오로라를 통해 mesos에서 대형 도커 이미지가있는 작업 실행 속도가 느림

다소 큰 도커 이미지 (~ 2GB)를 사용하는 오로라를 통해 mesos를 통해 작업을 시작하면 작업이 실제로 시작되기까지 대기 시간이 오래 걸립니다.오로라를 통해 mesos에서 대형 도커 이미지가있는 작업 실행 속도가 느림

이전에 작업을 시작했지만 작업자 노드에서 이미 도커 이미지를 사용할 수있을 것으로 예상되는 경우에도 실제로 작업을 시작하기 전에 이미지 크기에 따라 대기 시간이 있습니다. docker를 사용하면 이미 이미지 목록에있는 한 컨테이너를 거의 즉시 시작할 수 있습니다. mesos 컨테이너는이 "캐싱"도 지원하지 않습니까? 이 기능을 구성 할 수있는 기능입니까?

도커 컨테이너 도구를 사용해 본적이 없지만, 어쨌든 곧 단계적으로 사라질 것이고, 우리가 필요로하는 GPOS 리소스 격리는 mesos 컨테이너 전용입니다.

출처

2017-02-24 andrei

얼마나 걸릴까요? 이미지가 이미 작성 및/또는 다운로드 된 경우에도 이미지에서 새 컨테이너를 만드는 경우 이미지 파일 (많은 레이어로 구성 될 수 있음)에서 적어도 컨테이너를 만들고, 등, 그 혼자 시간이 걸릴 수 있습니다. 당신이 "긴 지연"이 의미하는 것을 정량화하지 않았기 때문에 우리가 새로운 컨테이너를 만들고, 기존 컨테이너를 다시 시작하는지 여부를 알지 못하기 때문에 말하기가 어렵습니다 ... –

이 경우, 오래 기다리면 ~ ~ 2GB 이미지의 경우 1 분. nvidia-docker를 실행하여이 동일한 이미지를 실행할 때 몇 초 만에 시작되는 반면, Aurora 작업의 일부로 시작하는 것은 지정된 프로세스가 시작될 때까지 약 1 분이 걸린다는 것을 알고 있습니다. 또한 훨씬 작은 이미지 (단지 수백 MB)를 포함하는 작업을 시작할 때의 대기 시간은 ~ 10 초에서 눈에 띄게 작습니다. 이제 Docker가 이미지에서 컨테이너를 만든 방법에 대한 전문가가 아니지만 mesos 컨테이너 도구와 비슷한 동작을 기대할 수 있습니다. – andrei

이 지연이 이미지를 다시 가져 오는 것이 아니라는 것을 확실히 알고 있다고 덧붙이고 싶습니다. 또는 내가 그런 식으로 도커 이미지를 사용하는 오로라 작업을 실행하는 시나리오를 실행 해 본 것처럼 레지스트리에서이 이미지를 업데이트 한 다음 다시 같은 작업을 실행하십시오. 이 경우 초기 이미지가 사용되고 업데이트 된 이미지는 무시됩니다. – andrei

도커 이미지를 실행하는 통합 컨테이너 관리자에 대해 이야기하고 있다고 가정합니다. 현재 사용중인 백엔드는 무엇입니까? 기본적으로 Mesos 에이전트는 복사 백엔드를 사용하므로 속도가 느려집니다. 에이전트에서 flags 엔드 포인트를 눌러 에이전트가 사용중인 백엔드를 볼 수 있습니다. 백엔드를 aufs 또는 overlayfs로 전환하여 출시 속도가 빨라지는지 확인하십시오. 에이전트의 --image_provisioner_backend=VALUE 플래그를 통해 백엔드를 지정할 수 있습니다.

참고 : 최신 Mesos 릴리스 1.2.0-rc1에서 aufs 및 overlayfs 백엔드와 관련된 몇 가지 버그 수정이 있습니다. 1.2.0-rc1에는 사용할 수있는 가장 빠른 백엔드를 자동으로 선택하는 자동 백업 기능이 있습니다.

출처

2017-02-24 19:57:58 anaken78

이것은 확실히 문제인 것처럼 들립니다. 저는 프로 그래머 백엔드를 약간 바꾸어서 언급 한 버그들을 찾아 볼 것입니다. – andrei

오로라를 통해 mesos에서 대형 도커 이미지가있는 작업 실행 속도가 느림

답변

관련 문제