현재 Amazon EMR에서 모든 돼지 작업을 순차적으로 실행하므로 클러스터를 시작한 다음 모든 돼지 작업을 클러스터 1에 대한 단계로 1을 추가합니다. 이 작업을하는 동안, 그 돼지 작업을 평행하게 운영 할 수있는 것이 있는지 궁금합니다.Amazon AWS에서 병렬 Pig 스크립트 실행
이상적으로 다음을 수행하고 싶습니다. 클러스터를 시작한 다음 (c3.xlarge라고 가정 해 봅시다) 15 개의 돼지 작업을 던집니다. 이러한 작업은 가능한 한 최선의 방식으로 병렬로 실행됩니다 (예 : 동시에 3 개). 1이 완료되면 다른 하나가 실행됩니다.
이 같은 것이 있거나 사용할 수있는 방법이 있으면 도움을 얻을 수 있습니다. 나는 Oozie에 관해 뭔가를 읽었지 만 이것이 우리의 필요에 부합하는지 확신 할 수 없다.
감사 정보를 원하시면 등지도-감소 Oozie를 살펴했다, 돼지, 하이브처럼 여기 작업의 조합을 사용할 수 있지만 내 요구에 맞는 있는지 확실하지 않다. Oozie는 사용 가능한 리소스를 고려하지 않기 때문에 (기본적으로) – darkownage
Oozie는 리소스 가용성을 고려하지 않습니다. Yarn/MR 프레임 워크에 작업을 제출하고 그것에 의존합니다. 감사. – YoungHobbit