대학 프로젝트 용으로 Amazon Web Services와 협력하고 있습니다. MapReduce에 데이터를 사용하려면 관계형 데이터베이스 (AWS RDS)에서 S3로 덤프해야합니다. MapReduce가 끝나면 출력 파일을 분할하고 그 파일을 자신의 S3 버킷에로드해야합니다.AWS MapReduce 용 데이터 준비 및 애프터 케어 방법
아마존 웹 서비스 환경에서 이것을 수행하는 좋은 방법은 무엇입니까?
최상의 경우 : RDS 및 MapReduce에 사용되는 EC2 인스턴스 외에 추가 EC2 인스턴스를 사용하지 않고도이 작업을 수행 할 수 있습니까?
MapReduce 작업 흐름을위한 매퍼 (mapper) 및 감속기 기능 및 json 지정자로 python을 사용합니다. 그렇지 않으면 언어 나 기술에 묶여 있지 않습니다.
boto는 매우 좋지만 유감스럽게도 jar 단계에 대한 사용자 정의 기본 클래스를 정의 할 수 없기 때문에 사용하기에 매우 비실용적입니다. – Thomas
좋아, 바보 야, 알아 냈어. – Thomas