Spark EMR 작업에 내 의존성을 부여하는 방법은 적어도 2 가지입니다. 하나는 fat jar를 만들고 다른 하나는 --packages
옵션을 사용하여 spark submit에 원하는 패키지를 지정하는 것입니다.Spark, Fat Jar 대체품
뚱뚱한 항아리는 압축하는 데 꽤 오랜 시간이 걸립니다. 그게 정상인가요? ~ 10 분. 우리가 잘못 구성했을 가능성이 있습니까?
명령 줄 옵션은 훌륭하지만 오류가 발생하기 쉽습니다.
다른 방법이 있습니까? 나는 (이미 존재하는) gradle이있는 항아리에 종속성 목록을 포함시키는 방법을 원한다면, 그것을 다운로드해야한다. 이것이 가능한가? 다른 대안이 있습니까?
업데이트 : 부분 답변을 게시 할 예정입니다. 원래 질문에서 분명히하지 않은 한 가지는 내가 도은 다른 버전과 동일한 항아리가 있기 때문에 의존성 충돌이있을 때주의해야한다는 것입니다.