NLP 처리 등을 위해 pyspark에서 작업 중입니다. TextBlob Python 라이브러리를 사용하고 있습니다.Pyspark 클러스터 모드에서 작업자 노드에 외부 라이브러리 설치
일반적으로 독립형 모드에서는 외부 Python 라이브러리를 쉽게 설치할 수 있습니다. 클러스터 모드에서 이러한 라이브러리를 작업자 노드에 원격으로 설치하려면 문제가 있습니다. 각 작업자 컴퓨터에 Python 경로에 이러한 libs를 설치하기 위해 액세스 할 수 없습니다.
나는 파일 을 발송하기 위해 Sparkcontext pyfiles 옵션을 사용하려고 시도했지만, 문제는 이러한 Python 패키지가 작업자 컴퓨터에 설치되어야한다는 것입니다.
다른 방법으로이 lib-Textblob을 파이썬 경로에서 사용할 수 있습니까?