Eclipse를 구성하여 Spark 및 Python으로 개발했습니다. 구성 : 1. 파이썬 인터프리터가있는 PyDev 2. 스파크 파이썬 소스가있는 PyDev 3. 스파크 환경 변수가있는 PyDev.Eclipse (PyDev)에 py4j.protocol이라는 모듈이 없습니다.
이 내 라이브러리 구성입니다 :
그리고 이것은 내 환경 구성입니다 :
내가 CompensationStudy라는 이름의 프로젝트를 생성하고 내가 작은 예제를 실행하려면 및 모든 것이 원활하게 진행될 수 있도록하십시오.
이
내 코드입니다 :from pyspark import SparkConf, SparkContext
import os
sparkConf = SparkConf().setAppName("WordCounts").setMaster("local")
sc = SparkContext(conf = sparkConf)
textFile = sc.textFile(os.environ["SPARK_HOME"] + "/README.md")
wordCounts = textFile.flatMap(lambda line: line.split()).map(lambda word: (word, 1)).reduceByKey(lambda a, b: a+b)
for wc in wordCounts.collect(): print wc
하지만이 오류가있어 : ImportError를 : 아니오 모듈의 이름 py4j.protocol
Logicly 포함 PySpark의 라이브러리 의존성을 모두, Py4J는 Spark Python 소스로 PyDev를 구성 할 때 자동으로 가져옵니다. 그래서, 여기에 무슨 문제가 있습니까? 내 log4j.properties 파일에 문제가 있습니까? 제발 도와주세요!