, 우리는 훈련 알고리즘없이 var stages: Array[org.apache.spark.ml.PipelineStage] = index_transformers :+ assembler
val pipeline = new Pipeline().setStages(stages)
를 파이프 라인을 설정하는 데 사용하고 우리 후 훈련 알고리즘과 ML 파이프 라인에
저는 adult dataset으로 Spark와 Scala에서 실행중인 예제를 얻으려고했습니다. scala 2.11.8 및 spark 1.6.1을 사용합니다. 문제는 (지금은) 내가 이것을 가지고 지금까지 .. 모든 ML 알고리즘이 일을 할 수있는 점화하기 전에 숫자로 인코딩 할 필요가있는 데이터 집합의 범주 기능의 양에 거짓말 : import org.apa
스파크 버전 : 1.6.1 는 최근 DataFrame 기반 ml의 모델로 이동합니다 우리의 Word2Vec 코드를 리팩토링, 그러나 나는 직렬화 및 로컬 모델을로드에 문제가 있습니다. 내가 할 수 성공적입니다 : 가 dataframe를 장착하고 모델을 만들 수 있습니다. 동의어를 검색하십시오. 모델을 로컬로 직렬화하려고하면 벡터가 직렬화되지 않으므로 파일