CrossValidatorModel에서 각 폴드에 대한 계산 된 메트릭에 액세스하려면 어떻게합니까

CrossValidatorModelspark.ml에 각 폴드에 대한 계산 된 메트릭을 얻으려면 어떻게해야합니까? model.avgMetrics을 사용하여 평균 메트릭을 얻을 수 있지만 각 폴드시 원시 결과를 예를 들어 볼 수 있습니다. 결과의 분산?CrossValidatorModel에서 각 폴드에 대한 계산 된 메트릭에 액세스하려면 어떻게합니까

저는 Spark 2.0.0을 사용하고 있습니다. 주름 들어 spark code here

을 공부

출처

2016-08-17 while

,이 같은 반복 자신을 수행 할 수 있습니다

val splits = MLUtils.kFold(dataset.toDF.rdd, $(numFolds), $(seed)) 
    //K-folding operation starting 
    //for each fold you have multiple models created cfm. the paramgrid 
    splits.zipWithIndex.foreach { case ((training, validation), splitIndex) => 
     val trainingDataset = sparkSession.createDataFrame(training, schema).cache() 
     val validationDataset = sparkSession.createDataFrame(validation, schema).cache() 


     val models = est.fit(trainingDataset, epm).asInstanceOf[Seq[Model[_]]] 
     trainingDataset.unpersist() 
     var i = 0 
     while (i < numModels) { 
     val metric = eval.evaluate(models(i).transform(validationDataset, epm(i))) 
     logDebug(s"Got metric $metric for model trained with ${epm(i)}.") 
     metrics(i) += metric 
     i += 1 
     }

이 스칼라에 있지만 아이디어를 매우 명확하게 설명되어 있습니다.

접기 당 결과를 요약 한 this answer을 살펴보십시오. 희망이 도움이됩니다.

출처

2017-06-01 10:35:40

CrossValidatorModel에서 각 폴드에 대한 계산 된 메트릭에 액세스하려면 어떻게합니까

답변

관련 문제