h2o가 교차 유효성 검사 및 유효성 검사 데이터 집합과 함께 작동하는 방법과 혼동하지 않도록 노력하고 있습니다. 난 그냥 설명하는 데 사용되는 말씨에 혼란 얻고 확신이 gbm_no_val_frame 초기 정지에 대한 검증 프레임 사용은 무엇교차 유효성 검사 및 조기 중지
library(mlbench)
library(h2o)
data(Sonar)
dfh2o = as.h2o(Sonar)
splits=h2o.splitFrame(dfh2o)
train = splits[[1]]
valid = splits[[2]]
gbm_no_val_frame <- h2o.gbm(x = colnames(df), y = "Class", training_frame = train,
nfolds = 5, seed = 1234, ntrees = 4000, stopping_rounds = 5)
gbm_val_frame <- h2o.gbm(x = colnames(df), y = "Class", training_frame = train, validation_frame = valid,
nfolds = 5, seed = 1234, ntrees = 4000, stopping_rounds = 5)
h2o.flow() ### to see the validation frame stopping under models.
? 어떻게 초과 피팅 (overfitting)을 방지하기 위해 이것이 멈 춥니 까?
나는 gbm_val_frame의 작동 방식을 이해하고 있다고 생각합니다. 훈련 된 배/최종 모델이 '유효한'프레임에 부딪 힐 때 점수가 좋아지지 않을 때 오버 피팅을 멈 춥니 다.
그냥 내가 여기있는 모든 의심을 제거 할 ..
죄송합니다 - validation_frame을 제거했지만 nfolds를 유지하면 의미가 있습니다. 여전히 같은 거래요? – runningbirds
@runningbirds 우리는 교차 목적으로 이야기하고 있을지 모르지만 현재 코드에서 validation_frame을 사용하지 않습니다. 일반적으로 nfolds 또는 validation_frame을 사용해야하며 기타를 지정하지 않는 것이 좋습니다. 일반적으로 nfolds와 validation_frame을 모두 사용하면 중복됩니다. –
대런 쿡 - 내 말을 잘 못 알아 듣겠다. 내게 3 분을 준다. – runningbirds