2017-04-26 3 views
0

깊은 학습 모델에 계속 문제가 있습니다. 나는 모델을 rrc 데이터 프레임에 훈련 시켰고, 내가한다면 :H2O (상호 학습)에서 교차 유효성 검사 후 예측 오류 및 응답 열

rrc['preds'] = dp.cross_validation_holdout_predictions().as_data_frame().predict 항상 응답 열과 예측이 잘못 정렬됩니다. 데이터 프레임의 상단에는 정렬되어 있지만 어느 시점에서는 정렬이 잘못되어있는 것처럼 보입니다.이 정렬이 잘못되어 상관 관계가 잘못 계산 된 것으로 계산됩니다. 나는 3 일 넘게 이것을 고치려고 노력했지만 어떻게해야할지 모른다.

나는 H2O 3.10.4.5를 사용하고 있습니다. 모델 자체 :

dp = H2ODeepLearningEstimator(activation = "Tanh", hidden = [10, 10, 10], epochs = 10000, keep_cross_validation_predictions=True, ignored_columns = ['fn', 'pdb_id','pdb_id_chain', 'pdb_id_chain_source', 'source']) dp.train(x = list(set(rrch.col_names) - set(['rmsd_all'])), y ="rmsd_all", training_frame = rrch, fold_column="cv")

편집 : 내가 문제를 찾은 것 같아 (셀 # 58) https://github.com/mmagnus/mmagnus.github.io/blob/master/mq-test.ipynb 내가 rmsd_all 일부 행을 제거하는 rrc3 = rrc3[rrc3.rmsd_all < 10]을 할 경우 (응답 열) 값이 10 점이 넘는 다음이다 나는 rrc3h = h2o.H2OFrame(rrc3)으로 문제를 일으켰습니다. 왜 그래도 모르겠다. 데이터 세트, 40MB https://www.dropbox.com/s/1et38o3xx47jw1m/rasp_rnakb_cv2.csv?dl=0

+0

완전히 재현 할 수있는 예제를 제공하면 디버깅하는 것이 훨씬 더 빠릅니다. 하나 추가 할 수 있습니까? –

+0

해결 :'rrc3.reset_index (inplace = True)'가 작업을 수행합니다! –

+0

잘 알고 있습니다. 티켓을 닫을 수 있도록 답변으로 게시하고 답변을 수락 할 수 있습니까? –

답변

0

해결 : rrc3.reset_index(inplace=True)이 작업을 수행합니다!