나는 두 개의 스플릿과 무작위 포리스트 분류기를 사용하여 scikit learn의 데이터 세트를 가지고 있습니다.Scickit-learn RandomForestClassifier의 predict_proba 출력물
나는 87 개의 클래스와 344 개의 샘플을 가지고 있습니다. predict_proba
의 출력은 대개의 경우 3 차원 배열 (87, 344, 2)
입니다 (실제로는 list
은 87 numpy.ndarray
s이고 (344, 2)
요소입니다).
때때로 훈련 및 테스트를 위해 샘플의 다른 하위 집합을 선택하면 2 차원 배열 (87, 344)
만 표시됩니다 (어떤 경우에는 해결할 수 없지만).
내 두 가지 질문은 다음과 같습니다
- 이러한 차원은 무엇을 상징 하는가? ROC AUC 점수를 얻으려고 노력했는데 출력의 절반을 가져 가야합니다 (즉,
(87, 344, 2)[:,:,1]
, 트랜스 포즈 한 후 본질적으로 내 진실 (roc_auc_score(ground_truth, output_of_predict_proba[:,:,1].T)
)과 비교하십시오. 그러나 실제로 그것이 무엇인지 이해하지 못합니다. 의미한다. - 왜? 나는 그것이 3 차원 배열을 반환하는 경우에이 2D 하나.