긍정적 인 시나리오가 800k 항목의 3 % 만 발생하는 100 가지 특성을 가진 데이터에 대해 BinaryClassifier를 교육합니다. 교육을하는 동안 제외 어 인스턴스뿐만 아니라 긍정도 포함시켜야합니까? 우리는 결과가 단지 바이너리 일 수밖에 없다고 추측합니다. 즉, 모델이 포지티브에 대해 훈련을 받았다면, 약한 매칭은 그것이 부정적이라는 것을 의미합니다.Scikit BinaryClassification 교육 데이터 선택
두 가지를 모두 포함해야하는 경우 팬더 DataFrame의 샘플 방법이 신뢰할 수 있습니까?
감사합니다.
"바이너리 분류기를 훈련하는 경우 교육 데이터 세트에 두 개의 출력이 있어야합니다." 정말로 진실이 아니며 또한 질문이 말하는 것이 아닙니다. 긍정적 인 계급의 확률을 산출하는 것이 일반적입니다. – nnnmmm