scikit-learn 패키지의 최신 버전에서 BRF (Balanced Random Forest) 구현이 있는지 궁금합니다. BRF는 불균형 한 데이터의 경우에 사용됩니다. 그것은 정상적인 RF로 작동하지만 각 부트 스트랩 반복에 대해 언더 샘플링으로 보급 클래스의 균형을 맞 춥니 다. 예를 들어, 두 개의 클래스 N0 = 100 및 N1 = 30 개의 인스턴스가 주어진다면 무작위 샘플링마다 첫 번째 클래스에서 30 개의 인스턴스와 두 번째 클래스에서 동일한 양의 인스턴스가 그려집니다 (즉, 대체). 균형 잡힌 데이터 세트. 자세한 내용은 please refer to this paper.scikit-learn (python)의 균형 임의의 숲
RandomForestClassifier()에는 'balanced'로 설정할 수있는 'class_weight ='매개 변수가 있지만 부트 스랩 된 학습 샘플의 다운 샘플링과 관련이 있는지 잘 모르겠습니다.
솔루션을 찾았습니까? – oliversm
@oliversm, 불행히도 아닙니다. 나는이 문제를 떠났다. 아마도 scikit learn forum에서 문제를 열어 솔루션을 제안해야합니다. 그게 좋을거야. –
Brieman이 제안한 방법은 이미 Scikit에서 제공하는 것을 사용하여 구현하기 쉽습니다. 간과 된 것 같지만 수치 스럽습니다. – oliversm