-1
두 클래스 (+1
, -1
)가있는 불균형 데이터 세트가 있습니다. 긍정적 인 것은 데이터 세트의 7 %에 불과합니다.불균형 데이터 세트의 샘플링 비율
Desicion Trees를 사용하여 분류하고 싶습니다. 긍정적
- 같은 사이즈 : 나는에 네거티브를 다운 샘플링 노력했다.
나는 거의 동일한 정밀도를 얻었지만, 긍정적 인 리콜은 첫 번째 샘플 (네거티브는 포지티브와 동일한 크기)에서 훨씬 더 좋았다. 그러나 나는이 샘플링에 대해 나쁘지 않은 것을 여기에서 놓치고 있다고 느낍니다.