WEKA에서 SMOTE 필터를 사용하여 데이터의 균형을 잡습니다.
두 매개 변수 nearestNeighbors
및 percentage
에 대해 의문의 여지가 있습니다.SMOTE 필터와 데이터의 균형을 맞추기 위해 WEKA에서 매개 변수를 설정하는 방법은 무엇입니까?
nearestNeighbors - 사용할 가장 가까운 이웃 수입니다.
백분율 - 생성 할 SMOTE 인스턴스의 백분율.
어떻게 설정해야합니까?
나는 이웃 사람의 수가 그것이 만들 예정인 syntetic 견본의 양이라고 생각했다.
그래서 백분율의 의미는 무엇입니까? 그것은 이웃 사람의 수보다 작거나 같아야합니다, 그렇죠? syntetic 샘플의 비율이 고려됩니까?
예 :
나는 10 개의 이웃과 200 %를 어떻게 배치할까요?
누구나 올바른 사용법을 알려 줄 수 있습니까?
이웃어 = 200 및 백분율 = 300으로 설정하면 이웃수 = 100 및 백분율 = 300 인 동일한 수의 syntetic 샘플을 얻게됩니다. 차이가있을 것인가? 과장 될 건가요? – user3290180