2

와인 품질에 관한 UCI 데이터 세트를 작업 중입니다. 여러 분류자를 적용했고 k- 가장 가까운 이웃이 그 중 하나입니다. 5 배 교차 유효성 검사를 사용하여 가장 가까운 이웃에 대한 k의 정확한 값을 찾는 방법이 있는지 궁금합니다. 그렇다면 어떻게 적용 할 수 있습니까? 그리고 어떻게 5 배 CV를 사용하여 의사 결정 트리의 깊이를 얻을 수 있습니까?교차 검증을 사용하여 k- nearest-neighbor 분류 자에 대해 k의 올바른 값을 찾습니다.

감사합니다.

답변

0

여기서 와인 품질 모델에서 가장 낮은 오차를 나타내는 k 값을 가정합니다.

좋은 k는 데이터에 따라 달라질 수 있습니다. 스파 스 데이터는 더 낮은 k를 선호 할 수 있지만 큰 데이터 세트는 더 큰 k에서 잘 작동 할 수 있습니다. 대부분의 작업에서 5와 10 사이의 k는 많은 경우에 문제가 발생했을 때 상당히 유용합니다.

경우에 따라 시행 착오가 가장 좋은 도구 일 수도 있지만, 모델링 오류의 경향을보기에는 너무 오래 걸리지 않아야합니다.

희망이 도움이됩니다!