데이터 세트가 있고 Weka NaiveBayes 분류자를 사용하여 분류를하고 있습니다. 나는 14 가지 속성을 가지고 있는데 그 중 일부는 명목이다.Weka의 공칭 속성 누락 값
이러한 속성 중 하나에서만 누락 된 값이 있습니다. 내가 지금까지 한 것은 잃어버린 값으로 남겨 두었고, Weka가 자동으로 그 값을 대체한다는 것입니다. (질문은 here에 관한 것입니다).
즉,이 특성의 값은 내 기능 파일에서 비어 있으며 ARFF 파일을 만들 때 "?" 두 쉼표 사이.
이제 두 가지 가능성이 있습니다. 1) Weka가 자동으로 채워지도록하십시오. 2) "NULL"로 바꿉니다.
문제는 첫 번째 경우 분류기가 더 잘 작동한다는 것입니다. Weka가 그들을 대신 할 수 있는지 궁금합니다. 아니면 두 번째 접근법을 사용해야합니까?
"언제"Weka가 누락 된 값을 대체하도록해야합니까? 그리고 그렇지 않을 때?
한편, 값이 누락 된 기능은 단어의 WordNet supersense을 나타내며 비어있는 경우, 예를 들어 전치사 또는 WH 질문을 의미합니다. 사전에
감사합니다,