큰 열차 집합에서 임의의 포리스트를해야하지만 더 많은 53 가지 수준의 변수를 사용할 수는 없습니다.요인 변수에서 수준 줄이기
요인 변수 (train$tip
) 줄이기 위해 150 레벨 (KHC, KTF, KGL, ...)이 필요합니다. 몇 번 나타나고 더 많은 수의 레벨을 가진 레벨을 (빠르게) 제거 (또는 53 레벨 만 유지) 할 수 있습니까?
몇 가지 수준이 있거나 더 빠른 방법이 있다고 보는 수준의 이름을 모두 적어 두었습니까?
train <- train[!train$tip == "KTF", ]
'tbl <- table (train $ tip)'을 (를) 사용하고 빈도 '하위 집합 (열 수준 (팁) % % 이름 (tbl [tbl> 50 ]))' – akrun