안녕하세요 저는 R 스튜디오를 사용하여 데이터 세트에서 5000 배 미만으로 나타나는 와인의 종류를 걸러냅니다. 나는 아직도 다른 632 개 값을 가져 얼마나 많은 수준 보려고하지만 때값을 제거하기 위해 setD를 사용하여 R에 서브 세트하기
#create new data frame with varities greater than 5000
wineVar <- setDT(wineNew)[, if(.N > 5000) .SD, by = variety]
#list the unique varieties to show theres only 5
unique(wineVar$variety)
-
나는 아래의 기능을 실행할 수있다.
[1] Cabernet Sauvignon Pinot Noir Chardonnay
[4] Bordeaux-style Red Blend Red Blend
632 Levels: Žilavka Agiorgitiko Aglianico Aidani Airen Albana AlbarÃn ... Zweigelt
내 훈련 세트와 함께 문제를 일으키는로 완전히 이들을 제거 할 수있는 방법이 있나요 - 아직 설정 훈련이 값을 볼 수 있지만, 떨어 품종에 대한 데이터가없는 즉.
그냥 리팩터링하십시오. 'wineVar $ variety <- factor (wineVar $ variety)' – Eric