2017-05-04 6 views
0

좋은 하루, 내 데이터 세트에서 이상 치를 제거 boxplot을 사용하고어떻게

를 상자 그림 사용하여 데이터 세트에 대한 결과 제거 이상 값을 적용합니다 :

outliers <- boxplot(dataset, outline=FALSE); 

이제 이상치 변수가 모든 정보를 가지고 같은 방법 데이터 세트에서 제거 작업을 적용합니까? boxplot이 그 부분을 수행합니까?

boxplot는 이상 값이 outliers$out에 저장되어있는 것으로 간주

+1

[이상한 데이터는 무엇입니까?] (http://www.itl.nist.gov/div898/handbook/prc/section1/prc16.htm) –

답변

1

값을 주셔서 감사합니다.

dataset[!dataset$value %in% outliers$out, ] 

또는 dataset 만 한 열이 있다면 : 그래서, 당신의 datasetvalue라는 이름의 열에서 값이 포함되어 있다고 가정하면 다음과 같이 제거 할 수

dataset[!dataset$value %in% outliers$out, , drop = FALSE] 
0

이 사용할 수 -

x[!x %in% boxplot.stats(x)$out]