데이터 세트에서 특이 값을 제거하는 대신, 특이 값을 갖는 행만으로 구성된 새 데이터 프레임을 만들려고합니다.대용량 데이터 세트의 특이 값 데이터 프레임 만들기
나는 다른 그룹의 평균과 표준 편차를 데이터 세트의 끝으로 컬럼 바인드 할 수있었습니다. 이제 외계인 데이터 테이블을 생성하기 위해이 코드를 시도했습니다.
Outliers <- Sample[((Sample$x - Sample$Averages)/Sample$StDevs) > 2.00,]
이 프로세스는 실행되지만 이상 치를위한 빈 테이블을 생성합니다. 데이터의 일부 값을 테스트하여 이상 치가 존재하는지 확인했습니다. 행을 지정하면 위의 계산은 실제로 부울 인수를 생성합니다. 내가 문제가있는 테이블에서 이러한 이상 치를 수집하려고 할 때입니다. 나는 또한 outliers를 data.frame 또는 data.table로 초기화하려고 시도했지만 여기서도 실패했다 (아마 R에 익숙하지 않기 때문에).
예 : 내가
((Sample$x[3] - Sample$Averages[3])/Sample$StDevs[3]) > 2
을 실행하면 는 TRUE를 반환합니다. 이것은 좋다. 그렇다면이 조건이 참인 Sample의 모든 항목을 유지하기 만하면 왜 비어있는 테이블을 얻을 수 있습니까? 나는 이것이 어려운 문제라고 생각하지 않지만, 내 삶을 위해 그것이 작동하도록 할 수는 없다.
제안 사항? 미리 감사드립니다!
'str (Sample)'결과를 게시하지 않으면 오류의 원인을 판별 할 수 없습니다. 더 많은 코드와 데이터를 게시하십시오. –
모든 데이터는 비공개입니다. 그러나, 나는 내가 시도한 것을 더 설명하려고 편집을 추가 할 것이다. – arg3334684
아마 가장 간단한 내 질문입니다 : 데이터 프레임을 얼마나 많은 행이 있는지를 모른 채 초기화하면 어떻게됩니까 ('Sample'와 같은 양의 열을 가짐). – arg3334684