동일한 크기가 아닌 두 개의 데이터 세트가 있습니다. 나는 보고서에 들어가는 그래프에서 잡음을 제거하기 위해 B에 있지 않은 A의 값을 자르고 그 반대도 마찬가지입니다. (이 데이터를 영구적으로 삭제되지 않는, 걱정하지 마세요!)값 벡터를 기반으로 R의 데이터 프레임에서 행을 서브 세트화할 수 있습니까?
나는 다음과 같은 읽고 :
- Selecting columns in R data frame based on those *not* in a vector
- http://www.ats.ucla.edu/stat/r/faq/subset_R.htm
- How to combine multiple conditions to subset a data-frame using "OR"?
하지만 ' 아직도이 일을 올바르게 할 수는 없습니다. 내 코드는 다음과 같습니다.
bg2011missingFromBeg <- setdiff(x=eg2011$ID, y=bg2011$ID)
#attempt 1
eg2011cleaned <- subset(eg2011, ID != bg2011missingFromBeg)
#attempt 2
eg2011cleaned <- eg2011[!eg2011$ID %in% bg2011missingFromBeg]
첫 번째 시도는 결과 setdiff 벡터의 첫 번째 값을 제거합니다. 두 번째 시도 수율 및 다루기 힘든 오류 :
Error in `[.data.frame`(eg2012, !eg2012$ID %in% bg2012missingFromBeg)
: undefined columns selected
'병합'을 시도 했습니까? – A5C1D2H2I1M1N2O1R2T1
여기서 '병합'이 적절하지 않다고 생각합니다. 데이터 세트를 결합하는 것을 원하지 않습니다. – Zelbinian
아니요, '병합'이 적절하다고 생각합니다. 내부 조인은 A와 B 둘 다에있는 행만 제공합니다. 병합이 불필요한 것을 추가하면 결과 열을 부분 집합 할 수 있습니다. – joran