큰 데이터 프레임이 100,000 개의 행으로 구성되어 있으며 데이터의 일반 이름을 기반으로 다른 데이터 프레임의 하위 세트 샘플을 값으로 사용하는 열을 추가하고 싶습니다. 프레임. 그때 colA
및 colB
의 적절한 부분 집합에 대한 sampleDF
의 sample
컬럼의 무작위 표본 인 sample
largeDF
에 새 열을 추가 할다른 데이터 프레임의 서브 세트에서 무작위로 샘플 가져 오기
largeDF <- data.frame(colA = c('a', 'b', 'b', 'a', 'a', 'b'),
colB = c('x', 'y', 'y', 'x', 'y', 'y'),
colC = 1:6)
sampleDF <- data.frame(colA = c('a','a','a','a','b','b','b','b','b','b'),
colB = c('x','x','y','y','x','y','y','y','y','y'),
sample = 1:10)
... 예제와 함께 설명하기가 쉬울 수 있습니다.
는 예를 들어, 첫 번째 행의 값은 a
및 x
이므로 값은 다음의 행 (b
및 y
)는 6, 7, 8, 9 or 10
무작위 샘플 것이다위한 1
또는 2
의 랜덤 표본 일 것이다.
rowA rowB rowC sample
1 a x 1 2
2 b y 2 9
3 b y 3 7
4 a x 4 2
5 a y 5 4
6 b y 6 8
어떤 도움을 주시면 감사하겠습니다 :
그래서 우리는 같은 것을 끝낼 수 있었다!
생각 6, 7. 8. 9. 10} 귀하의 예에서)? – Pop