나는이 문제에 대해 내 머리를 너무 바짝 붙였습니다.다른 변수 내에서 하나의 변수를 대체하지 않고 무작위로 샘플링 : {plyr} 패키지에서 ddply() functin 사용 - R
개체 (항목)와 관계없이 다른 변수 (위치) 내에서 하나의 변수 (속성)를 치환하려고하는 데이터 세트가 있습니다. 여기
ddply(data,.(Total,ID_FIELD),sample)
: 나는 다음과 같은 코드를 제출,
ID_FIELD SPCD Total
1177 833 428.286591
11383 691 1175.846712
24081 316 137.042979
11383 318 177.335481
1177 71 166.629921
24081 110 1170.012216
1177 12 8.379811
30284 541 585.039300
24081 746 188.808428
24081 531 196.142482
1177 111 47.258113
1177 12 198.443376
11383 827 16.095224
은 R 버전 3.2.0과 함께 plyr
패키지에 ddply()
기능을 사용 :
다음은 데이터의 조각이다 ID_FIELD
(위치) 내의 SPCD
(항목)에 걸쳐 Total
(특성)을 바꿔서 ddply()
코드를 두 번 연속 실행하면 결과는 befor와 완전히 동일합니다. e, 내가 원하는 바가 아니다. 이 과정을 각 기능 실행시 무작위로 (즉, 의 각 제출 Total
의 새 셔플) 싶습니다.
수행 방법에 대한 단서가 있습니까? 응용 프로그램이 대형 데이터 세트를 사용하는 경우 신속한 프로세스도 만족할 것입니다. 나는 지혜롭게 끝나고있다.
감사합니다.
당신은 잘못된 필드에 치환하는 것입니다. 업데이트 된 답변보기 –
이 코드를 제공해 주셔서 감사합니다. 그러나 문제는 해결되지 않습니다. 이 코드는 행 순서에 따라 관측 순서를 뒤섞으며 "ddply (...)"또는 "data %> % ..."행을 제출할 때마다 동일한 순서로 뒤섞습니다. 위에서 제공 한 데이터를 살펴보면 IDDFIELD 내에서 SPCD에 걸친 Total의 값을 임의로 섞을 수 있습니다 (무작위로). 예를 들어 ID_FIELD (11383) 내의 Total (1175.847,16.095 및 177.335) 값은 매번 SPCD (691, 318 및 827) 사이를 뒤섞습니다. 이것으로 문제가 명확 해지기를 바랍니다. – Andrew
잘못된 필드에서 대체 대상입니다. 업데이트 된 답변보기 –