2016-08-26 6 views
3

두 개의 30 개의 샘플 데이터 세트가 있습니다. 조합의 합계가 특정 분포를 따른 샘플 조합을 선택하는 방법은 무엇입니까?

A1 <- c(368.4777, 387.9693, 403.7576, 417.4397, 429.7728, 441.1835, 451.9409, 462.2286, 472.1809, 481.9012, 491.4738, 500.9705, 510.4558, 519.9902, 529.6330, 539.4454, 549.4926, 559.8473, 570.5931, 581.8296, 593.6794, 606.2988, 619.8938, 634.7472, 651.2666, 670.0744, 692.1994, 719.5452, 756.3235, 815.7298) 

B1 <- c(414.2523, 471.8087, 519.1119, 560.4502, 597.9043, 632.6668, 665.5000, 696.9308, 727.3477, 757.0533, 786.2953, 815.2867, 844.2194, 873.2745, 902.6306, 932.4719, 962.9959, 994.4228, 1027.0068, 1061.0519, 1096.9331, 1135.1297, 1176.2765, 1221.2488, 1271.3134, 1328.4178, 1395.8053, 1479.5340, 1593.1899, 1780.2717) 

나는 두 개의 분포를 요약하려면

,

  1. A1+B1 나에게 녹색 점선 밀도 플롯을 제공 할 것입니다.

  2. rowSums(expand.grid(A1, B1)) 푸른 실선 밀도 그림이 나에게 줄 것이다. (모든 가능한 조합들의 30 * 30 = 900)

단, I는 적색 라인 (Target)는 액의 분포가 유사하고 싶다. 즉, A1B1의 조합을 선택하여 조합의 합계를 빨간색 선 농도 분포 (각 값을 한 번만 선택할 수 있음)를 따르도록합니다. 어떻게해야합니까? 대답이 불통해야 할 수 있도록

Target <- c(1691.60, 1041.01, 1581.92, 1392.43, 1806.88, 1788.24, 1838.67, 1953.35, 1253.21, 1791.36, 1644.61, 1425.05, 1218.66, 1596.36, 1305.67, 1031.98, 828.52, 1375.77, 1475.28, 1718.25) 

enter image description here

+0

어떻게 녹색 배포가 파란색보다 훨씬 넓습니까? –

+0

@SeverinPappadeux (A1의 최대 값 + B1의 최대 값)과 (A1의 최소값 + B1의 최소값)와 같이 계산되기 때문에 @SeverinPappadeux입니다. –

+0

동일한 값 (최대 + 최대 및 최소 + 최소)이'expand.grid'에 있어야합니다. 그렇지 않습니까? 파란 선이 왜 여기처럼 보이지 않는지? –

답변

0

나는 확실히 당신의 질문의 마지막 부분을 따르지 않습니다.

A1B1의 조합을 샘플링하려면 샘플 기능을 사용할 수 있습니다. 따라서

s1 = sample(A1) + sample(B1) 
plot(density(s1)) 

대체하지 않고 샘플링입니다. 교체를 원할 경우 sample 기능에 replace=TRUE을 추가하십시오.

+0

@csfillespie 편집 및 답변 해 주셔서 감사합니다! 내 직관은 's1'의 밀도 분포가 빨간색 선이 아니라 파란색 선에 더 가깝다는 것입니다. 's1'을 빨간색 선과 어떻게 비슷하게 만들 수 있습니까 ?? –

+0

plot 명령에서 오타가 발생했습니다. 다시 시도해 볼까요? – csgillespie

+0

예. 나는 그것을 시도했다. 기본적으로, 당신의 방법은 무작위 샘플이기 때문에 시도 할 때 다른 결과를 보여줍니다. 그러나 그것은 여전히 ​​붉은 색이 아닌 청색 선과 같습니다. <[link] (http://imgur.com/Q6uRg67)> 귀하의 방법은 보라색 선입니다. –