2013-06-17 5 views
1

저는 ANOVA 방법으로 분석하고자하는 시뮬레이션을 실행 중이며 설정하는 방법을 찾는 데 문제가 있습니다.R : Anova 데이터 - 2^5 디자인 (복제 포함)

나는 2^5 요인 설계를 가지고 있으므로 32 가지 가능한 조합을 설명하는 적절한 +/- 값을 사용하여 실험을 32 번 실행합니다.

그러나 각 조합에 대해 ~ 500 개의 복제본도 있습니다. 저는 시뮬레이션을 통해 데이터를 수집하고 있습니다. 그래서 각 조합에 대해 500 개의 다른 실행을했습니다.

이렇게하면 500 개의 응답 값을 갖는 32 개의 벡터가됩니다. 나는 또한 5 개의 다른 요소로 사용되는 +/- 값을 모두 저장하는 디자인 행렬/벡터를 가지고 있습니다.

이것은 복제물이 없으면 비교적 직선적이라고 생각합니다 (요인에 대한 요인 변수를 만들고 모델에 맞지 않는 등). 그러나 복제본을 처리하기 위해 데이터 매트릭스를 어떻게 설정해야하는지 혼란스러워집니다. . 데이터 용으로 500x32 매트릭스를 사용해야합니까? 내 응답의 평균을 취하시겠습니까?

감사

답변

0

행렬에는 6 개의 열과 2^5 * 500 = 16000 개의 행이 있어야합니다. 첫 번째 열은 응답 변수입니다.이 변수는 연속적인 숫자 변수라고 가정합니다. 다음 5 개의 열은 각각 치료를 나타냅니다.

비료와 빛에 대한 식물의 높이 반응을 측정한다고 가정 해보십시오. 비료가 첨가되거나 첨가되지 않고 빛이 높거나 낮습니다. 식물 높이의 경우 귀하의 반응. 첫 번째 처리 열은 "비료"이며 1과 0을 포함합니다. 두 번째 처리 열은 "Light"이며 1과 0을 포함합니다.

"치료"란 "높은 빛"과 "낮은 빛"을 의미하는 것이 아니라 "빛"을 나타내는 것입니다.

aov(Height~Fertilizer*Light, data=Data) 

기본적으로, Data의 첫 번째 행은 "500 개 응답 값의 32 개 벡터"의 열 벡터 것 (즉, rbind() 또는 c() :

분산 분석을 수행하려면, 당신은 같은 것을 할 것 그 32 개의 벡터), 다음 5 개의 열은 "5 개의 다른 요소로 사용되는 모든 +/- 값을 저장하는 디자인 행렬/벡터"여야합니다.

이 설명이 귀하의 생각을 정리하는 데 도움이되기를 바랍니다.

+0

네, 그게 꼭 필요한 것입니다. 나는 복제물을 올바른 방법으로 생각하지 않았습니다. 감사합니다. – Nexbreed

1

당신은 거의 확실 32x500 = 16000 행, 6 열 (공변량 5 및 응답 1)로 데이터 프레임을 원한다.

데이터 프레임은

같이 배치 될 각 공변량 패턴 500 번 복제

x1 x2 x3 x4 x5 y 
0 0 0 0 0 * 
0 0 0 0 0 * 
... 

1 0 0 0 0 * 
1 0 0 0 0 * 
... 

0 1 0 0 0 * 
0 1 0 0 0 * 
... 

.

df <- expand.grid(1:500, x1=0:1, x2=0:1, x3=0:1, x4=0:1, x5=0:1)[, -1] 

으로 응답을 생성 한 다음 측면에 응답을 첨부 할 수 있습니다.