2016-09-25 3 views
0

R로 과제를 시작하기 전에이 프로젝트를 실제로 사용해 본적이 없으므로 사과하는 것이 기본입니다.그룹핑 변수로 t-test를 수행

brain은 Excel 데이터 프레임입니다. 그 형식 (40 홀수 행의 일부)는 다음과 같다 :

para1 para2 para3 para4 para5 para6 para7 
FF 133 132 124 118 64.5 816932 

highVAL = ifelse(brain$para2>=130,1, 0) 

highVAL 날 para2로 분류 1과 0들의 벡터를 제공한다. para2> (130) 및 파이썬에서 para2 < (130)

을 가지고 그들, 나는 두 개의 새로운 배열을 만들 것이며이 행 : 나는 두 세트 사이의 평균 para7에 t 테스트를 수행하기 위해 찾고 있어요

값을 추가하고 거기에서 t- 테스트를 수행하십시오. R에서 어떻게 움직일 지 확신하지 못합니다.

답변

2

당신은 생각보다 가깝습니다! 귀하의 highVAL 변수는 brain 데이터 프레임에 새로운 열로 추가해야합니다

brain$highVAL <- brain$FSIQ >= 130 

이 데이터 세트에 참/거짓 열을 추가합니다.

result <- t.test(MRIcount ~ highVAL, data = brain) 
+0

내가 데이터 프레임 (코드를 복용)을 추가 한, 나는 코드를 실행하고 그 라인에 도착하면, 나는 오류가 발생 : 그럼 당신은 t-test의 공식 인터페이스를 사용하여 테스트를 실행할 수 : '$ <- .data.frame'의 오류 ('* tmp *', "highIQ", value = logical (0)) : 대체 행이 0이고 데이터가 40. – wowdavers

+0

재현 가능하지 않고 오류를 진단하는 것은 불가능합니다 예. 질문에 데이터를 제공 할 수 있습니까? 'dput (brain)'을 사용하여 결과를 붙여 넣으십시오. – jdobres

+0

데이터 세트에있는 실제 변수 이름을 반영하여 내 대답을 편집했습니다. 'ifelse'의 사용은 불필요합니다. 왜냐하면 당신이 정말로 필요로하는 것은 논리적 비교 ('highVAL'을 생성하는 라인)에 의해 주어지는 참/거짓 결과입니다. 't.test'에 대한 수식 인터페이스는 기본적으로 "MRIcount"는 종속 변수이고, "highVAL"은 독립 변수이며, 둘 다'brain'에서 찾을 수 있습니다. – jdobres