2013-02-27 3 views
0

일괄 정규 분포 테스트를 시도하고 있습니다. 나는 각 Employee_ID에서 시간의 분포를 확인하고자일괄 정규 분포 테스트

"Date","Department","Discipline","Employee ID","SumOfBillable Hrs" 
"10/09/2012","D","B",50084.00,8.00 
"10/09/2012","D","C",51870.00,10.00 
"10/09/2012","D","E",50216.00,10.00 
"10/09/2012","D","E",53422.00,9.00 
"10/09/2012","D","E",53765.00,10.00 
"14/01/2013","E","Y",53146.00,9.00 
"14/01/2013","E","Y",53202.00,9.00 
"14/01/2013","E","Y",54470.00,9.00 
"14/01/2013","SITE","0",54525.00,9.00 
"14/02/2013","D","C",51870.00,10.00 
"14/02/2013","D","E",50029.00,8.50 
"14/02/2013","D","E",50216.00,9.00 
"14/02/2013","D","E",53422.00,4.00 

: 같은

내 데이터 보인다.

일괄 처리 방법이 있습니까? 저는 80 세 이상입니다 IDs. 따라서 개별적으로 각각 ID을 가져 와서 설명적인 통계를 작성/작성하는 것은 다소 지루합니다.

감사합니다.

+1

우리가 이해하고 당신은 쉽게 "EMPLOYEE_ID"변수로 "시간"변수를 나눌 수있는 문제 – Pop

+2

에 답하고 기술 통계를 계산하고 그 결과에'lapply'를 사용하여 플롯을 생성하는 데이터의 샘플을 추가 명부. 몇 가지 샘플 데이터를 표시하면보다 구체적인 답변을 얻을 수 있습니다. – A5C1D2H2I1M1N2O1R2T1

+0

다음은 관련성이 있습니다. http://stackoverflow.com/questions/7781798/seeing-if-data-is-normally-distributed-in-r, http://stats.stackexchange.com/questions/2492/is-normality 테스트 - 본질적으로 쓸데없는 – Ben

답변

1

다음과 같이 시작할 수 있습니다. 당신이 뭔가 다른 것을 원하면, 당신이 구체적으로하고 싶은 것에 대한 더 많은 정보를 제공해야 할 것입니다.

data <- read.table(header=T, sep=",", 
text='"Date","Department","Discipline","Employee ID","SumOfBillable Hrs" 
"10/09/2012","D","B",50084.00,8.00 
"10/09/2012","D","C",51870.00,10.00 
"10/09/2012","D","E",50216.00,10.00 
"10/09/2012","D","E",53422.00,9.00 
"10/09/2012","D","E",53765.00,10.00 
"14/01/2013","E","Y",53146.00,9.00 
"14/01/2013","E","Y",53202.00,9.00 
"14/01/2013","E","Y",54470.00,9.00 
"14/01/2013","SITE","0",54525.00,9.00 
"14/02/2013","D","C",51870.00,10.00 
"14/02/2013","D","E",50029.00,8.50 
"14/02/2013","D","E",50216.00,9.00 
"14/02/2013","D","E",53422.00,4.00') 



# Means: 
aggregate(SumOfBillable.Hrs ~ Employee.ID, data=data, FUN=mean) 

# Standard Deviations: 
aggregate(SumOfBillable.Hrs ~ Employee.ID, data=data, FUN=sd) 

# Or a Shapiro normality test: (only works if you have more than 3 observations per Employee.ID 
aggregate(SumOfBillable.Hrs ~ Employee.ID, data=data, FUN=shapiro.test) 
+0

데이터는 CSV 파일에 버려진 MS 액세스 DB에 저장됩니다. 정규 분포도 (Std Dev, Mean)를 얻고 각 고유 직원 ID에 대한 정상 테스트를 실행하고 싶습니다. – KillerSnail