두 개의 그룹으로 여러 변수의 Z- 점수를 계산하려고합니다.Dplyr 돌연변이 Dapply/Lapply로 두 그룹으로 다중 z- 점수를 계산하십시오.
데이터 =의 mtcars
I는 Z-점수 싶어 변수 : 하나 개의 변수 (작업)는 z 점수 계산
vars <- c("mpg", "disp", "hp", "drat", "wt", "qsec")
여기
은 예이다 :mtcars %>% group_by(am, vs) %>% mutate(z_mpg = (mpg - mean(mpg))/sd(mpg))
문제는 "vars"변수를 모두 실행하기 위해 이전 코드에서 dapply 또는 lapply를 실행할 수 없기 때문에 모든 Z 점수를 한꺼번에 가져올 수 있습니다.
z- 스코어링 대신 계정을 사용하면서 데이터 (평균 0, SD 1)를 정규화하는 방법을 알고 있다면 저 또한 도움이 될 것입니다.
감사합니다.
고마워요! @ Jake Kaupp,이 작품! 데이터를 정규화하기 위해 이렇게 사용할 수 있습니까? mtcars %> % group_by (am, vs) %> % mutate_at (.cols = vars, funs (n = (.- 최소 (.))/(최대 (.) - 최소 (.)))) ' – J5H
코드를 작성하는 데 시간이 걸리면 효과가 있는지 알아야합니다! –