2017-03-08 9 views
-1

R 연속, 카테고리 및 날짜 유형을 포함하여 혼합 된 데이터의 상관 관계를 찾는 방법 :내가 다른 유형을 포함하여 데이터가

a <- data.frame(x=c("a","b","b","c","c","c","d","d","e","f"),y=c(1,2,2,2,3,1,4,7,10,2),m=c("a","d","ab","ac","ac","vc","ed","ed","e","df"),n=c(2,1,5,3,3,2,8,10,10,1)) 

사실, 데이터가 아마 날짜를 포함뿐만 아니라, 이것보다 더 복잡를 . 또한 이것은 감독되지 않은 문제입니다. 따라서 여기에는 "클래스 레이블"이 없습니다. 그래서 ANOVA와 같은 방법을 사용할 수 없습니다. 그렇다면 두 열 사이의 상관 관계를 어떻게 찾을 수 있습니까?

P. 내가 psych.c 패키지에 mixed.cor라는 함수를 찾았지만 그것을 사용하는 방법을 이해할 수는 없다.

또한 상관 관계는 단지 선형 관계를 나타냅니다. 모든 열의 중요성을 알고 싶다면 어떤 기능을 사용해야합니까?

답변

2

숫자 변수 (예 : 피어슨 상관 관계)에 대해 대부분의 사람들이 사용하는 상관 관계 측정 값은 범주 데이터에 정의되어 있지 않습니다. 숫자 변수와 범주 형 변수 간의 연관을 측정하려면 ANOVA를 사용할 수 있습니다. 두 개의 범주 형 변수 사이의 연관을 측정하려면 카이 제곱 검정을 사용할 수 있습니다. 카테고리 별 변수 (예 : 낮음, 보통, 높음)가 정렬 된 경우 스피어 만 순위 상관 관계를 사용할 수 있습니다.

+0

고마워요. 이것은 많은 도움이됩니다. –