그것은 가장 좋은 것은 아닌 그 변수를 제거하고 오직 작은 data.frame에 대한 cor
을 계산하는 것이 좋습니다 범주 형 데이터와 연속 형 데이터간에 동일한 상관 관계 (또는 공분산) 계산을 사용합니다. 범주 형 데이터의 경우 연속 데이터와 스피어 만 상관 관계에 피어슨 상관 관계를 사용해야합니다. 이 두 가지 방법은 경우에 따라 유사한 결과를 나타낼 수 있습니다. 공분산 시도에 대한
:
cov(data_set,method='spearman')
또는 데이터 유형에 따라 선택 할 방법에 따라
cov(data_set,method='pearson') #this is the default
.
상관 관계는 cov()
함수를 cor()
으로 바꿉니다.
gender <- as.numeric(gender)
UPDATE :
그냥 당신이 아마해야한다 생각 당신이 올바른 방법으로 상관 관계를 계산하고 있는지 확인하기 위해
당신은 요구 사항이 요인 변수는 숫자 사전에 변환 할 모든 변수를 하나의 유형 즉 모든 연속 또는 모든 범주로 변환하십시오. 일반적인 방법은 연속 데이터를 범주 형으로 저장하는 것입니다 (예를 들어 정보 가치를 잃을 수도 있지만 일반적으로 원하는 것을 얻을 수 있습니다). 그런 다음 spearman 상관/공분산 행렬을 사용하십시오. 이 방법을 사용하면 적어도 계산이 일관되고 cov()
또는 cor()
을, 나는 믿지 않는다 'cov'를 사용합니다 (method ='spearma n')가 올바르지 않습니다. 스피어 맨 상관 관계는 연속적이고 순서적인 데이터를위한 것이며, 성별은 이들 중 하나에 속하지 않습니다! – Suren