2014-11-16 1 views
0

r에 mi 패키지를 사용하여 누락 된 값을 보냄으로써 문제가 발생했습니다.누락 된 값이있는 데이터를 숫자 데이터로로드

r에 데이터를로드 할 때 값이 누락 된 열을 요인 변수로 인식합니다. I 명령

dataset$Income <- as.numeric(dataset$Income) 

와 숫자 변수로 변환하면 내가 원하는

(두 번째 최소 2 등, 등 ... 최소 값이 1 인)와 순서 값의 열을 변환 변수의 원래 값을 유지하면서이 열을 숫자 값으로 변환합니다. 어떻게해야합니까?

편집 : 사람들이 물어 보았으므로 여기에 내 코드와 데이터의 모양이 나와 있습니다.

자료 :

96 GERMANY 6 1960 72480 73 50.24712 NA 0.83034767 0 
97 GERMANY 6 1961 73123 85 48.68375 NA 0.79377610 0 
98 GERMANY 6 1962 73739 98 48.01359 NA 0.70904115 0 
99 GERMANY 6 1963 74340 132 46.93588 NA 0.68753213 0 
100 GERMANY 6 1964 74954 146 47.89413 NA 0.67055298 0 
101 GERMANY 6 1965 75638 160 47.51518 NA 0.64411484 0 
102 GERMANY 6 1966 76206 172 48.46009 NA 0.58274711 0 
103 GERMANY 6 1967 76368 183 48.18423 NA 0.57696055 0 
104 GERMANY 6 1968 76584 194 48.87967 NA 0.64516949 0 
105 GERMANY 6 1969 77143 210 49.36219 NA 0.55475352 0 
106 GERMANY 6 1970 77783 227 49.52712 3,951.00 0.53083969 0 
107 GERMANY 6 1971 78354 242 51.01421 4,282.00 0.51080717 0 
108 GERMANY 6 1972 78717 254 51.02941 4,655.00 0.48773913 0 
109 GERMANY 6 1973 78950 264 50.61033 5,110.00 0.48390087 0 
110 GERMANY 6 1974 78966 270 48.82353 5,561.00 0.56562229 0 
111 GERMANY 6 1975 78682 284 50.50279 6,092.00 0.56846030 0 
112 GERMANY 6 1976 78298 301 49.22833 6,771.00 0.53536154 0 
113 GERMANY 6 1977 78160 321 49.18999 7,479.00 0.55

코드 :

Income <- dataset$Income 

는 NA의이 data.If에 있기 때문에 내가

as.numeric(Income) 
와 숫자로 돌려하려고 나에게 요인 변수를 제공합니다

원래 값을 버리고 열의 순위로 바꿉니다. 누락 된 값을 인식하면서 원래 값을 유지하려고합니다.

+0

누락 된 값과 관측 된 값은 어떻게 표현됩니까? 데이터 세트의 일부 행을 표시 할 수 있습니까? –

+0

아래 Phil의 설명에서 데이터 세트를 링크했습니다. 누락 된 값은 na로 표시됩니다.하지만 na 값을 유지하면서 공백을 남기려 시도했지만. –

답변

0

독일의 모든 데이터 관리자가 알고있는 문제 : NA이있는 열은 콜론이있는 숫자입니다. 그러나 R은 숫자 그룹화가없는 소수점의 영어 스타일 만 알고 있습니다. 따라서이 열은 일반적으로 스케일 된 문자 변수로 취급됩니다.

콜론을 제거하면 수치가 표시됩니다.

그런데 독일에 십진법의 콜론을 쓰더라도 3,951.00과 같은 숫자는 구문 적으로 이해가 가지 않습니다. 심지어 다른 언어로도 이해가되지 않습니다. 국제 번호 구문 these examples을 참조하십시오.