2016-10-07 5 views
3

R에 대해 haven 패키지를 사용하여 user_na=TRUE으로 spss 파일을 읽습니다. 이 파일에는 값 레이블이있는 많은 문자열 변수가 있습니다. R에서 첫 번째 문자열 변수 (SizeofH1)는 속성으로 할당 된 올바른 값 레이블을가집니다. 불행하게도 ... 난이 완벽하게 재현 할 수 있도록이 데이터의 조각을 제공 할 수 있지만, 여기에 내가 PSPPR 헤이븐 : spss 파일을 읽을 때 레이블 및 레이블 이름이 누락되었습니다.

PSPP Data editor

에서 볼 수있는 스크린 샷과 어떤 R에 str() 반환은

$ SizeofH1:Class 'labelled' atomic [1:280109] 3 3 3 3 ... 
..- attr(*, "label")= chr "Size of Household ab 2002" 
..- attr(*, "format.spss")= chr "A30" 
..- attr(*, "labels")= Named chr [1:9] "1" "2" "3" "4" ... 
..- attr(*, "names")= chr [1:9] "4 Persons" "2 Persons" "1 Person 50 years plus" "3 Persons" ... 
$ PROMOTIO: atomic 40 1 40 40 ... 
..- attr(*, "label")= chr "PROMOTION" 
..- attr(*, "format.spss")= chr "A30" 
$ inFMCGfr: atomic 1 1 1 1 ... 
..- attr(*, "label")= chr "in FMCG from2011" 
..- attr(*, "format.spss")= chr "A30" 
$ TRADESEG: atomic 1 1 1 1 ... 
..- attr(*, "label")= chr "TRADE SEGMENT" 
..- attr(*, "format.spss")= chr "A30" 
$ ORGANISA: atomic 111 111 111 111 ... 
..- attr(*, "label")= chr "ORGANISATION" 
..- attr(*, "format.spss")= chr "A30" 
$ NAME : atomic 9 9 9 9 ... 
..- attr(*, "label")= chr "NAME" 
..- attr(*, "format.spss")= chr "A30" 

누군가가이 문제의 원인이 될 수있는 가능성을 알려 주시기 바랍니다.

+0

변수 유형을 문자열에서 숫자로 변경하면 (spss에서)이 경우이 문제가 해결되었습니다. 그러나 첫 번째 열을 올바르게 읽은 이유와 spss 버전에 액세스하지 않고이 문제를 해결하는 방법에 대해서는 아직 확실하지 않습니다. – supersambo

답변

2

가장 좋은 방법은 spss 파일을 CSV로 저장 한 다음 R로 읽는 것입니다. 이전에 직면했으며 일부 문자열이 올바르게 읽히지 않았습니다. 일반적으로 SPSS는 문자열 변수에 대해 매우 똑똑하지 않습니다. 문제에 기여할 수 있습니다.

+0

감사합니다. 이것은 실제로 도움이됩니다. 그러나 SPSS를 사용하지 않고이 문제를 해결할 수있는 방법이 있었으면합니다. – supersambo

+2

spss 라이센스가없는 경우 SPSS와 유사한 오픈 소스 응용 프로그램이 있으며 SAV 파일을 가져 와서 csv로 내보낼 수 있습니다. 여기에서 소프트웨어를 찾을 수 있습니다 : http://www.gnu.org/software/pspp/ 및 가이드 : http://lists.gnu.org/archive/html/pspp-users/2011-11/msg00033 .html – RomRom