2017-09-13 8 views
0

데이터 세트에 누락 된 데이터를 채우려하고 있습니다. 멘토는 파이썬에서 특히 FICE Implee 패키지를 사용하도록 권장했으며 특히 MICE 알고리즘을 사용하도록 권장했습니다. 우선, MICE에 대해 읽은 것처럼 누락 된 데이터가 무작위가 아닌 경우 (이는 누락 된 데이터가 특정 국가/연도에있을 가능성이 높기 때문에 의심 스럽습니다) 가난한 옵션이라고 분명히 말합니다. 그럼 다른 알고리즘을 추천하는 사람이 있습니까? (제 프로젝트는 세계 은행 성별 통계 데이터를 기반으로합니다).Python의 공상 임프린트에서 MICE 알고리즘을 사용할 때 TypeError가 발생했습니다.

기술적 문제 : 내 dataframe에이 코드를 실행 :

filled = MICE().complete(dfvars) 

을하지만이 오류가있어, 나의 멘토는 그것에 대해 무엇을 모르고있다, 나는 다른 포럼 논의 발견하지 않았습니다 모든 파이썬에서 MICE :

TypeError: ufunc 'isnan' not supported for the input types, and the inputs could not be safely coerced to any supported types according to the casting rule ''safe'' 
+0

여기에는 두 가지 질문이 있습니다. 하나만 질문하도록 편집하십시오. – blueCat

답변

0

이 오류는 MICE이 데이터 세트는 범주 데이터를 포함하는 경우, 숫자 데이터를 전가하는 데 사용되기 때문에 발생하지만 당신은 당신이 dataframe의 단지 숫자 열을 사용한다 숫자 데이터를 전가하고자한다 . 범주 형 데이터가 누락 된 경우 다른 알고리즘을 사용해야합니다.