2017-12-26 43 views
1

나는 판다를 사용하여 엑셀 파일에서 일부 데이터를 읽었으며 파이썬 사전을 만들기 위해 일부 행 순회를 수행하여 json 파일에 저장했습니다.팬더 DataFrame에서 유니 코드 문자를 변환하거나 디코딩하는 방법은 무엇입니까?

"C V M College of Fine Arts,\u00a0 Vallabh Vidyanagar" 

내가 유니 코드 '\의 u00a0'를 원하고 대신의 디코딩 된 문자 표현을하지 않으려는 위 그림과 같이 :

문제는 내가 JSON 파일 자체에서 유니 코드 문자를 얻고 있다는 것입니다 내 json 파일.

팬더 자체에서 Excel 파일을 읽는 동안 내가이 변환 (또는 필터링 또는 무엇이라고 부름)을 할 수 있습니까? 또는 json.dump()을 사용하여 json 파일에 쓰는 동안이 작업을 수행 할 수있는 방법이 있습니까?

+0

그 문자가 "비 분리 공백"입니다. [wiki] (https://en.wikipedia.org/wiki/Non-breaking_space). – abybaddi009

답변

1

사용 json.dumps(..., ensure_ascii=False) :

foo = "C V M College of Fine Arts,\u00a0 Vallabh Vidyanagar" 

import json 
print(json.dumps({'foo':foo}, ensure_ascii=False)) 

반환 :

{"foo": "C V M College of Fine Arts, Vallabh Vidyanagar"}