2017-11-07 16 views
0

read_csv는 Initializing from file failedlatin-1, utf-8 andISO-8859-1을 사용하여이 오류를 반환합니다.pandas.read_csv의 표준 문자 인코딩

from pandas import * 

df = dict(A=[1,2,3],B=['abc','efg','hig'],C=[100,200,300]) 
df = DataFrame(df) 
df 

    A B C 
0 1 abc 100 
1 2 efg 200 
2 3 hig 300 

나는 다음과 같은 독일의 문자로 쓴 :

df.to_csv('Lück.txt', sep='\t', encoding ='utf-8', index=False) 

과이 방법으로 그것을 가져 오기 실패 :

read_csv('Lück.txt', sep='\t', encoding = 'utf-8') 

을 감지하는 개미 방법이 모든 경우 후 특별한 독일어 문자 나는 그것을 대체 할 것이다.

P. 이 문제의 게시물 수가 많았지 만 그 중 누구도 내 질문과 일치하지 않으며 표준 문자 디코딩/인코딩에 만족스럽지 않습니다. 감사합니다.

+0

'Lück'은 변수입니까? –

+0

실제로 그것은 이름 목록에 있으며 변수가 특수 독일어 문자에 도달하면 문제가 발생하지만 예를 들어 문자열을 직접 작성했습니다. – Hamidreza

+0

목록과 문자열을 연결할 수 없습니다. –

답변

1

가능성은 근본 원인이 독일어 움라우트가 아니라 .csv 파일 내의 하나 이상의 "이상한"whitespace 문자입니다. 특히 .csv 파일을 copy/paste operation to excel으로 미리 수정 한 경우에 발생합니다. ,

#!/usr/bin/env python 
# -*- coding: utf-8 -* 

둘째 here을 요약로 .CSV 파일, 이상한 whitespaace 캐릭터의 모든 종류를 포함하지 않는 것을 확인하십시오

첫째,이 같은 파이썬 스크립트를 시작합니다.

+0

문제가 해결되지 않더라도 감사드립니다. 이 파일은 원래'xlsx' 파일에서 추출 된 데이터로 생성 되었기 때문에 읽기/쓰기 작업으로 인해 발생할 수 있습니다. – Hamidreza