이름, 성 및 주소를 포함한 개인 정보가 포함 된 utf-8로 인코딩 된 postgresdwh에 데이터를로드하고 있습니다. 이 값은 umlauts
과 같은 독일어 문자와 é, â, à
등의 프랑스어 문자를 가질 수 있습니다. 데이터는 Excel 파일에서 데이터 프레임으로 읽은 다음 postgresql 데이터베이스로 푸시됩니다. 이전에 다음 줄을 사용하여 인코딩 오류를 피했습니다. 그래서 이름 값에 대한 예를 들어 : 다른 오류를 제기Python 인코딩 인 이름
df = pd.read_excel(dir_path, encoding='utf-8-sig')
df['fname'] = df['fname'].apply(lambda x: x.encode('windows-1252'))
프랑스어 문자 :
df['fname'] = df['fname'].apply(lambda x: x.encode('utf-8-sig'))
:
DataError('(psycopg2.DataError) invalid byte sequence for encoding "UTF8": 0xe9 0x20 0x20
나는에 인코딩을 변경했습니다 그러나 스크립트를 그대로두면 독일어 문자로 값이로드되지 않습니다. 나는 Wester-European 언어에 windows-1252
이 사용되었다고 생각하고 모든 특수 문자를 처리 할 수 있어야합니다. 이러한 모든 언어에 적용 할 대체 인코딩이 있습니까? 또는 처리 된 값을 기반으로 인코딩을 변경해야합니까?
** 해당 ** 코드 줄을 ** DataError (** ** 읽기, [최소, 완전하고 검증 가능한 예제 작성 방법] [1]에 표시하고 이에 따라 질문을 편집하여 질문을 편집하십시오. [1] : https://stackoverflow.com/help/mcve – stovfl