다른 표현이 :두 단어가 내가 UTF-8 코딩에 표시된 경우이처럼하는 페르시아어 단어가 ASCII
"خطاب"
나는이 단어의 두 가지 버전을 가지고, UTF-8의 Notepad ++ 모두 위와 같이 표시됩니다. 그때 ANSI 모드에서 그들을 보면 는하지만 참조 :
ïºïºŽï»„ﺧ
와 내가 보는 다른 하나
:خطاب
같은 단어가 ANSI 형식으로 같은 다른 표현이 와서 어떻게? 파이썬에서 PIL을 사용하여 이들을 그릴 때, 결과 중 하나는 정확하고 다른 것은 맞지 않습니다.
감사합니다.
[시스템 설정에 따라 다름] (http://stackoverflow.com/a/701920/847349). ANSI는 Farsi 코드 페이지를 포함하지 않을 수도 있습니다 –
ANSI 인코딩으로 UTF-8 인코딩 파일을 해석하는 경우 물론 가비지 문자가 표시됩니다. "서로 다른 표현이있는"것이 아니라 잘못된 인코딩으로 파일을 해석하는 것입니다. [모든 프로그래머가 절대적으로, 인코딩 작업과 문자 세트에 대해 알기를 바랍니다.] (http : // kunststube.net/encoding /). – deceze
@deceze 링크를 가져 주셔서 감사합니다. 확실히 읽을 것입니다. 그러나 ANSI 인코딩에서도 쓰레기가 보일 것입니다. 둘 다 동일한 쓰레기를 보여서는 안됩니까? – TJ1