2017-01-23 3 views
2

일본어 문자 (UTF-8)가 포함 된 텍스트 파일을 입력하는 Python 파일을 작성하고 있는데, 새로운 UTF-8 텍스트 파일에 기록합니다.문자가 줄 끝 부분에 다이아몬드 물음표로 표시됩니다 (Python> Text)

내가 겪고있는 문제는 일본어 문자가 원래 입력 파일의 줄 끝에 나타날 때마다 어떤 이유로 출력 파일에 다이아몬드 물음표가 나오는 것입니다.

행의 끝 부분 앞에있는 인스턴스는 완벽하게 잘 읽고 원래 입력 파일은 행의 끝에 있더라도 완벽하게 읽습니다. 당신이 어떤 코드를 공유하지 않는 것처럼

+0

python 2.7 또는 3.x를 사용합니까? 파이썬 3.x는 유니 코드 지원이 훨씬 뛰어납니다. – Aaron

+0

여기에 대한 설명은 Java에 대한 것이지만 여기서도 마찬가지입니다. http://stackoverflow.com/a/24009294/1530987 – crowchirp

+0

코드 스 니펫을 공유하십시오. – ZdaR

답변

1

나는 당신에게 일반적인 독서의 방법과 같이 codecs 모듈을 사용하여 utf-8 파일을 작성하는 것이 좋습니다 :

# Reading utf-8 encoded file 
with codecs.open("in.txt", "r", encoding="utf-8") as input_data: 
    data = input_data.read() 

# Write utf-8 encoded file 
with codecs.open("out.txt", "w", encoding="utf-8") as output_data: 
    output_data.write(data) 

을 그리고 BTW 나는 지정된 문자 だ과에 그것을 테스트 꽤 괜찮아.