파이썬에서 인코딩에 관한 또 다른 질문은 제 생각입니다. 나는이 프로그램을 가지고있다 :파이썬 디코딩 및 인코딩, 요소 목록 utf-8
regex = re.compile(ur'\b[sw]\w+', flags= re.U | re.I)
ergebnisliste = []
for line in fileobject:
print str(line)
erg = regex.findall(line)
ergebnisliste = ergebnisliste + erg
ergebnislistesortiert = sorted(ergebnisliste, key=lambda x: len(x))
print ergebnislistesortiert
fileobject.close()
나는 s 또는 w로 시작하는 단어를 찾기 위해 텍스트 파일을 찾고있다. 내 "ergebnislistesortiert"정렬 된 결과 목록입니다. I는 결과리스트를 출력하고, 부호화에 문제가 발생한 appers 것이다
[ '이므로', 'WER', 'SP의 \의 XC3']
'SP의 \ xc3 '은 spät으로 인쇄해야합니다. 여기서 뭐가 잘못 됐니? 왜 목록 요소는 utf-8입니까?
그리고 어떻게 "spät"를 인쇄 할 수있는 올바른 디코딩을 할 수 있습니까?
고마워요!