PML (Palm Markup Language) 파일을 수정하려고 할 때 MakeBook에 불평을 유발하는 비 ASCII 문자가 내 테스트 파일에있는 것처럼 나타납니다. 해결책은 PML의 모든 비 ASCII 문자를 제거하는 것입니다.파이썬을 사용하여 확장 된 ascii를 제거하는 방법은 무엇입니까?
그래서 파이썬에서이 문제를 해결하려고 시도에서, 나는 그러나
import unicodedata, fileinput
for line in fileinput.input():
print unicodedata.normalize('NFKD', line).encode('ascii','ignore')
을 가지고,이 라인은 "유니 코드 STR,하지"여야한다는 오류가 발생합니다. 여기에 파일 조각이 있습니다.
\B1a\B \tintense, disordered and often destructive rage†.†.†.\t
이 시점에서 제대로 처리하려면 줄을 제대로 전달하는 방법이 확실하지 않습니다.
당신이 누구의 ASCII 값이 255보다 큰 모든 문자를 필터링 하시겠습니까? –
엄밀히 말하면, 확장 ASCII와 같은 것은 없습니다. ASCII는 0에서 127 사이의 값을 정의합니다. 그보다 높은 값은 임의로 해석 할 수 있습니다. 아마도 * 비 ASCII 문자 *라는 용어를 사용해야합니다. – dreamlax
관련 : 터미널 출력을위한 안전 이스케이프 기능 http://stackoverflow.com/questions/437476/safe-escape-function-for-terminal-output – jfs