파이썬 ftfy 라이브러리를 사용하여 인코딩 유형이 혼합 된 텍스트를 읽으려고합니다. 이 라이브러리는 텍스트 즉 ftfy를 사용하여 두 가지 인코딩 유형이있는 텍스트 읽기
>>> print(ftfy.fix_text('ünicode'))
ünicode
혼합하지 않을 때 좋은 결과를 제공하지만 텍스트가 혼합 된 경우,이 즉
>>> print(ftfy.fix_text('Hi to ℙℽ☂ℌϕℿ ünicode'))
ℙℽ☂ℌϕℿ ünicode
같은이 라이브러리는 처리 할 수없는이 뭔가가있어? 혼합 된 인코딩 유형으로 텍스트를 읽을 수있는 방법이 있습니까? 또한 나는 파이썬과 유니 코드에 대해 읽지 만, 텍스트가 다른 인코딩 유형을 가질 때 어떻게 대처할 좋은 예제를 찾지 못했습니다.
감사합니다! – lenz
네, 유용한 라이브러리 같아요. – ShadoW