2009-12-12 3 views

답변

1

이렇게하려면 많은 도구가 있습니다. "인코딩 감지"에 대한 웹 검색을 시도하십시오. 유니 코드 (ICU)에 대한

  • Internationalizations 수업 시작하기에 좋은 장소입니다 : 여기 내가 찾은 도구의 일부입니다. 특히 해당 페이지의 Character Set Detection을 참조하십시오.

  • Chardet은 파일 의 인코딩을 추측하는 Python 모듈입니다.

  • * 표시 괜찬아 명령 줄 도구를이 파일 형식을 감지 파일을 chardet.feedparser.org 볼 수 있지만 파일에 언급 된 경우도 인코딩을 감지 할 수있다 (예를 들어, 파일의 MIME 타입의 표기가있을 경우). 참조 man file

  • 펄은 인코딩 ::인코딩을 감지 :: 맞춰 모듈.

  • 누군가가 StackOverflow에서 비슷한 질문을했습니다. 질문 : PHP : 인코딩을 감지하고 모든 것을 UTF-8으로 만드십시오. 이는 인터넷에서 파일을 가져 오는 것과 PHP를 사용하는 것과 관련이 있지만 명령 행 PHP 스크립트를 작성할 수 있습니다.

참고는 ICU 페이지는 문자 집합 감지에 대해 말한다 아니라 무엇을 "문자 집합 감지은 ... 기껏 통계 및 휴리스틱을 사용하여 부정확 한 동작을 ...."내 경험에 문제 도메인 만든다 직업이 얼마나 쉬운지 또는 어려운지에 큰 차이가 있습니다. 파일의 옥텟이 모호한 인코딩 일 수 있음을 잊지 마세요. 예 :은 다양한 인코딩을 사용하여 현명하게 해석됩니다. 그것들은 혼합 인코딩 일 수도 있습니다. 옥텟의 다른 하위 집합은 다른 인코딩으로 해석됩니다. 이것이 내가 항상 할 수있는 명령 줄 도구가 하나도없는 이유입니다.

파일이 하나 뿐이며 알려진 인코딩으로 바꾸려면 텍스트 랭글러 또는 OpenOffice.org와 같은 다양한 인코딩을 사용하여 가져올 수있는 텍스트 편집기로 파일을 여는 것이 트릭입니다. . 먼저 파일을 열고 편집기로 하여금 인코딩을 추측하게하십시오. 결과를 살펴보십시오. 만족스럽지 않은 경우 인코딩을 추측하고 해당 인코딩을 지정하는 편집기로 파일을 열고 결과를 살펴보십시오. 그런 다음 알려진 인코딩으로 저장합니다 (예 : UTF-16.

0

enca를 사용할 수 있습니다. Enca는 인코딩 및 변환을 인코딩하기위한 작은 명령 줄 도구입니다.

다음과 같은 방법으로 데비안/우분투에 설치할 수 있습니다 :

apt-get을

를 사용하려면 ENCA 설치, 단지 전화

ENCA 파일 이름

자세한 내용은 manpage을 참조하십시오. 정보.