대상 인코딩 (CP 1047)에서 지원되지 않는 문자가있는 문자열을 인코딩하려고합니다.유니 코드 문자를 유사한 EBCDIC 1047 문자에 자동으로 매핑합니다.
해당 문자를 cp1047에 해당하는 표준/공통/쉬운 방법으로 매핑 할 수 있습니까?
예를 들어, 텍스트에는 멋진 큰 따옴표 문자 (”
)가 있고 곧은 큰 따옴표 ("
)로 변환하고 싶습니다.
물론 내 코드에서 바꿀 수는 있지만 더 나은 방법일까요? 내가 알지 못하는 오픈 소스 도구 또는 API가 있습니까?
대다수의 유니 코드 문자는 동등하지 않습니다. – SLaks
"equivalent"를 정의하십시오. –
이 질문은 괜찮은보고 변환 테이블이 웹 페이지를 가리키는 http://stackoverflow.com/questions/4808967/replacing-unicode-punctuation-with-ascii-approximations http://lexsrv3.nlm.nih.gov/LexSysGroup /Projects/lvg/current/docs/designDoc/UDF/unicode/DefaultTables/symbolTable.html – msandiford