2013-03-05 4 views
0

내 임무는 대부분의 수신자가 HTML로 읽을 이메일을 보내는 것입니다. HTML을 읽을 수 없거나 선택할 수없는 사람들을 위해 MIME 텍스트/일반 대체물이 포함될 것입니다.multipart/alternative text/plain에 사용할 문자셋은 무엇입니까?

HTML은 영어로되어 있으며 Latin-1 Supplement 및 General Punctuation의 문자가 있으므로 US-ASCII 또는 ISO-8859-1은 모두를 유지하지 않습니다. 인코딩하기 전에 문자를 대체하여 완화 할 수 있습니다.

제 질문은 text/plain 부분에 사용할 문자셋입니까? US-ASCII, ISO-8859-1 또는 UTF-8. 관련 질문은 텍스트 기반 이메일 클라이언트가 아직 사용 중인지, 그리고 이들 문자셋을 지원합니까?

답변

1

텍스트 기반 이메일 클라이언트가 문자셋을 얼마나 잘 읽었는지에 대한 답변이 없었기 때문에 일반적인 이메일 발신자가 대체 텍스트를 인코딩하는 방법을 살펴 보았습니다.

GMail과 Outlook (2007)은 모두 콘텐츠를 나타낼 수있는 가장 작은 문자 집합을 선택합니다. 즉, 텍스트가 단순한 경우 US-ASCII를 사용하고 유럽 문자가있는 경우 ISO-8859- * 또는 문자가 많은 경우 UTF-8을 사용합니다.

Outlook이 내 테스트 중 하나에서 버그가있었습니다. 나는 General Punctuation을 입력했다. Outlook은 WINDOWS-1252를 사용하여 인코딩했지만 ISO-8859-1로 태그를 지정합니다.

의사 코드의 질문에 대한 답변은

for charset in us-ascii, iso-8859-1, utf-8 
    if encode(text, charset) 
     break 

캐릭터 세트의 목록은 내가 기대하고 입력에 적합하다.