2010-06-22 3 views
1

저는 현재 그 기능 중 하나가 Multipart 전자 메일의 HTML 부분을 추출하는 프로그램을 만들고 있습니다.어떤 인코딩 유형이 사용되고 있습니까?

나는 그 작업을 훌륭하게 끝냈지 만 일부 문자에는 인코딩 유형이있어서 내가 알아낼 수없는 것처럼 보입니다.

',' into '=2C' 
';' into '=3B' 
'=' into '=3D' 

또한 임의의 '='를 모든 곳에 넣습니다.

디코더가 있는지 누구에게 알리거나 (또는 ​​이름이 무엇인지)? 저는 코드로 몇 가지를 대체했습니다. 그러나 아직 나타나지 않았기 때문에 내가 누락 된 것이 많을 것입니다. 따라서 모든 것을 대체 할 수 있도록 인코딩 유형을 결정하거나 이미 완료 한 라이브러리를 찾으려합니다.

p.s. 그 이유가 있다면 hotmail 계정에서 이메일을 보내고 있습니다.

+0

메일의 헤더도 추출하면 QP 변형으로 인코딩 할 수도 있습니다. US-ASCII 범위를 벗어나는 문자를 사용하는 경우 – ninjalj

답변

2

이것은 quoted-printable 인코딩이라고합니다.

Microsoft의 기존 QuotedPrintableStream은 내부 용이므로 사용할 수 없습니다. 그러나 Mono 프로젝트 또는 MIME 처리를 다루는 라이브러리 중 하나를 사용할 수 있습니다.

1

quotier-printable 인코딩입니다.이 내용은 RFC에 설명되어 있습니다. 당신이 당신의 일에 너무 많은 시간을 소비하기 전에 경고하겠습니다. 이메일 구문 분석은 실제 골칫거리가 될 수 있으므로 혼자서는 안됩니다. 이 무료 라이브러리를 사용해보십시오. 내가 본 최고의 라이브러리입니다 (많은 파일을 보았습니다). http://www.lumisoft.ee/lswww/download/downloads/Net/

+0

파서에게 감사드립니다. 불행히도 나는 거의 끝났습니다./ –

+0

@Emmanuel Smith ...이 작업에 필요한 노력을 과소 평가할 수 있으므로 거의 완료되었다고 생각합니다. . 다른 전자 메일 문자에 대해 파서를 사용하십시오. – Andrey