이메일 메시지를 파싱하고 인코딩 된 부분을 찾았습니다 : 7bit 어떻게이 부분의 텍스트를 일반 텍스트로 변환 할 수 있습니까? 나는 perl을 사용합니다7bit 텍스트를 일반 텍스트 perl로 변환
-1
A
답변
0
UU-encoded 데이터 (이전 방법) 또는 MIME-encoded이있는 것 같습니다. 이를 처리하기 위해 각각 Convert::UU과 MIME::Base64 CPAN 모듈을 사용할 수 있습니다.
use MIME::Base64::Perl;
my $decoded = decode_base64($encoded);
가 어떻게 차이를 알고 :
는 MIME :: Base64로 (또는 그 순수 펄 구현, MIME :: Base64로 :: 펄)을 사용하려면? 이 base64로 아니라면, 다른 CPAN 모듈이 필요 -
현대 MIME로 인코딩 된 텍스트는 (특히 당신에게 인코딩 기반을 알려줍니다 Content-Transfer-Encoding
헤더뿐만 아니라 MIME로 인코딩의를 알 수 MIME-Version:
헤더에주의를 기울여야 다음과 같습니다 :
MIME-Version: 1.0
Content-Type: multipart/mixed; boundary="frontier"
This is a message with multiple parts in MIME format.
--frontier
Content-Type: text/plain
This is the body of the message.
--frontier
Content-Type: application/octet-stream
Content-Transfer-Encoding: base64
UU 인코딩 된 텍스트 같은 것을 보일 것 : 인코딩 된 데이터는 위의 샘플 중 하나를 다르게 보이는 경우
begin 644 cat.txt
#0V%T
`
end
를 정확한 양식을 게시하시기 바랍니다 그래서 우리는 그것이 무엇인지 결정할 수 있습니다.
1
Content-Transfer-Encoding: 7bit
텍스트가 이미 보통 오래된 ASCII 텍스트 있음을 의미합니다. 변환은 필요하지 않습니다. (글쎄, Content-Type
헤더가 비 ASCII 기반 문자 세트를 나타내지 만, 특히 7 비트 텍스트의 경우 매우 희귀합니다.)
헤더와 다른 것으로 감지합니다. Content-Transfer-Encoding 현재 UU- 인코딩 된 데이터 – GodSon
헤더 란 무엇입니까? – DVK
줄 단위로 메시지를 분석 한 파서를 작성합니다. 내가 경계를 발견했을 때 나는 다음 줄이 머리말임을 안다. 그리고 나는이 라인을 분석한다. – GodSon