2012-02-21 1 views
4

OCR 출력을 사용할 pdftotext으로 추출하십시오.특정 글꼴에 PDF에서 특정 문자가 포함되어 있는지 확인하는 방법

현재 응용 프로그램에서 OCR 출력 에 비 ASCII 문자가 표시되면 PDF 핵심 글꼴에서 TTF로 전환됩니다. 그러나이 은 핵심 글꼴에 대부분의 서유럽 언어 인 문자가 포함되어 있기 때문에 실제로 해키입니다. TTF가에만 필요 일본어, 그리스어, 러시아어, 등

어떻게 특정 글꼴 ( pdftotext 작품과 그 추출하므로 CMAP 테이블 포함) 특정 문자가 포함되어 있는지 알 수 있습니까?

+0

[Font :: TTF :: Font] (http://search.cpan.org/perldoc?Font::TTF::Font)을 보았습니까? – tchrist

답변