2012-08-30 3 views
1

PDF에서 텍스트를 추출하려고합니다. 나는 고스트 함께 일하고 있어요하지만 난Ghostscript로 PDF에서 텍스트 추출 - 알 수없는 장치 : txtwrite

gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite mypdf.pdf

아래의 명령을 실행할 때 오류가 발생합니다. 이 아래에.

Unknown device: txtwrite 
Unrecoverable error: undefined in .uninstallpagedevice 
Operand stack: 
      defaultdevice 

어떤 아이디어입니까? 기본 ghostscript 장치를 txtwrite하지 않습니까?

gs -v

GPL Ghostscript 8.70 (2009-07-31) 

의 출력과 해당 하나 CentOS release 5.8 (Final) OS 버전이다.

+1

[PDF TEXT Extraction] (http://stackoverflow.com/questions/6187250/pdf-text-extraction)을 참조하십시오. GS 버전은 txtwrite 장치를 지원하지 않는다고 생각합니다. – valex

답변

6

올바르게 기억하면 txtwrite 장치가 9.05에서 Ghostscript로 도입되었습니다 (현재 버전은 9.06 임). 8.70은 실제로 상당히 오래되었고 많이이 장치를 포함하기에는 너무 오래되었습니다.

최신 버전으로 업그레이드하십시오.