2013-06-02 2 views

답변

2

PDF 파일의 첫 번째 페이지를 이미지 형식으로 렌더링 하시겠습니까? 그렇다면 Ghostscript는이를 할 수 있습니다 (Ghostscript, MuPDF 및 기타 유틸리티를 사용하는 ImageMagick도 가능).

첫 번째 페이지가 이고 이미지가 인 경우 실제로 압축을 풀려고한다면이 작업이 더 힘들어지고 PDF 툴킷이 필요합니다. 고스트 스크립트 수 있습니다하지만, 아마도 너무 잔인한, 다시 MuPDF 더 편리 찾을 수 있습니다. pdftk에서 이미지를 추출 할 수있는 막연한 기억이 있습니다. 그러나 나는 틀릴 수도 있습니다. 원하는 경우 Google에서 빠른 검색을하면 도움이됩니다.

1

Poppler /의 xpdf는 pdfimages와 함께 제공 :

Pdfimages는 PDF 형식의 이미지 (PDF)와 같은 휴대용 픽스맵 (PPM)를 파일, 휴대용 비트 맵 (PBM), 또는 JPEG 파일을 저장합니다. Pdfimages는 PDF 파일 PDF 파일을 읽고, 하나 이상의 페이지를 스캔하고, 각 이미지에 대해 하나의 PPM, PBM 또는 JPEG 파일 (image-root-nnn.xxx)을 작성합니다. 여기서 nnn은 이미지 번호이고 xxx는 이미지 유형입니다. (.ppm, .pbm, .jpg).

pdfimages -j -f 1 -l 1 some.pdf subdir/prefix 

이미지는 prefix-0000.jpeg 이름 subdir/, prefix-0001.jpeg에 저장됩니다 :

명령 줄

은 PDF의 1 페이지에서 모든 이미지를 추출하는 것은 이것이다. 가능한 경우 매개 변수는 JPEG 이미지를 가져 오려고 시도합니다. 직접 JPEG 추출이 실패 할 수 있습니다.이 경우 추출 된 이미지는 PPM 또는 PNM으로 저장됩니다 (주목할만한 것은 압축되지 않았기 때문입니다). 필요한 경우 이들은, JPEG 파일로 ImageMagick이의에 의해 변환 할 수 있습니다

convert subdir/prefix-0022.ppm subdir/prefix-0022.jpeg 
0

ABCpdf 당신이 PDF에서 이미지를 추출 할 수 있습니다. 그것은 2 단계 조작입니다. 먼저 문서에 이미지가 나타나는 위치를 식별해야합니다. 그런 다음 내보낼 필요가 있습니다. 내 대답은 ABCpdf를 기반으로 개념을 특징으로 할 수 있도록

당신은이 같은 뭔가가 필요 ...

using (Doc theDoc = new Doc()) { 
    theDoc.Read(theSrc); 
    ImageOperation op = new ImageOperation(theDoc); 
    op.PageContents.AddPages(); 
    ICollection<ImageProperties> images = op.GetImageProperties(); 
    foreach (ImageProperties pl in images) { 
    foreach (ImageRendition plc in pl.Renditions) { 
      ... if plc is a good match 
      plc.PixMap.GetBitmap().Save(@"c:\output.jpg"); 
     } 
    } 
} 

은 내가 ABCpdf의 .NET 소프트웨어 구성 요소에서 작동합니다. 그것은 내가 아는 바로 그 것이다. :-) "