PDF 파일로 잡지를 만드는 프로젝트를 만들고 있습니다.하지만 업로드 된 각 잡지는 표지 사진이 있어야하며이 이미지를 PDF에서 JPEG로 추출하여 이미지를 표지 사진.PDF에서 큰 이미지를 감지하고 JPEG 또는 모든 형식으로 추출하는 방법은 무엇입니까?
Ghostscript 또는 다른 명령 줄 도구를 사용하여 수행 할 방법이 있습니까?
PDF 파일로 잡지를 만드는 프로젝트를 만들고 있습니다.하지만 업로드 된 각 잡지는 표지 사진이 있어야하며이 이미지를 PDF에서 JPEG로 추출하여 이미지를 표지 사진.PDF에서 큰 이미지를 감지하고 JPEG 또는 모든 형식으로 추출하는 방법은 무엇입니까?
Ghostscript 또는 다른 명령 줄 도구를 사용하여 수행 할 방법이 있습니까?
PDF 파일의 첫 번째 페이지를 이미지 형식으로 렌더링 하시겠습니까? 그렇다면 Ghostscript는이를 할 수 있습니다 (Ghostscript, MuPDF 및 기타 유틸리티를 사용하는 ImageMagick도 가능).
첫 번째 페이지가 이고 이미지가 인 경우 실제로 압축을 풀려고한다면이 작업이 더 힘들어지고 PDF 툴킷이 필요합니다. 고스트 스크립트 수 있습니다하지만, 아마도 너무 잔인한, 다시 MuPDF 더 편리 찾을 수 있습니다. pdftk에서 이미지를 추출 할 수있는 막연한 기억이 있습니다. 그러나 나는 틀릴 수도 있습니다. 원하는 경우 Google에서 빠른 검색을하면 도움이됩니다.
Poppler /의 xpdf는 pdfimages
와 함께 제공 :
Pdfimages는 PDF 형식의 이미지 (PDF)와 같은 휴대용 픽스맵 (PPM)를 파일, 휴대용 비트 맵 (PBM), 또는 JPEG 파일을 저장합니다. Pdfimages는 PDF 파일 PDF 파일을 읽고, 하나 이상의 페이지를 스캔하고, 각 이미지에 대해 하나의 PPM, PBM 또는 JPEG 파일 (image-root-nnn.xxx)을 작성합니다. 여기서 nnn은 이미지 번호이고 xxx는 이미지 유형입니다. (.ppm, .pbm, .jpg).
pdfimages -j -f 1 -l 1 some.pdf subdir/prefix
이미지는
prefix-0000.jpeg
이름subdir/
,prefix-0001.jpeg
에 저장됩니다 :
명령 줄
은 PDF의 1 페이지에서 모든 이미지를 추출하는 것은 이것이다. 가능한 경우 매개 변수는 JPEG 이미지를 가져 오려고 시도합니다. 직접 JPEG 추출이 실패 할 수 있습니다.이 경우 추출 된 이미지는 PPM 또는 PNM으로 저장됩니다 (주목할만한 것은 압축되지 않았기 때문입니다). 필요한 경우 이들은, JPEG 파일로 ImageMagick이의에 의해 변환 할 수 있습니다convert subdir/prefix-0022.ppm subdir/prefix-0022.jpeg
ABCpdf 당신이 PDF에서 이미지를 추출 할 수 있습니다. 그것은 2 단계 조작입니다. 먼저 문서에 이미지가 나타나는 위치를 식별해야합니다. 그런 다음 내보낼 필요가 있습니다. 내 대답은 ABCpdf를 기반으로 개념을 특징으로 할 수 있도록
당신은이 같은 뭔가가 필요 ...
using (Doc theDoc = new Doc()) {
theDoc.Read(theSrc);
ImageOperation op = new ImageOperation(theDoc);
op.PageContents.AddPages();
ICollection<ImageProperties> images = op.GetImageProperties();
foreach (ImageProperties pl in images) {
foreach (ImageRendition plc in pl.Renditions) {
... if plc is a good match
plc.PixMap.GetBitmap().Save(@"c:\output.jpg");
}
}
}
은 내가 ABCpdf의 .NET 소프트웨어 구성 요소에서 작동합니다. 그것은 내가 아는 바로 그 것이다. :-) "