pdfbox

    1

    1답변

    PDF 문서를 개별 페이지로 분할하고 특정 문자열에 대한 페이지를 살펴본 다음 PDF에서 새 PDF를 작성하는 pdfbox API를 사용하여 Java로 코드를 작성했습니다. 페이지에 문자열이 있습니다. 내 문제는 새 페이지를 저장할 때 글꼴이 손실된다는 것입니다. 방금 테스트 할 빠른 단어 문서를 만들었고 기본 글꼴은 calibri이었습니다. 프로그램을 실

    28

    2답변

    저는 pdfbox 라이브러리를 사용하여 처음부터 pdf를 만드는 Java 응용 프로그램을 작성하고 있습니다. 페이지 중 하나에 jpg 이미지를 넣어야합니다. 나는이 코드를 실행하면 PDDocument document = new PDDocument(); PDPage page = new PDPage(PDPage.PAGE_SIZE_A4); document.a

    11

    2답변

    내 PDF 파일에서 텍스트를 추출하려고하면 임의의 단어 사이에 공백이 삽입 된 것처럼 보입니다. 나는이 페이지의 다운로드 섹션에서 샘플 파일을 다음에 pdfbox-앱 1.6.0.jar (최신 버전)을 사용하고 있습니다 : http://www.sheffield.gov.uk/roads/children/parents/6-11/pedestrian-training

    6

    1답변

    내 프로젝트에서 라이브러리를 업그레이드하고 pdfbox를 0.6.7에서 1.6.0으로 업그레이드했으며 LucenePDFDocument 클래스를 찾을 수 없습니다. 이 클래스는 Apache 페이지의 문서/자습서에서 계속 언급됩니다. 어떤 아이디어?

    0

    1답변

    Solr의 pdf 텍스트 추출에 문제가 있습니다. Solr은 Apache Tika를 사용하여 PDF 파일의 텍스트를 추출하고 tika는 PDFBox를 사용합니다. PDF 파일을 Solr에게 보내면 텍스트가 성공적으로 추출되지만 텍스트가 완전히 엉망입니다. 그 MonaPersNr.KSt.KUZKapaz.Sollstd.MonatJahrtsbericht 같은 뭔

    0

    2답변

    drawText로 페이지에 텍스트를 쓰는 방법을 알았습니다. drawPolygon을 사용하여 올바른 위치에 다각형이 나타납니다. 문제는 단지 텍스트를 그릴 때 작동하지만, 다각형을 그리면 텍스트가 더 이상 그려지지 않는다는 것입니다. 두 개의 PDPageContentStream 객체 (하나는 텍스트 용이고 다른 하나는 폴리곤 용)를 만들면 다각형이 더 이상

    0

    1답변

    프로젝트의 외부 항아리에 "pdfbox-1.6.0.jar"를 추가 한 프로젝트에 Eclipse IDE를 사용하고 있습니다. 이 jar 파일의 API를 가져 오는 코드를 작성할 때 Eclipse에 예외가 표시되지 않았습니다. 하지만 내 프로그램을 실행하면 "NoClassDefFound"예외가 표시됩니다. 어떤 사람이이 일을 도와 줄 수 있습니까?

    2

    2답변

    좌표 관련 문제가 있습니다. PDFTextStripperByArea 영역이 너무 높게 보인다. 다음 예제 조각을 고려하십시오 ... PDPage page = (PDPage) allPages.get(0); PDFTextStripperByArea stripper = new PDFTextStripperByArea(); // define region for

    4

    3답변

    Solr이 내 PDF 파일을 올바르게 구문 분석하지 않는 것 같습니다. 아파치 티카 (PDF 파일을 내부적으로 사용한다고 생각하는)를 사용하는 대신 PDF 파일을 구문 분석하기위한 다른 대안이 있는지 궁금합니다. 나는 이것을 사용할 때 내 콘텐츠 사이에 임의의 공간을 얻는 것처럼 보입니다. 나는 같은 문제가있는 PDFBox (최신 버전)를 통해 PDF를 실

    1

    2답변

    단일 페이지 pdf 템플릿 파일을 만들었습니다. 그런 다음 pdfbox를 사용하여 보고서 크기에 따라 페이지 수가 "n"개인 PDF를 만듭니다. 이 페이지의 모든 "n"을 템플릿 pdf 파일의 페이지로하고 싶습니다. 모든 "n"페이지를 해당 페이지의 사본으로 가져 오는 가장 좋은 방법은 무엇입니까? 다음은 현재 코드입니다. PDDocument documen