2011-02-28 3 views
3

보이지 않는 텍스트를 기존 PDF 파일에 삽입하여 검색 가능하게하고 싶습니다.보이지 않는 텍스트를 PDF에 삽입하는 방법은 무엇입니까?

어떤 라이브러리을 사용해야합니까?
API 방법으로 연결되는 링크를 부탁드립니다.

무료이며 이상적으로 오픈 소스입니다.
감사합니다.

: 당신은 눈에 보이지 않는 텍스트를 렌더링 할 필요가 없습니다

답변

3

3 옵션.

  1. 텍스트 렌더링 모드 3 : "획 없음, 채우기 없음". myPdfContentByte.setTextRenderMode(PdfContentByte.TEXT_RENDER_MODE_INVISIBLE);
  2. 텍스트 뒤에 무엇인가를 그립니다. 당신은 아마도 페이지의 스캔 이미지를 가지고있을 것입니다. iText의 myPdfStamper.getUnderContent(pageNum)을 사용하면 스캔 할 텍스트를 그릴 수 있습니다.
  3. 페이지의 미디어 또는 자르기 상자 외부에 텍스트를 그립니다. 임의의 PDF에 익숙한 검색 엔진이 페이지를 나타 내기를 원한다면 PDF를보고있는 사람들이 적절한 텍스트 선택 상자를 볼 수있게하려면 ...
0

(호기심 위해 나는 자동으로 OCR은 프레스코 저장소에 논문을 스캔하고 그들이 searcheable하게 수신 할). 적절한 위치에 렌더링하고 텍스트에 스캔 한 이미지를 오버레이합니다. 또는 이미지 위에 텍스트를 렌더링하고 획 및 브러시 색상의 알파 값을 0으로 설정할 수 있습니다.

+0

물론 텍스트가 최종 사용자에게 표시되지 않는 한 무엇이든 괜찮습니다 (즉, "보이지 않음"이라는 의미입니다). 어떤 라이브러리에 어떤 API 메소드를 사용하면 좋을까요? –

+0

다른 구성 요소를 사용하여 이미 OCR 된 텍스트와 스캔 한 이미지가있는 경우 대부분의 PDF 라이브러리는 스캔 한 이미지를 한 페이지에 렌더링 한 다음 개별 텍스트 아웃을 렌더링 할 수 있습니다. 이미지가 아닌 페이지의 텍스트를 렌더링해야하며 PDF 페이지의 이미지 요소에 텍스트 요소를 겹쳐 써야합니다. 저는 상업용 PDF 구성 요소를 만드는 회사 (www.gnostice.com)에서 일하지만 제 생각에 PDFBox 또는 iText를 사용할 수 있어야합니다. – BZ1

1

This은 텍스트가 포함 된 PDF 문서를 만드는 방법을 보여주고 this은 이미지를 추가하는 방법을 보여줍니다. 먼저 텍스트를 추가하고 그 위에 이미지를 추가하십시오. 텍스트는 최종 사용자에게는 보이지 않지만 검색 엔진에서는 계속 검색 할 수 있습니다. This도 유용 할 수 있습니다.

+0

이미지를 추가하고 싶지 않습니다. 내가 말했듯이, 기존 * PDF 파일을 수정하려고합니다. –

+0

좋아, 나는 어떻게 든 스캔 된 페이지가 이미지라고 가정했다. 이 경우 [this] (http://svn.apache.org/viewvc/pdfbox/trunk/pdfbox/src/main/java/org/apache/pdfbox/Overlay.java?view=markup) 도움이 될 수 있습니다. 텍스트로 새 PDF를 만들고 원본 PDF를 그 위에 겹칠 수 있습니다. – nikhil500