보이지 않는 텍스트를 기존 PDF 파일에 삽입하여 검색 가능하게하고 싶습니다.보이지 않는 텍스트를 PDF에 삽입하는 방법은 무엇입니까?
어떤 라이브러리을 사용해야합니까?
API 방법으로 연결되는 링크를 부탁드립니다.
무료이며 이상적으로 오픈 소스입니다.
감사합니다.
: 당신은 눈에 보이지 않는 텍스트를 렌더링 할 필요가 없습니다
보이지 않는 텍스트를 기존 PDF 파일에 삽입하여 검색 가능하게하고 싶습니다.보이지 않는 텍스트를 PDF에 삽입하는 방법은 무엇입니까?
어떤 라이브러리을 사용해야합니까?
API 방법으로 연결되는 링크를 부탁드립니다.
무료이며 이상적으로 오픈 소스입니다.
감사합니다.
: 당신은 눈에 보이지 않는 텍스트를 렌더링 할 필요가 없습니다
3 옵션.
myPdfContentByte.setTextRenderMode(PdfContentByte.TEXT_RENDER_MODE_INVISIBLE);
myPdfStamper.getUnderContent(pageNum)
을 사용하면 스캔 할 텍스트를 그릴 수 있습니다.(호기심 위해 나는 자동으로 OCR은 프레스코 저장소에 논문을 스캔하고 그들이 searcheable하게 수신 할). 적절한 위치에 렌더링하고 텍스트에 스캔 한 이미지를 오버레이합니다. 또는 이미지 위에 텍스트를 렌더링하고 획 및 브러시 색상의 알파 값을 0으로 설정할 수 있습니다.
This은 텍스트가 포함 된 PDF 문서를 만드는 방법을 보여주고 this은 이미지를 추가하는 방법을 보여줍니다. 먼저 텍스트를 추가하고 그 위에 이미지를 추가하십시오. 텍스트는 최종 사용자에게는 보이지 않지만 검색 엔진에서는 계속 검색 할 수 있습니다. This도 유용 할 수 있습니다.
이미지를 추가하고 싶지 않습니다. 내가 말했듯이, 기존 * PDF 파일을 수정하려고합니다. –
좋아, 나는 어떻게 든 스캔 된 페이지가 이미지라고 가정했다. 이 경우 [this] (http://svn.apache.org/viewvc/pdfbox/trunk/pdfbox/src/main/java/org/apache/pdfbox/Overlay.java?view=markup) 도움이 될 수 있습니다. 텍스트로 새 PDF를 만들고 원본 PDF를 그 위에 겹칠 수 있습니다. – nikhil500
물론 텍스트가 최종 사용자에게 표시되지 않는 한 무엇이든 괜찮습니다 (즉, "보이지 않음"이라는 의미입니다). 어떤 라이브러리에 어떤 API 메소드를 사용하면 좋을까요? –
다른 구성 요소를 사용하여 이미 OCR 된 텍스트와 스캔 한 이미지가있는 경우 대부분의 PDF 라이브러리는 스캔 한 이미지를 한 페이지에 렌더링 한 다음 개별 텍스트 아웃을 렌더링 할 수 있습니다. 이미지가 아닌 페이지의 텍스트를 렌더링해야하며 PDF 페이지의 이미지 요소에 텍스트 요소를 겹쳐 써야합니다. 저는 상업용 PDF 구성 요소를 만드는 회사 (www.gnostice.com)에서 일하지만 제 생각에 PDFBox 또는 iText를 사용할 수 있어야합니다. – BZ1