마지막 단락의 마지막 단락 뒤에 텍스트를 삽입해야합니다. 마지막 단락의 좌표를 찾을 수 있는지 확실하지 않습니다. 내가 알고있는 것처럼 reportlab은 pdf를 다루기위한 가장 강력한 라이브러리이지만 다른 라이브러리를 통해 가능하면 괜찮습니다. 또한 복제가 가능합니까 (마지막 단락의 이름 및 크기와 같은 글꼴 속성을 찾으십시오)? 내가 from repo
저는 파이썬을 처음 접했고 기존 스크립트를 파악하려고합니다. 이 예제는 다음과 같이 pdfrw에서 제공됩니다. http://code.google.com/p/pdfrw/wiki/ExampleTools "멋진 프린터가있는 프린터 및 Acrobat의 전체 사본을 사용하면 작은 PDF를 작은 책자 (예 : 4 자 크기의 편지 페이지 수는 11 "x 17"입니다.)
ReportLab과 함께 PdfReader를 사용하여 PDF 페이지를 가져 와서 저장 (모두 성공) 한 다음 다중 페이지 PDF를 가져 와서 동일한 작업을 수행하려고합니다. 한 번에 한 페이지 씩 PDF를 가져 오는 방법을 알고 있지만 한 페이지 이상을 가져 오는 데 어려움을 겪고 있습니다. from reportlab.pdfgen import canvas
문제에 대한 stackoverflow를 검색했습니다. How to set custom page size with Ghostscript How to convert multiple, different-sized PostScript files to a single PDF? 그러나 이것은 내 문제를 해결할 수 없습니다 : 가장 가까운 링크입니다. 질문은 간단합니다
pdfrw은 문서에서 텍스트를 추출 할 수 있습니까? 다음 for pg_num in range(number_of_pages):
pg_obj = pdfreader.getPage(pg_num)
print(pg_num)
if re.search(r'CSE', pg_obj.extractText()):
cse_count+=
+----+-----------------------------+
| id | name |
+====+=============================+
| 47 | Some textjogjwojgopwgpowmok |
+----+-----------------------------+
| 47 | Some textjogjwojgopwg