브라우저에서 PDF 뷰어의 HTML을 가져올 수 있습니까?

2017-12-16 21 views 0 likes

브라우저에서 pdf 뷰어 페이지를 검사 할 때 HTML 구조가 있지만 urllib2와 요청은 아무것도 반환하지 않으며 BS4는 무한 루프가됩니다.브라우저에서 PDF 뷰어의 HTML을 가져올 수 있습니까?

나는 단지 머리의 제목을 원한다.

2017-12-16 arm93

답변

pdf.info.get('Title')

또는

new Metadata(pdf.catalog.metadata) 
metadata.get('dc:title')

2017-12-16 22:19:46

사용하고 작업을 수행 할 수 있어야한다 파이썬. head 태그에서 제목을 얻으려고했지만 html 구조를 얻을 수없는 것 같습니다. 나는 PDF.js에 익숙하지 않다. – arm93