0
브라우저에서 pdf 뷰어 페이지를 검사 할 때 HTML 구조가 있지만 urllib2와 요청은 아무것도 반환하지 않으며 BS4는 무한 루프가됩니다.브라우저에서 PDF 뷰어의 HTML을 가져올 수 있습니까?
나는 단지 머리의 제목을 원한다.
예제 페이지 : 모질라의 pdf.js를 사용하는 경우 http://victoria.lviv.ua/html/fl5/NaturalLanguageProcessingWithPython.pdf
사용하고 작업을 수행 할 수 있어야한다 파이썬. head 태그에서 제목을 얻으려고했지만 html 구조를 얻을 수없는 것 같습니다. 나는 PDF.js에 익숙하지 않다. – arm93