2017-01-05 2 views
0

를 얻고 이미지가 항상 동일하지만 특정 이미지반복 저점 페이지는 항상 내가 루프 저점 페이지에 노력하고있어 같은 결과

import urllib.request 
from bs4 import BeautifulSoup as bs 

frontstring = 'http://www.haz.de/' 

for i in range(1, 50): 
    url = 'http://www.haz.de/Hannover/Aus-der-Region/Lehrte/Fotostrecken/' \ 
     + 'Digitales-Daumenkino-So-waechst-das-Parkhaus#p' + str(i) 

    with urllib.request.urlopen(url) as page: 
     soup = bs(page) 
     galleryimage = soup.findAll('img', {'class': 'pda-fullgallery-large photo'}) 

     for imgtag in galleryimage: 
      try: 
       imgurl = frontstring + imgtag['src'] 
       imgname = 'img/fullgallery-large' + str(i) + '.jpg' 
       urllib.request.urlretrieve(imgurl, imgname) 
       print('saving image from ' + imgurl + ' to ' + imgname) 
      except Exception as e: 
       raise 
      else: 
       pass 

을 저장합니다. 나는 그것이 어디 잘못되었는지 모른다. 브라우저에서 URL을 열면 정확한 페이지와 이미지가 나오지만 수프는 항상 같은 코드로 보입니다. 아마도 정말 어리 석고 단순한 무언가이지만 실수를 찾기 위해 오랫동안 노력한 후에 보지 않을 것입니다.

+0

안녕하세요, JavaScript 코드로 생성 된 이미지 링크 때문에 파이썬 코드를 사용하여 이미지를 다운로드 할 수 없습니다. HTML 코드에는 동일한 이미지에 대한 링크가 하나만 포함되어 있습니다. 예를 들어 브라우저를 에뮬레이트하기 위해 셀레늄을 사용해보십시오. – sr3z

+0

나는 당신이 의미하는 바를 충분히 이해하지 못한다고 생각합니다. [# p1] (http://www.haz.de/Hannover/Aus-der-Region/Lehrte/Fotostrecken/Digitales-Daumenkino-So-whechst-das-Parkhaus#p2)는 [# p1]과 다른 이미지입니다 (http://www.haz.de/Hannover/Aus-der-Region/Lehrte/Fotostrecken/Digitales-Daumenkino-So-whechst-das-Parkhaus#p2) 또는 3, 4, 5 ... 50. 50을 얻습니다. 다른 페이지를 누른 다음 이미지. 적어도 그것이 아이디어입니다. – sezi80

+0

맞지만 모든 페이지에 대해 html 코드를 열면 같은 이미지 URL 만 찾을 수 있습니다. 각 페이지에 대한 javascript 업데이트 URL. 하지만 BeautifulSoup는 자바 스크립트 코드를 실행할 수 없기 때문에 각 페이지에 동일한 이미지를 저장합니다. – sr3z

답변

0
http://www.haz.de/Hannover/Aus-der-Region/Lehrte/Fotostrecken/Digitales-Daumenkino-So-waechst-das-Parkhaus 
http://www.haz.de/Hannover/Aus-der-Region/Lehrte/Fotostrecken/Digitales-Daumenkino-So-waechst-das-Parkhaus/(offset)/1 
http://www.haz.de/Hannover/Aus-der-Region/Lehrte/Fotostrecken/Digitales-Daumenkino-So-waechst-das-Parkhaus/(offset)/2 
http://www.haz.de/Hannover/Aus-der-Region/Lehrte/Fotostrecken/Digitales-Daumenkino-So-waechst-das-Parkhaus/(offset)/3 

이러한 URL은 실제 URL이며 JavaScript로 생성 된 URL입니다. 어떤 사이트를 긁기 전에 JavaScrip을 비활성화해야합니다.