2012-07-19 3 views
6

나는이 비슷한 HTML 코드에서 이미지를 찾을 필요가있다. 여기 파이썬 이미지 다운로드

코드입니다 :

import lxml 
from lxml import html 
import requests 

url = 'http://www.example.com' 

r = requests.get(url) 
tree = lxml.html.fromstring(r.content) 

img = tree.get_element_by_id("img") 
f = open("image.jpg",'wb') 
f.write(requests.get(img['src']).content) 

하지만 난이 오류가 점점 오전 :

Traceback (most recent call last): 
    File "/Users/Name/Documents/Python/Example/Script.py", line 13, in <module> 
    s = requests.get(img['src']) 
    File "/Library/Python/2.6/site-packages/lxml/lxml.etree.pyx", line 1052, in lxml.etree._Element.__getitem__ (src/lxml/lxml.etree.c:38272) 
TypeError: 'str' object cannot be interpreted as an index 

제안?

+2

제안을 시도해보십시오 문서를 읽고 HTML을 수정하십시오. – dav1d

답변

4

f.write(requests.get(img.attrib['src']).content)

1
import lxml.html 
import requests 

url = 'http://www.example.com/' 
tree = lxml.html.parse(url) 
img = tree.get_element_by_id('img') 
img_url = img.attrib['src'] 

with open('image.jpg', 'wb') as outf: 
    data = requests.get(img_url).content 
    outf.write(data) 
+0

IMG = tree.get_element_by_id ('IMG') 는이 시간을 작동하지 않습니다, 그것은 말한다 : 역 추적 (마지막으로 가장 최근 통화) : 파일 "/Users/Example/Documents/Python/Example/Script.py "라인 6 IMG = tree.get_element_by_id ("IMG ") AttributeError 'lxml.etree._ElementTree'객체 제가 트리 lxml.html.parse = (URL을 대체하려고 'get_element_by_id'어떤 속성이없는) with tree = lxml.html.fromstring (requests.get (url) .content) 이제 도움이됩니다! – Jiloc