2017-01-24 3 views
1

저는 attampt에서 bs4를 사용하여 이미지에 대한 웹 링크를 the metropolitan에서 가져옵니다.bs4는 변수 이름을 반환하지만 내용은 포함하지 않습니다.

url = 'http://www.metmuseum.org/art/collection#!?material=Canvas&showOnly=onDisplay&offset=1780&pageSize=0&sortBy=Relevance&sortOrder=asc&perPage=20' 
soup =BeautifulSoup(urlopen(url).read().decode(),'html5lib').encode() 

원본 웹 페이지에서 원하는 데이터는 다음과 같습니다. 원하는 링크가 있습니다. BS4에 의해 반환

<figure class="card__standard-image"> 
     <a href="/art/collection/search/459087?sortBy=Relevance&amp;amp;what=Oil+paintings%7cPaintings&amp;amp;od=on&amp;amp;ft=*&amp;amp;offset=0&amp;amp;rpp=20&amp;amp;pos=1"> 

데이터는 다음과 같습니다

<figure class="card__standard-image">\n  <a href="{{ card.url }}"> 

링크가 card.url로 대체되는 날 것으로 보인다,하지만 난에 저장된 값을 액세서하는 방법을 모른다 카드.

다른 파서를 사용해 보았지만 아무 소용이 없습니다.

답변

1

자바 스크립트에 의해 인출되어 필요한 데이터는 읽기 데이터는이 URL에 있습니다

http://www.metmuseum.org/api/collection/collectionlisting?artist=&department=&era=&geolocation=&material=Canvas&offset=0&pageSize=0&perPage=20&showOnly=onDisplay&sortBy=Relevance&sortOrder=asc 

enter image description here

+0

덕분에, 문제는이 예를 들어 내 문제를 해결했다. 다음 번에이 URL을 어떻게 찾았습니까/가져 왔습니까? –