파이썬에서 웹 페이지에서 다른 카테고리 이름을 얻기 위해 스크래퍼를 작성했지만 해당 페이지에서 아무것도 가져올 수 없습니다. 나는 내가 잘못 가고있는 곳을 알아낼 수 없도록 진지하게 혼란 스럽다. 어떤 도움이라도 대단히 감사 할 것입니다. URL 다음웹 페이지에서 카테고리 제목을 다룰 수 없습니다.
내가 지금까지 시도한 것입니다 : 여기
는 웹 페이지에 대한 링크입니다from bs4 import BeautifulSoup
import requests
res = requests.get("replace_with_above_url",headers={"User-Agent":"Mozilla/5.0"})
soup = BeautifulSoup(res.text,"lxml")
for items in soup.select('.slide_container .h3.standardTitle'):
print(items.text)
요소 어느 하나의 카테고리 이름에서 난 후 :
<div class="slide_container">
<a href="/offers/furniture/" tabindex="0">
<picture style="float: left; width: 100%;"><img style="width:100%" src="/_m4/9/8/1513184943_4413.jpg" data-w="270"></picture>
<div class="floated-details inverted" style="height: 69px;">
<div class="h3 margin-top-sm margin-bottom-sm standardTitle">
Furniture Offers #This is the name I'm after
</div>
<p class="carouselDesc">
</p>
</div>
</a>
</div>
res.text에서 올바른 html을 사용하고 있습니까? – imox
서버가 당신이 데이터를 긁적 거리지 않기를 바라는 것처럼 보입니다. 요청은 브라우저에 실제로 표시되는 페이지가 아니라 다음 내용이 포함 된 블록 페이지를 반환합니다. ""www.therrange.co. 귀하의 브라우저에 관한 어떤 것이 우리가 당신을 로봇이라고 생각하게 만들었습니다. 이런 일이 일어날 수있는 몇 가지 이유가 있습니다 ... " – Andersson
셀레늄으로 시도했지만 최종 결과는 @sir Andersson을 언급 한대로입니다. – SIM