BeautifulSoup라는 라이브러리를 사용하여 웹 사이트의 내용을 다듬 으려합니다.BeautifulSoup는 웹 사이트의 콘텐츠를 보여 줄 수 없습니까?
코드 :
from bs4 import BeautifulSoup
from urllib.request import urlopen
html_http_response = urlopen("http://www.airlinequality.com/airport-reviews/jeddah-airport/")
data = html_http_response.read()
soup = BeautifulSoup(data, "html.parser")
print(soup.prettify())
출력 :
<html style="height:100%">
<head>
<meta content="NOINDEX, NOFOLLOW" name="ROBOTS"/>
<meta content="telephone=no" name="format-detection"/>
<meta content="initial-scale=1.0" name="viewport"/>
<meta content="IE=edge,chrome=1" http-equiv="X-UA-Compatible"/>
</head>
<body style="margin:0px;height:100%">
<iframe frameborder="0" height="100%" marginheight="0px" marginwidth="0px" src="/_Incapsula_Resource?CWUDNSAI=9&xinfo=9-57435048-0%200NNN%20RT%281512733380259%202%29%20q%280%20-1%20-1%20-1%29%20r%280%20-1%29%20B12%284%2c315%2c0%29%20U19&incident_id=466002040110357581-305794245507288265&edet=12&cinfo=04000000" width="100%">
Request unsuccessful. Incapsula incident ID: 466002040110357581-305794245507288265
</iframe>
</body>
</html>
몸 대신 브라우저에서 콘텐츠를 검사 할 때 표시되는 내용이 Iframe 발리가 포함되어 있습니다.
를 업데이트합니다. 어쨌든 "iframe"내부에서 콘텐츠를 가져 오시겠습니까? 그게 당신의 요구 사항입니까 ?? –
안녕하세요, 실제로 몸 안쪽에 무엇이 들어 있는지 알고 싶습니다. 이 URL을 확인하면 "view-source : http : //www.airlinequality.com/airport-reviews/jeddah-airport/" 거기에 너무 많은 데이터가 있습니다. – SAM
사이에있는 모든 콘텐츠를 원하십니까?
및? – imox