아디다스의 모든 제품을 인쇄하는이 코드는 신제품이 목록에 추가 된 후 긁어서 새 제품을 인쇄하기를 원합니다. 현재는 전체 제품 목록 만 인쇄 할 수 있습니다. 어떻게하면 좋을까요?정기적으로 웹 사이트에서 변경되는 목록에서 오래된 항목을 삭제하는 방법은 무엇입니까?
from bs4 import BeautifulSoup
import urllib.request
import re
import urllib.parse
import time
headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36",
"Accept-Language" : "en-US,en;q=0.8"}
url = 'http://www.adidas.com/on/demandware.static/-/Sites-adidas-US-Library/en_US/v/sitemap/product/adidas-US-en-us-product.xml'
values = {'s':'search',
'submit':'search'}
data = urllib.parse.urlencode(values)
data = data.encode('utf-8')
req = urllib.request.Request(url, data, headers=headers)
resp = urllib.request.urlopen(req)
respData = resp.read()
rawdata = re.findall(r'<loc>(.*?)</loc>', str(respData))
for Product_list in rawdata:
print(Product_list)