대부분의 경우 Python, Atom으로 RSS 피드를 표시해야합니다. PHP에서 오는, $ entry-> link를 사용하면 꽤 빠르게 값을 얻을 수 있습니다. lxml은 훨씬 정확하고 빠르지 만 복잡합니다. 조사 시간이 지나면 나는 arstechnica-feed와 함께이 작업을하게됩니다 :lxml로 RSS 피드를 구문 분석하는 데 덜 고통스러운 방법입니까?
def GetRSSFeed(url):
out = []
feed = urllib.urlopen(url)
feed = etree.parse(feed)
feed = feed.getroot()
for element in feed.iterfind(".//item"):
meta = element.getchildren()
title = meta[0].text
link = meta[1].text
for subel in element.iterfind(".//description"):
desc = subel.text
entry = [title,link,desc]
out.append(entry)
return out
더 쉽게 수행 할 수 있습니까? 직접 태그에 액세스하려면 어떻게해야합니까? Feedparser는 한 줄의 코드로 작업을 완료합니다! 왜?
왜 feedparser 대신 lxml을 사용합니까? lxml이 훨씬 빠르기 때문에 – bgporter
입니다. – reinhardt
xpath를 사용하면 쉽게 대답 할 수 있습니다. – Dikei