2017-12-02 12 views
0

rss 메타 데이터의 특정 속성 만 다운로드하려면 어떻게해야합니까? "2017년 12월 2일 (토) 07 : 나는 보편적 feedparser 라이브러리를 사용하고Python : 다운로드/구문 분석 * 단독 * rss 항목의 pubdate 태그

feedparser.parse (linkstr) .entries [0]

내가 인쇄 된 경우이 같은 것을 반환이 줄을 가지고

을 .published : 00:34 Z "

내 질문에 전체 피드를 다운로드 한 다음 첫 번째 항목의 게시물 만 게시합니까? 또는 pubdate 만 다운로드합니까?

예전의 경우 특정 속성 만 다운로드하려면 어떻게해야합니까? 이것은 5 분마다 검사를 실행하는 봇용이므로 5 분마다 전체 피드를 다운로드하는 것은 실현 불가능하고 무시 무시하게 비효율적입니다.

답변

0

전자 태그/최종 수정 헤더를 사용하지 않는 이유는 무엇입니까? -

https://pythonhosted.org/feedparser/http-etag.html

+0

고맙지 만 다시 간의 실질적인 차이가 (linkstr) .entries [0] .published_parsed feedparser.parse 또는 feedparser.parse은 (linkstr) .modified_parsed? 두 번째 예는 제공 한 링크에 주어진 내용입니다. – xland44

+0

전자 태그 및/또는 마지막으로 수정 한 헤더를 사용할 때 클라이언트는 이전의 현금화 된 요청의 변경 사항을 확인하므로 변경이없는 경우 RSS 피드를 다시 다운로드하지 않습니다 이 헤더들. 문서에서 말하듯이, 마지막으로 수정 된 헤더와 전자 태그 헤더는 모두 지원되는 서버에 의존하기 때문에 마지막으로 수정 된 헤더와 e 태그 헤더를 모두 포함하는 것이 좋습니다. 귀하의 예제에서 실제로 RSS 피드를 다운로드하고 항목을 확인하는 동안 e- 태그/마지막으로 수정 된 헤더 메소드를 사용하여 피드를 다운로드하지 않아도됩니다. –