2014-01-29 13 views
0

은 내가 한 페이지가 정적으로동적 웹 페이지가 업데이트되었는지 확인하는 방법은 무엇입니까?

wget -S http://www.staticpage.com 

으로 최종 수정 시간을 확인할 수 있습니다 알고 있습니다. 그러나 동적 인 페이지에 똑같이 할 때 나는 항상 현재 시간을 얻는다.

그래서 임의의 시간 또는 페이지가 마지막으로 업데이트 된 이후 페이지가 변경된 경우 사이트에 질문하는 덜 관입적인 방법은 무엇입니까? 분명히 전체 페이지를 다운로드하고 내가 파일에 저장 한 내용과 비교할 수는 있지만 오버 헤드를 줄이려고합니다.

+0

수정 날짜 서버 보고서 만 신뢰할 수 있습니다. 동적 페이지를 사용하면 서버가 항상 현재 시간을보고하면 페이지가 수정 된시기를 감지 할 수 없습니다! – RaviH

답변

1

동적 페이지는 문자 그대로 각 페이지로드를 업데이트합니다. 동적 페이지가 업데이트되는시기를 알고 싶으면 페이지 자체 또는 페이지의 RSS 피드를 볼 필요가 있습니다. 최선의 방법은 일반적으로 다운로드하여 최신 게시물의 최신 날짜를 파싱하는 것입니다.

UPDATE : 당신은 페이지를 다운로드 할 때 당신이를 사용할 수 있습니다 읽을 수있는 데이터의 양을 제한하려면 :

curl http://someurl.com | head -c 512 

리눅스는 스트림에서 읽는 중지하고 사용하여 512 바이트 이후의 요청을 종료합니다 이. 그것을보고 전송을 중지하는 것은 서버의 책임입니다. 이것은 발생할 수도 있고 아닐 수도 있지만 적어도 대역폭을 더 많이 낭비하지는 않습니다.

+0

하지만 전체 페이지를 다운로드해야합니까? 부품을 다운로드하고 여기저기서 일부만 다운로드하여 로컬에 저장된 이전 파일과 일치하는지 확인할 수 있습니까? 그것은 페이지의 지문처럼 보일 것입니다. –

+0

전체 페이지 로딩을 방지하는 방법은 내 업데이트를 참조하십시오. 불행히도 동적 인 웹 페이지의 대부분은 대부분 정적 인 제목을 가지므로 대부분 원하는 것은 본문에 포함됩니다. – krowe