2011-07-27 4 views
0

다음 문제를 해결하는 데 도움이 필요합니다.웹 검색 결과 검색

특정 사이트의 Google 검색 엔진에서 캐싱 된 URL의 유효성을 검사해야합니다. URL이 404이거나 페이지가 필요한 html 요소를 렌더링하지 못하는 경우 (깨진 것으로 간주 됨) 해당 URL을 기록하고 나중에 URL을 수정하여 301 올바른 URL로 리디렉션해야합니다. 나는 PHP와 약간의 파이썬을 알고 있지만 특정 사이트의 검색 엔진 결과에서 모든 URL을 스크랩하는 데 어떤 접근 방법을 사용하는지 확신하지 못합니다.

답변