2012-08-29 4 views
0

저는 피드 애그리 게이터를 만들고 있습니다. 나는 블로그를 크롤링하고 때로는 매시간 또는 매 2 시간마다 새로운 게시물이 있는지 확인합니다. 나는 이것을 위해 Simplepie를 사용하고있다.Simplepie 용 사용자 지정 사용자 에이전트를 설정해야합니까?

Simplepie에 (SIMPLEPIE_USERAGENT) 사용자 지정 사용자 에이전트를 변경해야하는지 알고 싶습니다. 또한 사용자 에이전트를 변경해야하는 경우 사용자 에이전트에 대한 모범 사례는 무엇입니까? 감사!

답변

2

예, 그렇지 않으면 SimplePie 관리자 (예 : me :)에게 불만을 제기 할 수 있습니다. 커스텀 사용자 에이전트를 사용하면 고장이 났을 때 누구에게 연락해야하는지 알 수 있습니다.

이상적인 형식은 "프로그램 이름/1.0"입니다. 여기서 1.0은 버전입니다. 또한 귀하의 프로그램 이름/1.0 (+ http : //example.com/)으로 URL을 포함시킬 수도 있습니다 (주소를 + 앞에 붙이고 + 주소).

1

변경해야합니까? 네가하는 일에 달렸어. 일부 사이트는 UA를 기반으로 사용자를 차단합니다. 그것이 그들의 권리입니다.

데이터를 긁어 내고 규칙을 준수 할 필요가 없다면 원하는대로 변경할 수 있습니다.

모범 사례는 자신을 식별하고 내 스크립트가 지금까지 자신의 서버에 문제가 발생하는 경우 그 방법으로 서버 관리자가 나에게 연락 할 수 robots.txt에

+0

글쎄, 내 웹 사이트는 legit와 나는 대부분 나와 함께 등록 된 사이트를 통과 할 것이다. 나는 그들이 내가 가짜라고 생각하는 것을 막기를 원하지 않는다. – raygo

0

내가 항상 사용자 에이전트로 내 응용 프로그램의 이름을 넣어 순종하는 것입니다. (누군가가 신경을 쓰는 유일한 이유입니다)