0

연구 목적으로 인스 트램 데이터를 크롤링/모니터링하는 방법은 무엇입니까?인 그램에서 데이터를 크롤링하기 위해 크롤러를 작성하는 방법은 무엇입니까?

공식 API를 시도했지만 팔로어와 같은 실제 정보를 크롤링하는 것은 불가능한 샌드 박스에서만 작동했습니다. 특정 계정을 모니터링하고 팔로어/팔로어가 범위를 확장하고 행동 (예 : 좋아하는 사람의 수의 진행 상황)을 추적해야합니다.

아무도 제안 할 수 없습니까? 관련된 크롤링 작업에 대한 참고 자료를 제공 할 수 있습니까?

답변

0

아마 당신은 아름다운 수프 라이브러리를 사용해보고 Ryan Mitchell이이 책을 읽을 수 있습니다 : Web Scraping with Python. 기본적으로 DOM, REGEXs 및 알고리즘 방식으로 시작할 수 있도록 페이지를 페이지로 이동하는 방법을 이해해야합니다.

은 또한 지정할 요즘 파일을 시작하기 전에 사이트의 서비스 약관을 확인하고/긁어에 대한 규칙이 아니라 일반적으로 모든 사이트 robot.txt이 그들이 몇 가지 지침을 미칠 수 있다는 점을 알고 있으며 어떻게/당신이

+0

ISN을 긁어 허용하는지 ' 그는 인스 타 그램을 특별히 찾고 있습니까? – Gar

+0

답장을 보내 주셔서 감사합니다! Instagram의 경우 특히 유용 할 수 있지만 일반적인 제안 사항도 좋습니다. :-) 이전에 웹 사이트를 크롤링 한 경험이 있지만 로깅 시뮬레이션에 익숙하지 않았습니다. 나는 진보 된 부분의 장이 도움이 될 것이라고 생각한다. – 2hc