나는 프로그래밍 방식으로 MusicBrainz 웹 사이트에서 편집 기록 페이지를 검색하려고합니다. (musicbrainzngs
은 MB 웹 서비스 용 라이브러리이며 웹 서비스에서 편집 기록에 액세스 할 수 없습니다). 이를 위해 사용자 이름과 암호를 사용하여 MB 웹 사이트에 로그인해야합니다.Python을 사용하여 MusicBrainz에서 편집 기록 페이지를 프로그래밍 방식으로 가져 오는 방법은 무엇입니까?
mechanize
모듈을 사용해 보았습니다. 로그인 페이지의 두 번째 양식 (첫 번째 양식은 검색 양식)을 사용하여 사용자 이름과 암호를 제출합니다. 응답에서 사이트에 성공적으로 로그인 한 것으로 보입니다. 그러나 편집 기록 페이지에 대한 추가 요청은 예외를 발생시킵니다.
mechanize._response.httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt
나는 예외와 그 이유를 이해합니다. 나는 사이트를 악용하지 않는다는 전적인 책임을진다. (어쨌든 사용은 내 사용자 이름으로 태그가 붙을 것이다.) 나는 수동으로 페이지를 열지 않고, HTML을 저장하고 저장된 HTML에 스크립트를 실행하는 것을 피하고자한다. 403 오류를 극복 할 수 있습니까?
답변과 경고에 감사드립니다. 이것은 그것을한다. – tzot