내가하고있는 프로젝트의 로그인 보호 페이지에서 html에 액세스하려면 웹 사이트에 로그인해야합니다. 내가 값으로 this person's 대답을 사용하고웹 사이트에 로그인하고 Python으로 HTML을 검색
내가이 필요합니다 내가 생각
sock = urllib.urlopen("https://www.example.com/activities")
html_source = sock.read()
sock.close()
print html_source
은의 HTML을 인쇄 할 것이다 :
from twill.commands import *
go('https://example.com/login')
fv("3", "email", "[email protected]")
fv("3", "password", "mypassword")
submit()
가 Assumedly이 그때 실행 그래서 저를 로그인해야 (지금) 액세스 할 수있는 페이지 대신 로그인 페이지의 html을 제공합니다. 다른 방법 (예 : 기계화)을 시도했지만 동일한 결과가 나타납니다.
무엇이 누락 되었습니까? 일부 사이트에서이 유형의 로그인을 제한합니까, 아니면 https 또는 다른 사이트에서 작동하지 않습니까? (이 사이트는 FitBit이므로 질문에 URL을 사용할 수 없기 때문에)
'twill! = urllib' – falsetru
'urllib'을 사용하여 "https://example.com/activities"("www"없이)로 시도 했습니까? 나는 "www"와 "www"URL이 서로 섞일 때 문제가 발생했습니다 ... –