저는 MechanicalSoup와 webscraping에 완전히 녹색입니다. 나는 html 시간표를 파싱하고 그것을 모바일에 가져 오기 위해 icalendar (ic) 파일로 만들고있다. (어느 내가 잘 했어, 예). 이제는 시간표를 선택한 후에 시간표 사이트의 html을 다운로드했습니다. 이제 파이썬을 사용하여 실제로 시간표로 이동해야합니다. import
검색 양식을 제출 한 후 웹 사이트에서 일부 작업을 수행해야합니다. 문제는 브라우저를 통해이 작업을 수행 할 때 페이지가 다시로드되지 않고 어디에서나 리디렉션됩니다. 링크가 변경되지 않아도 검색 결과 아래에 결과가 표시됩니다 (새 페이지에서 볼 수 있음). html. import mechanicalsoup
def fetchfile(query):
사용자 이름과 암호가 필요한 도메인 뒤에 pdf 파일을 가져 오려고합니다. MechanicalSoup에 로그인 자격 증명을 입력 할 수 있지만, pdf 파일로 이동하면 MechanicalSoups launch_browser()로 PDF를 볼 수 있지만 pdf를 다운로드 할 수는 없습니다. (인증이 필요하지 않은 사이트에 대한 파이썬 2 BeautifulSo
저는 MechanicalSoup를 사용하여 Windows에서 파이썬으로 간단한 webbot을 빌드하려고합니다. 불행히도 저는 (회사가 시행하는) 프록시 뒤에 앉아 있습니다. MechanicalSoup에 프록시를 제공하는 방법을 찾지 못했습니다. 그런 옵션이 있습니까? 그렇지 않다면 내 대안은 무엇입니까? 는 편집 : Eytan의 힌트에 따라, 나는 한 단계
다음 코드를 사용하려고합니다. 하지만 첫 번째 선택한 날짜와 같은 데이터의 5 배가됩니다. import re
import datetime
import mechanicalsoup
def get_EminiTable(soup):
allValues = []
colnames = soup.find('thead').get_text()
후 변수는 null가 나는 문제를 가지고 나는 그에게 파이썬 문제 나 MechanicalSoup의 문제 모르는 : 내가 루프 후 브라우저 객체를 사용 browser = mechanicalsoup.StatefulBrowser()
browser.open("http://mypage.com")
for item in mylist:
browser