mechanicalsoup

0열

1답변

저는 MechanicalSoup와 webscraping에 완전히 녹색입니다. 나는 html 시간표를 파싱하고 그것을 모바일에 가져 오기 위해 icalendar (ic) 파일로 만들고있다. (어느 내가 잘 했어, 예). 이제는 시간표를 선택한 후에 시간표 사이트의 html을 다운로드했습니다. 이제 파이썬을 사용하여 실제로 시간표로 이동해야합니다. import

1열

1답변

Python3 : MechanicalSoup을 통해 양식을 제출할 때 아무런 변화가 없습니다.

검색 양식을 제출 한 후 웹 사이트에서 일부 작업을 수행해야합니다. 문제는 브라우저를 통해이 작업을 수행 할 때 페이지가 다시로드되지 않고 어디에서나 리디렉션됩니다. 링크가 변경되지 않아도 검색 결과 아래에 결과가 표시됩니다 (새 페이지에서 볼 수 있음). html. import mechanicalsoup def fetchfile(query):

1열

1답변

문제 웹 사이트에서 urllib을 사용하여 PDF 파일을 다운로드하려면 인증이 필요합니다.

사용자 이름과 암호가 필요한 도메인 뒤에 pdf 파일을 가져 오려고합니다. MechanicalSoup에 로그인 자격 증명을 입력 할 수 있지만, pdf 파일로 이동하면 MechanicalSoups launch_browser()로 PDF를 볼 수 있지만 pdf를 다운로드 할 수는 없습니다. (인증이 필요하지 않은 사이트에 대한 파이썬 2 BeautifulSo

0열

2답변

프록시 뒤에 MechanicalSoup 사용

저는 MechanicalSoup를 사용하여 Windows에서 파이썬으로 간단한 webbot을 빌드하려고합니다. 불행히도 저는 (회사가 시행하는) 프록시 뒤에 앉아 있습니다. MechanicalSoup에 프록시를 제공하는 방법을 찾지 못했습니다. 그런 옵션이 있습니까? 그렇지 않다면 내 대안은 무엇입니까? 는 편집 : Eytan의 힌트에 따라, 나는 한 단계

0열

1답변

MechanicalSoup에서 선택한 데이터를 catch하지 않습니다.

다음 코드를 사용하려고합니다. 하지만 첫 번째 선택한 날짜와 같은 데이터의 5 배가됩니다. import re import datetime import mechanicalsoup def get_EminiTable(soup): allValues = [] colnames = soup.find('thead').get_text()

0열

1답변

파이썬과 MechanicalSoup : 루프

후 변수는 null가 나는 문제를 가지고 나는 그에게 파이썬 문제 나 MechanicalSoup의 문제 모르는 : 내가 루프 후 브라우저 객체를 사용 browser = mechanicalsoup.StatefulBrowser() browser.open("http://mypage.com") for item in mylist: browser

1열

2답변

로그인이 필요한 파이썬 3으로 웹 사이트 긁힘

일부 스크래핑 인증과 관련된 질문. BeautifulSoup 사용 : <table> <tr> <td> User: </td> <td> <input autocapitalize="off" autocorrect="off" id="j_username" name="j_username" type="text"/>