그래서 파이썬에서 HTMLParser 및 urllib3을 사용하여 파이썬에서 웹 크롤러를 만들려고합니다. 현재 내가 두 개의 서로 다른 수입 문제가 첫 번째 HTML 파서 가져 오기 문제
import html.parser
import urllib
urlText = []
#Define HTML Parser
class parseText(HTMLParser.HTMLParser):
def handle_data(self, data):
if data != '\n':
urlText.append(data)
#Create instance of HTML parser
lParser = parseText()
thisurl = "http://www-rohan.sdsu.edu/~gawron/index.html"
#Feed HTML file into parser
lParser.feed(urllib.urlopen(thisurl).read())
lParser.close()
for item in urlText:
print (item)
되는이 코드는 비주얼 스튜디오 오류 상자
name 'HTMLParser' is not defined
에서 오류를 반환하고 두 번째 옵션은 동일한하지만와 수입 HTMLParser이다가 대신 html.parser의 오류를 반환
import HTMLParser
import urllib
urlText = []
#Define HTML Parser
class parseText(HTMLParser.HTMLParser):
def handle_data(self, data):
if data != '\n':
urlText.append(data)
#Create instance of HTML parser
lParser = parseText()
thisurl = "http://www-rohan.sdsu.edu/~gawron/index.html"
#Feed HTML file into parser
lParser.feed(urllib.urlopen(thisurl).read())
lParser.close()
for item in urlText:
print (item)
No module named 'markupbase'
패키지가 마음에 들지 않습니다. 누구나 수정 사항을 알고 있거나 문제가 있는지 확인하십시오. 시. Visual Studio 2016에서 실행 중이며 Python 3.5에 있습니다.
두 번째 샘플에서 문제를 재현 할 수 없습니다. 전체 추적을 보여주십시오. 또한 들여 쓰기를 수정하십시오. –