0
작업 htmls의 집합을 반복적으로 html2text 호출. 심지어 html2text
을 elinks -dump
으로 바꾸려고했지만 아무 소용이 없습니다.하지 이것은 코드입니다
작업 htmls의 집합을 반복적으로 html2text 호출. 심지어 html2text
을 elinks -dump
으로 바꾸려고했지만 아무 소용이 없습니다.하지 이것은 코드입니다
확실하지, 그러나 이것은 당신이 왜 파이썬 라이브러리로 html2text
를 사용하는
import subprocess
import sys
outfile = i + ".txt"
cmd = sys.path[0] + "/htmltotext " + i + ".html"
with open(outfile, "w") as output_f:
p = subprocess.Popen(cmd, stdout=output_f, shell=True)
계신 될 수 있을까요?
h = html2text.HTML2Text()
txt = h.handle(open(infile).read())
sys.path는 필요하지 않습니다. 그렇지 않으면 매력처럼 작동합니다. 그래서'call' 함수를 통해 파이핑이 제대로 작동하지 않습니까? – rejuvyesh