Beautiful Soup 'href'parse

페이지의 모든 하위 태그를 구문 분석하려고하지만 코드가 작동하지 않는 것 같아요. 구문 분석하려는 html 문서에 이와 같은 코드 스 니펫이 있습니다. Beautiful Soup 'href'parse

<td class="alt1" id="ID" title="SOMETEXT"> 
       <div> 
        <a href="THETEXTIWANT.html" id="SOME IDENTIFIER">SOME TEXT.</a> 
       </div> 
</td>

이

코드 나는`[(HREF = 참) soup.find_all에 태그 tag.text을]`

from bs4 import BeautifulSoup, 
    for td in parse.find_all(class_="alt1"): 
     a = str(div.get()) 
     f.writelines(a + '\n')

출처

2017-11-24 lebar.123

find_all(href=True)를 실행하려고합니까? –

사용

for td in parse.find_all(class_="alt1"): 
    for href in td.find_all(href=True): 
     print(href.text)

출처

2017-11-24 14:08:50

답변

관련 문제