아이이 (가) h4
태그가 없을 때 잘 작동합니다 다음이 있습니다re.compile 아이들이있을 때 BeautifulSoup4 텍스트 요소에 대해 작동하지
if (BS.find('div', {"id" : "table_content"}).find('h4', text=re.compile(".*Super Users.*"))):
print "Found Super Users!"
그러나, h4
태그는 아이들의이있는 경우 결코 인쇄되지 않습니다. 내가 사용하는 디버깅을 시도 다음과 같이 (TMP)
부분은이 h4
태그의 자식의 텍스트이기 때문에 그런 것처럼, 그것을 떨어져 던지는 것 같다, 기본적으로
Users
Super Users
(TMP)
Administrators
....
: 생산
for h4 in BS.find('div', {"id" : "table_content"}).findAll('h4'):
print h4.text
이에
<h4>Super User
<span>(<a href="/tmp">TMP</a>)</span>
</h4>
단점은 (TMP)
항상이되지 않는 것입니다, 그래서 가정을 기운 다. 단지 Super User
이 h4
의 텍스트에 있는지 알아야합니다. 그런 다음 계속할 수 있습니다.
확실하지하지만're.compile되지 않을 것 (". * Super Users. *", flags = re.DOTALL)'줄 바꿈을 처리 하시겠습니까? –
불행히도, 이것은 효과가없는 것 같습니다. h4.text [: 5] == "Super"'가 테스트를 통과했기 때문에 줄 바꿈이 될 수도 있습니다. 어쩌면 내 정규식이 꺼져 있을까요? – rjbogz
좋습니다,'re.compile (". * Super \ s + Users. *"))', 모든 공백은 공백이 아닙니다. –