본인은이 부분에 대한 빠른 문제가 있습니다. 기본적으로 나는 beautifulsoup를 사용하여 웹 사이트를 스크랩하고 있습니다.beautifulsoup (TypeError : 'int'객체는 subscriptable이 아님)를 사용하여 전자 메일 주소를 추출하십시오.
<div class="startup-email-link social-links-startup">
<a href="mailto:[email protected]">d</a>
</div>
을 그리고 내 코드는 나에게이 오류 제공 : I 클래스와 사업부 내에 A HREF 태그 만 전자 메일 주소를 추출해야합니다 (아래 참조) 형식 오류를 'INT'객체는
를 첨자에 있지 않습니다import requests
from bs4 import BeautifulSoup
import re
source_code = requests.get(item_url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, "html.parser")
for link in soup.find('div', {'class': 'startup-email-link'}):
href = link.find('a')['href']
print(href)
#href_final = re.compile('mailto')
#print(href_final)
그래도 작동하지만 소스 코드에서 이메일은 동일한 태그로 두 번 표시되며 하나만 있으면됩니다. 거기에 select_first 또는 그런 smth 아닌가요? – jjyoh
그러면'soup.find ('div', { 'class': 'startup-email-link'})를 사용할 수 있습니다. find ('a') [ 'href'] ' – fodma1
고마워요. – jjyoh