는 일반적으로 내가 여기> < 사이의 "<>" 파이썬에서 셀렌을 사용하여>와 <사이의 값을 스크랩하는 방법은 무엇입니까?
그래서 어떻게 추출 할 수있는 가치 "판타지 비행 게임"내에있는 값을 검색하려면 "find_element_by_id"와 같은 도구를 사용?
0
A
답변
1
유 XPath는에게
//span[@class="a-size-small-a-color-secondary"]
또는
//span[contains(text(),"Fantasy Flight Games")]
,536를 사용
을 사용할 수 있습니다 HTML에 따라 여러 로케이터는 당신이이
중 하나를 사용할 수 있습니다
텍스트를 얻기 위해 당신이
Fantas_text=driver.find_element_by_xpath("//span[@class="a-size-small-a-color-secondary"]").text
print(Fantas_text)
0
당신은
find_element_by_tag_name,find_element_by_class_name ,find_element_by_css_selecto
등 R
그냥 공식 문서로하지만 갈 수 있습니다.
http://selenium-python.readthedocs.io/locating-elements.html
0
사용하여 CSS 선택기처럼 .text
방법을
사용을 사용할 수 있습니다.
driver.find_element_by_css_selector('span[class="a-size-small a-color-secondary"]').text
('R 당신은 간단한 정규식 패턴을 사용할 수 있지만 완벽하지 않습니다 '^ <.*?>을 (. *?) $''. 구문 분석 HTML/XML 태그를 정말 전용 파서에 의해 수행 최고 (참조 : lxml for python) – user2896976
XPath 또는 클래스 또는 CSS를 사용하여 요소를 찾은 다음 텍스트를 가져옵니다. 그 문제는 무엇입니까? –