2017-11-23 4 views
0

는 일반적으로 내가 여기> < 사이의 "<>" 파이썬에서 셀렌을 사용하여>와 <사이의 값을 스크랩하는 방법은 무엇입니까?

그래서 어떻게 추출 할 수있는 가치 "판타지 비행 게임"내에있는 값을 검색하려면 "find_element_by_id"와 같은 도구를 사용?

enter image description here

+0

('R 당신은 간단한 정규식 패턴을 사용할 수 있지만 완벽하지 않습니다 '^ <.*?>을 (. *?) $''. 구문 분석 HTML/XML 태그를 정말 전용 파서에 의해 수행 최고 (참조 : lxml for python) – user2896976

+0

XPath 또는 클래스 또는 CSS를 사용하여 요소를 찾은 다음 텍스트를 가져옵니다. 그 문제는 무엇입니까? –

답변

1

유 XPath는에게

//span[@class="a-size-small-a-color-secondary"] 

또는

//span[contains(text(),"Fantasy Flight Games")] 
,536를 사용

을 사용할 수 있습니다 HTML에 따라 여러 로케이터는 당신이이

중 하나를 사용할 수 있습니다

텍스트를 얻기 위해 당신이

Fantas_text=driver.find_element_by_xpath("//span[@class="a-size-small-a-color-secondary"]").text 
print(Fantas_text) 
0

사용하여 CSS 선택기처럼 .text 방법을

사용을 사용할 수 있습니다.

driver.find_element_by_css_selector('span[class="a-size-small a-color-secondary"]').text