2017-12-27 7 views
1

xpath를 사용하여 파이썬에서 위키 피디 어로 데이터를 요청하려고합니다. 빈 목록이 나타납니다. 내가 도대체 ​​뭘 잘못하고있는 겁니까.python에서 Xpath가 데이터를 가져 오지 않습니다.

import requests 

from lxml import html 

pageContent=requests.get(
    'https://en.wikipedia.org/wiki/List_of_Olympic_medalists_in_judo' 
) 

tree = html.fromstring(pageContent.content) 

name = tree.xpath('//*[@id="mw-content-text"]/div/table[1]/tbody/tr[2]/td[2]/a[1]/text()') 

print name 

답변

2

이 브라우저가 실제로하지 않는 내부에 존재 일반적으로 그들 내부의 tbody 태그를 추가하는 한, 한, 브라우저에서 xpathtable 태그를 얻으려고 아주 일반적인 실수이다 응답 본문.

그래서 그냥 제거하고처럼은 다음과 같아야합니다 덕분에, 일이

'//*[@id="mw-content-text"]/div/table[1]//tr[2]/td[2]/a[1]/text()' 
+0

AWSOME 무엇 https://bittrex.com/Market/Index?MarketName=btc-nxt 이런 일에 대해. 돈에 대한 xpath 데이터를 얻으려고 // // [@ id = "rowChart"]/div [2]/div/div [2]/span/text(). 하지만 그것도 나에게 빈 값을주는 –

+0

@ TarikKoric 그건 완전히 다른 질문이고 전혀 다른 경우이다. 우선 cloudflare에 의해 보호된다. 그래서 그 사이트로부터 어떤 종류의 데이터라도 얻는 것은 매우 어려울 것이고 또한 전체 사이트가 생성되는 것처럼 보인다. 자바 스크립트로 동적으로, 그래서 정상적인 요청이 작동하지 않습니다. – eLRuLL

+0

해명 해 주셔서 감사합니다. –