2017-10-12 11 views
0

나는 웹 스크랩에 노력하고 파이썬 3.5% 20D %, 20 %의 20U는 3.5

를 사용하여이 URL의 일부 트윗

url = "https://twitter.com/search?l=en&q=ecb%20draghi%20since%3A2012-09-01%20until%3A2012-09-02&src=typd"

내 문제는 % 20D %, 20 %의 20U 이미 인코딩 된 것입니다 파이썬 3.5, 그래서 내 코드 가이 URL에서 실행되지 않습니다. 이 문제를 해결할 방법이 있습니까? 사전에

감사합니다, 최저

+0

제공된 링크는 이미 파이썬 3.5에서 작동합니다. 제공된 링크를 사용하는 데 아무런 문제가 없음을 발견했습니다. – SIM

답변

0

퍼센트 (20)는 공간에 대한 URL 인코딩 (0x20에 존재 공간의 ASCII 코드)입니다. 공백으로 20 %를 모두 바꾸면 모든 것이 잘될 것입니다.

0

파이썬 2에서는 urllib2.unquote(), 파이썬 3에서는 urllib.request.unquote()을 사용하여 URL을 디코딩 할 수 있습니다.

import urllib.request 
url = "https://twitter.com/search?l=enq=ecb%20draghi%20since%3A2012-09-01%20until%3A2012-09-02&src=typd" 
decoded_url = urllib.request.unquote(url) 
print(decoded_url) 
0

내 PC에서 정상적으로 작동합니다. % 20은 공백으로 만 사용할 수 있습니다. URL에는 공백이 포함될 수 없습니다. 일반적으로 플러스 (+) 기호 또는 20 %로 공간을 대체 here

URL 인코딩에서

읽기.