2017-10-09 6 views
2

많은 호주 기업의 재무 제표를 pdf로 가져 오려고합니다. 나는 팬더 dataframe에 저장된 모든 기업이 자신의 회사 이름라는 컬럼에 '회사'이것은 URL을 검색하기 위해 지금까지 내 코드입니다 (당연히)파이썬을 사용하는 광고가 아닌 Google 검색의 첫 번째 결과를 얻으려면 어떻게해야합니까?

import webbrowser 

tabUrl = "http://google.com/?#q=" 
append = "+financial+report+2017" 
file_type = 'filetype%3Apdf+' 

for company in data["Company"]: 
     googleSearch = tabUrl + file_type + company.replace(" ", "+") + append 
     print(googleSearch) 

모든 검색 반환의 수 광고를 첫 번째 결과로 보냅니다. 광고가 아닌 첫 번째 결과는 어떻게 열 수 있습니까?

감사합니다.

답변

2

지금 당신은 구글의 웹 페이지 URL로 요청을 보내는 당신이 https://www.google.com

이 작업을 수행하는 더 좋은 방법에 가면 당신이 구글에 표시되는 광고를 포함 할 표시되는 결과에 구글 Custom Search API를 사용하는 것 귀하의 요청을 보내고 결과를 얻으십시오. 현재 문서를 얻을 수 있습니다 : 자신의 문서에서 https://developers.google.com/custom-search/json-api/v1/using_rest

을, 당신은 당신이 당신의 API KEY사용자 정의 검색 엔진 ID를 생성하면 당신이 그들의 서비스 엔드 포인트에 REST 요청을 할 수 있음을 볼 수

GET https://www.googleapis.com/customsearch/v1?key=INSERT_YOUR_API_KEY&cx=017576662512468239146:omuauf_lfve&q=lectures