2015-01-26 4 views
1

웹 사이트에서 검색 한 첫 번째 결과를 따라야합니다.Python - mechanize를 사용하여 특정 링크 따라하기

.csv 파일에서 찾고자하는 이름을 입력하여 웹 사이트를 열어 이미 수행 한 검색으로 웹 사이트를 엽니 다.

def name_to_url(name): 
    words = name.split(" ") 
    url = "http://website/search/results?Name=" 
    end_of_url = "&Type=0&IncludeNlsp=True" 
    for word in words: 
     url += "%s+" % word 
    url += "%s" % end_of_url 

    return url 

with open('file.csv', 'rb') as f: 
    reader = csv.reader(f) 
    for row in reader: 
     open_page(name_to_url(row[0])) 

나는 이것이 가장 좋거나 최선의 방법은 아닐 수도 있지만 지금은 충분하다고 알고 있습니다. 내 주요 관심사는 검색에서 반환하는 링크를 따라하는 방법입니다.

이름이 "Google"이고 검색 결과가 굵은 녹색 텍스트에 "Google"이라고 표시된 링크를 반환한다고 가정 해 봅시다. 나는 기계화에 대해 살펴 봤지만, 웹 사이트의 예제는 정규 표현식을 사용하기 때문에 주로 어떻게해야 할지를 알 수 없다.

+0

여기를 참조하십시오 : http://stackoverflow.com/a/4302041/1994708 – flamusdiu

답변

0

링크를 추출하는 방법은 여러 가지가 있으며 mechanize을 따른다. 당신이 url_regex 또는 text_regex으로 링크를 필터링 browser.links()를 사용할 수

browser.follow_link(nr=number) 

을 또는 : 당신을 위해 작동 할 수있는 가장 쉬운 옵션을 사용하여 인덱스를 얻을 수있을 것이다.

은 참조 :