2012-07-11 3 views
0

웹 페이지와의 연결을 설정해야 프로젝트에서 작업해야하므로 해당 페이지에서 xml dtd 스키마 조각을 수집하고 검색을 적용 할 수 있습니다 알고리즘을 사용하여 사용자가 입력 한 키워드를 검색합니다. 이미 파이썬에서 알고리즘을 만들었지 만 파이썬에서 연결을 설정하는 방법을 모릅니다. 누구든지 이걸 안내 할 수 있니?파이썬에서 일부 웹 페이지와의 연결을 설정하려면

당신이 웹 페이지를 가져 오지 단지 의미하는 경우

+2

가까운 곳에도 없습니다. –

+0

http://docs.python.org/library/urllib2.html –

+0

언제나처럼, python stdlib은 당신의 친구입니다. 인터넷 프로토콜에 대한 특별 섹션 (http://docs.python.org/library/internet.html)도 있습니다. –

답변

2

을 제발 도와주세요, 당신은이 같은 시도 할 수 있습니다 :

import urllib2 
url = 'http://www.example.com/index.html' 
req = urllib2.Request(url) 
response = urllib2.urlopen(req) 
#now you can get the data by response.read() 
0

을 urllib2가 같은 libs와 거기에있는 동안 내가 HTTP에 대한 산란 소켓 등을하지 않는 것이 좋습니다 @fvwmer 또는 개인적으로 좋아하는 twill이 사이트 검색, 콘텐츠 다운로드 및 웹 양식 채우기를위한 쉬운 스크립팅 언어로 언급되었습니다.

import re 
import twill 

go('http://www.stackoverflow.com') 
content = show() #saving content in a variable 
if re.search('some regex', content): 
     'do something'