2012-01-29 6 views
2

내가이 페이지의 결과를 추출하는 위키 백과 API를 사용하고자하는Wikipedia API를 사용하여 "접두사가있는 모든 페이지"의 결과를 얻는 방법? 예를 들어이 들어</p> <p><a href="http://en.wikipedia.org/wiki/Special:PrefixIndex" rel="nofollow">http://en.wikipedia.org/wiki/Special:PrefixIndex</a></p> <p>그것에 "뭔가"를 검색 할 때 :

http://en.wikipedia.org/w/index.php?title=Special%3APrefixIndex&prefix=tal&namespace=4

다음, 나는 것 결과 페이지 각각에 액세스하여 정보를 추출하는 것을 좋아합니다.

API는 무엇을 사용할 수 있습니까?

답변

3

list=allpages을 사용하고 apprefix을 지정할 수 있습니다. 예를 들어 :

http://en.wikipedia.org/w/api.php?format=xml&action=query&list=allpages&apprefix=tal&aplimit=max

이 쿼리는 당신에게 tal로 시작하는 각 문서의 ID와 제목을 제공 할 것입니다. 각 페이지에 대한 자세한 정보를 얻고 싶다면, 당신은 generator로이 목록을 사용할 수 있습니다 : 당신은 페이지에 대한 다양한 정보를 얻을 수 prop 매개 변수에 다른 값을 줄 수

http://en.wikipedia.org/w/api.php?format=xml&action=query&generator=allpages&gapprefix=tal&gaplimit=max&prop=info

.