2014-07-19 2 views
1

내가, 위키 미디어 API에서 익명의 편집에 대한 자세한 내용을 당겨과 같이하려고 해요의 수정 사항 얻을 :위키 백과의 API 호출은 익명 만 편집 지정하지만 나는 비 익명을 많이 다시

http://en.wikipedia.org/w/api.php?action=query&list=recentchanges&format=json&rcstart=2014-01-01T00%3A00%3A00Z&rcdir=newer&rcnamespace=0&rcprop=user%7Ctimestamp%7Ctitle&rcshow=anon&rclimit=100&generator=allpages&gapnamespace=0&gaplimit=2

참고 "rcshow = anon"매개 변수.

그것은 API 샌드 박스에 잘 작동

: https://www.mediawiki.org/wiki/Special:ApiSandbox#action=query&list=recentchanges&format=json&rcstart=2014-01-01T00%3A00%3A00Z&rcdir=newer&rcnamespace=0&rcprop=user|timestamp|title&rcshow=anon&rclimit=100&generator=allpages&gapnamespace=0&gaplimit=2

하지만 R로 가져올 때, 내가 아닌 익명의 뒷면을 많이 가지고 것을 발견은 편집 : 지금처럼

library(rjson) 
json_file <- "http://en.wikipedia.org/w/api.php?action=query&list=recentchanges&format=json&rcstart=2014-01-01T00%3A00%3A00Z&rcdir=newer&rcnamespace=0&rcprop=user%7Ctimestamp%7Ctitle&rcshow=anon&rclimit=100&generator=allpages&gapnamespace=0&gaplimit=2" 
json_data <- fromJSON(file = json_file) 
user <- vector() 
user <- sapply(json_data$query$recentchanges, function(x) c(user, x$user)) 
user 

:

[1] "ValterVBot"       
    [2] "67.87.234.41"      
    [3] "ValterVBot"       
    [4] "86.143.229.147"      
    [5] "Luan Francisco"      
    [6] "לערי ריינהארט"      
    [7] "Чаховіч Уладзіслаў"     
    [8] "Soulkeeper"       
    [9] "ValterVBot"       
[10] "Soulkeeper" 

어떤 일이 벌어지고 익명의 수정 사항을 얻을 수 있습니까?

+1

당신이 당신에게 더 많은 정보를 제공하지 않습니다 사용하는 발전기, 당신은 단지 예를 들어 간단한 쿼리를 위해 그것을 건너 뛸 수 있습니다. cut & generator = allpages & gapnamespace = 0 & gaplimit = 2 – Ainali

+0

이전 호출에서 남은 양호한 호출입니다. 감사. – Traviskorte

답변

2

우선 API 샌드 박스에서 "작동하지 않습니다."라고 말하면 mediawiki.org가 아니라 the sandbox on the English Wikipedia을 사용해야합니다.

결과를 면밀히 살펴보면 모든 익명 항목이 typeexternal 인 것을 알 수 있습니다. 즉, 익명으로 표시되는 해당 기사의 Wikidata 페이지 편집 내용입니다 (변경된 Wikidata 사용자가 로컬 wiki에 없을 수도 있기 때문입니다). 편집 내용을 제거하려면 external을 필터링하는 쿼리에 rctype을 설정

http://en.wikipedia.org/w/api.php?action=query&list=recentchanges&format=json&rcstart=2014-01-01T00%3A00%3A00Z&rcdir=newer&rcnamespace=0&rcprop=user|timestamp|title&rcshow=anon&rclimit=100&generator=allpages&gapnamespace=0&gaplimit=2&rctype=edit

+0

그게 문제였습니다. 많은 감사합니다. – Traviskorte