모든 영어 wikipedia 기사에 대한 모든 개정 내역을 얻으려고합니다. 기사 제목이나 ID와 함께 모든 편집자의 이름과 판 크기 (바이트 단위) 만 있으면됩니다. 모든 개정 내역에 대한 위키피디아 덤프는 몇 TB이며 컴퓨터가 처리 할 수 없습니다. 또한 MediaWiki를 사용하여 개정 내역을 쿼리하려고 시도했지만 모든 것을 얻는 데 오랜 시간이 걸릴 것으로 보입니다. 원하는 정보를 얻기 위해 시도 할 수있는 다른 방법이 있습니까? 감사.위키 백과 수정 내역
0
A
답변
0
다른 방법으로 문제를 해결하면 모든 데이터를 다운로드하지 않아도됩니다. 예를 들어, SQL을 사용하려는 경우 아무 것도 다운로드하지 않고 서버에서 수행 할 수 있습니다.
https://quarry.wmflabs.org/ 및 its doc을 참조하십시오.
+0
죄송합니다. 고마워요! –
더 큰 디스크를 가져 오거나 클라우드 컴퓨팅을 사용 하시겠습니까? 기술적으로 할 수있는 몇 가지 API가 있지만 이러한로드는 의도 한 용도를 훨씬 뛰어 넘는 것 같습니다. – Tgr