3
use MediaWiki::DumpFile;
$mw = MediaWiki::DumpFile->new;
$sql = $mw->sql($filename);
$sql = $mw->sql(\*FH);
$pages = $mw->pages($filename);
$pages = $mw->pages(\*FH);
$fastpages = $mw->fastpages($filename);
$fastpages = $mw->fastpages(\*FH);
use MediaWiki::DumpFile::Compat;
$pmwd = Parse::MediaWikiDump->new;
펄에 완전히 새로운 해요 모든 HTML 페이지를 저장하는 $와 fastpages을 수행하는 (또는 텍스트, 그것은 중요하지 않습니다) 모르겠어요 XML 덤프에서. 너 나 좀 도와 줄 수있어? 그리고 * FH는 무엇입니까?
추출 라이브러리를 검색하는 동안이 우수한 페이지를 찾았습니다 : http://medialab.di.unipi.it/wiki/Wikipedia_Extractor. 문제의 방법 대신 사용할 수 있습니다. – DSblizzard