2017-11-16 16 views
-1

압축 된 위키 백과 코퍼스를 .bz2 형식으로 다운로드했습니다. API를 사용하지 않고도 대량의 데이터를 검색 할 수 있습니까? 데이터베이스에 전체 데이터베이스를 업로드하고 데이터 마이닝을 위해 검색해야합니다.파싱 위키 백과 .bz2 덤프

답변

0

분명히, bzcat/bzgrep은 "API를 사용하지 않는 것"에 가장 가까운 것입니다.

그러나 어느 시점에서 에 대한 검색 API에 대해 더 빨리 생각하고 싶을 것입니다. 검색.