프로그래밍 방식으로 인터넷에서 텍스트 문자열로 수십만 개의 오픈 액세스 북을 가져 오려고한다고 가정합니다. 제 의도는 그들에 대한 분석을하는 것입니다 (팬더 사용). 이미 응용 프로그램의 일부 부분에서 mongodb를 사용하고 있지만 pendrive에 넣고 다른 컴퓨터로 전송하는 것이 쉽지 않다고 생각합니다. Sqlite는 휴대용이지만 SQL을 작성하는 것은 싫다. 필자가 보았던 다른 옵션은 hdf5라는 파일이나 개별 텍스트 파일로 파일 시스템에 넣는 것입니다.많은 양의 텍스트 데이터에 hdf5를 사용할 수 있습니까?
hdf5는 이러한 유형의 텍스트 전용 데이터에 적합합니까? 그렇지 않은 경우 사용할 수있는 다른 옵션은 무엇입니까?