수천 개의 레코드를 Arango로 가져 오려고합니다. 나는 Arango의 일괄/대량 가져 오기 기능을 사용하려고합니다 : https://docs.arangodb.com/3.0/HTTP/BatchRequest/index.html PUT 및 POST 요청을 조합하여 새 레코드를 삽입하거나 이미 존재하는 레코드를 업데이트하십시오. 내 최종 솔루션 PyArango
현재 ArangoDB POC에서 작업 중입니다. PyArango를 사용하는 ArangoDB에서 문서 작성에 소요되는 시간이 매우 길다는 것을 알게되었습니다. 300 개의 문서를 삽입하는 데 약 5 분이 소요됩니다. with open('abc.csv') as fp:
for line in fp:
dataList = line.split(",")
ca를 전송하려고합니다. 10GB의 json 데이터 (제 경우에는 트윗)를 arangodb의 콜렉션에 저장합니다. 나는 또한 그것을 위해 JOBLIB 사용하려고 해요 : from ArangoConn import ArangoConn
import Userdata as U
import encodings
from joblib import Parallel,d
나는 코드와 데이터베이스 개체를 얻을 수 있습니다 : import pyArango.collection as COL
collection = COL.Collection(database, jsonData)
나는 내 컬렉션을 반환 jsonData의 형식을 어떻게 : import pyArango.database as DAT
db = DAT.Database(c