earnings = self.collection.find({}) #return 60k documents
----
data_dic = {'score': [], "reading_time": [] }
for earning in earnings:
data_dic['reading_time'].append(earning["reading_time"])
data_dic['score'].append(earning["score"])
----
df = pd.DataFrame()
df['reading_time'] = data_dic["reading_time"]
df['score'] = data_dic["score"]
코드 사이에 --- 완료하는 데 4 초가 걸립니다. 이 기능을 어떻게 향상시킬 수 있습니까?mongodb에서 데이터를 가져 오는 성능을 향상 시키십시오.
각 목록을 data_dic에 사전 할당하고 목록에 지속적으로 추가하는 대신 특정 색인에서 요소를 변경하는 것이 하나의 가능성입니다. 또한 여러 코어를 사용할 경우 멀티 스레딩을 도입 할 수 있습니다. –
try [MongoDB aggregation] (https://docs.mongodb.com/manual/aggregation/) – Valijon