SQL 쿼리를 실행하고 출력 DF를 사전으로 변환하여 mongo에 대량 삽입하기 위해 pyspark와 함께 Snappydata를 사용하고 있습니다. 나는 스파크 DF를 사전으로 변환하는 것을 테스트하기 위해 많은 비슷한 질문을했다.pespark에서 사전을 만드는 가장 빠른 방법 DF
현재 map(lambda row: row.asDict(), x.collect())
이 방법을 사용하여 bulk DF를 사전으로 변환합니다. 그리고 10K 기록을 위해 2-3 초가 걸립니다.
x = snappySession.sql("select * from test")
df = map(lambda row: row.asDict(), x.collect())
db.collection.insert_many(df)
가 빨리 방법이 있나요 :
나는 내 생각을 impliment 방법을 아래에 언급 한?
코드를 확인 했습니까? 실행 했습니까? 그것은 나를주는 오류'AttributeError : 'itertools.chain'개체에 속성이 없습니다 'asDict'' – techie95