필자는 누구나 CSV 파일을 열 단위로 읽을 수있는 빠른 기능을 제공하는 사람에게 익숙합니다. 과 대용량 데이터 (예 : CSV)를 효율적으로 읽을 수있는 방법을 제안 할 수 있습니까? CSV 파일의 i th 열을 예로들 수 있습니다.파이썬으로 csv 파일의 i 번째 열을 읽는 가장 좋은 방법은 무엇입니까?
나는 다음과 같은 있지만 시간이 소요 있습니다
import os,csv, numpy, scipy
from numpy import *
f= open('some.csv', 'rb')
reader = csv.reader(f, delimiter=',')
header = reader.next()
zipped = zip(*reader)
print(zipped[0]) # is the first column
는 파이썬 (큰 파일)에서 데이터를 읽을 수있는 더 나은 방법이 있나요 (적어도 빠른 R과 같은 메모리의 측면에서)을? 다음은 COL을 얻을 전치, 메모리에 전체 파일을로드하는 당신이 zip
를 사용하고있는