큰 (~ 10 GB) hdf5 테이블에서 pandas.read_hdf를 읽었습니다. iterator = True를 사용하여 한 번에 청크에 액세스 할 수 있습니다 (예 : 한 번에 chunksize = 100000 행).Pandas read_hdf : chunkksize 또는 iterator를 사용할 때 열 이름을 얻는 방법?
모든 열 이름 또는 '키'목록을 가져 오는 방법은 무엇입니까?
또한 어떻게 pandas.read_table과 유사한 get_chunk 메소드가 없습니까? 청크를 통해 직접적으로 유일한 방법 ("데이터 청크"용)을 반복하고 있으며, 다른 번호 매기기 청크에 자유롭게 액세스 할 수 없습니다 ("데이터 [300]")?
편집 :
for i,v in enumerate(data):
if i != 0:
break
colnames = v.columns
하지만 내 두 번째 질문은 여전히 남아있다 : 내가 처음 덩어리를 접속하여 나누기 루프와 열 이름에 액세스 할 수 있습니다처럼
이 보이는 액세스 할 수있는 방법은 없습니다 위의 이상한 단일 반복 반복을 수행하는 대신 팬더 TextFileReader 반복자 (예 : read_table의 get_chunk 메소드 또는 dict 유사 조회, 데이터 [0])를 모방 한 개별 조각?
최고 감사합니다! – quantumflash