2016-11-07 2 views
4

.h5 파일에 저장된 데이터 세트를 다운로드했습니다. 특정 열만 유지하고 그 안에있는 데이터를 조작 할 수 있어야합니다.팬더 데이터 프레임에 hdf5 파일

이렇게하려면 팬더 데이터 프레임에로드하려고했습니다. 내가 사용하려고했습니다

pd.read_hdf(path) 

을하지만 내가 얻을 : 나는 SO (read HDF5 file to pandas DataFrame with conditions)에 대한 답변을 발견했습니다 No dataset in HDF5 file.

하지만 조건을 필요로하지 않으며, 대답은 어떻게 파일에 대한 조건을 추가 나는 그 일에 관해서 아무 것도 할 수 없기 때문에 그 파일의 작성자가 아니 었습니다.

나는 또한 h5py 사용하려고했습니다

:

df = h5py.File(path) 

을하지만 쉽게 조작 가능한하지 않고 내가 (df.keys()를 사용하여 열 이름 만) 그것의 열을 얻을 수없는 것 모든 이 작업을 수행하는 방법에 대한 아이디어?

답변

0

당신의 HDF 파일은 여기

이 HDF 파일을 탐색하는 방법을 보여줍니다 작은 데모입니다 ... 비어있는 것으로 보인다

In [4]: fn = r'D:\temp\.data\test.h5' 

In [5]: store = pd.HDFStore(fn) 

In [6]: print(store) 
<class 'pandas.io.pytables.HDFStore'> 
File path: D:\temp\.data\test.h5 
/test   frame_table (typ->appendable,nrows->7,ncols->4,indexers->[index],dc->[Col1,Col2,Col3,Col4]) 

In [7]: df = store.select('test') 

In [8]: df 
Out[8]: 
     Col1  Col2 Col3 Col4 
0  what  the  0  0 
1  are curves  1  8 
2  men  of  2 16 
3   to  your  3 24 
4  rocks  lips  4 32 
5  and rewrite  5 40 
6 mountains history.  6 48 
4

팬더 HDF 지원 형식의 할 HDF 파일이 필요합니다 매우 구체적입니다. 자세한 내용은 https://stackoverflow.com/a/33644128/4128030을 참조하십시오.

+0

예. 이에 대한 자세한 내용은 [여기] (https://stackoverflow.com/a/30787168/4653485)를 참조하십시오. –