여러 개의 HDF5 파일에서 데이터를 처리하기 위해 64 비트 버전의 Enthought Python을 사용하고 있습니다. 나는 64 비트 Windows에서 h5py 버전 1.3.1 (HDF5 1.8.4)을 사용하고 있습니다. 필자는 특정 데이터 계층에 편리한 인터페이스를 제공하는 객체를 가지고 있지만 h5py.File (fname, 'r')을 테스트하면 독
텍스트/숫자가 혼합 된 크기가 큰 (10s of GB) CSV 파일이있는 경우 동일한 내용으로 hdf5 파일을 만드는 가장 빠른 방법은 무엇입니까? 가능한 경우 h5py 모듈을 사용하고 싶습니다. 아래의 장난감 예제에서 나는 hdf5에 데이터를 쓰는 데 매우 느리고 믿을 수 없을만큼 빠른 방법을 발견했습니다. hdf5에 10,000 행 정도의 덩어리로 쓰는
h5py를 사용하여 데이터 (부동 소수점 숫자)를 그룹으로 저장합니다. 데이터 그 자체 외에도 hdf5 내에 추가 파일 (필요한 정보가 들어있는 .xml 파일)을 포함시켜야합니다. 어떻게해야합니까? 내 접근 방식이 잘못 되었나요? f = h5py.File('filename.h5')
f.create_dataset('/data/1',numpy_array_1)
h5py를 사용하여 HDF5 파일에 액세스하고 h5py File 개체를 클래스에 저장합니다. 그러나 나는 새와 폐쇄 h5py 파일 인스턴스 변수를 재 시도에서 이상한 문제가 발생 해요 : class MyClass:
def __init__(self, filename):
self.h5file = None
self.filename
나는 h5py 파이썬이 작동하지만 성공하지 못하게하는 데 하루를 보냈다. HDF5 공유 라이브러리를 설치했고 웹에서 찾을 수있는 지침에 따라 올바르게 작성했습니다. 하지만 그것은 작동하지 않습니다, 아래는 파이썬 모듈을 가져 오려고 할 때 얻을 오류 메시지입니다. MacPorts를 통해 설치를 시도했지만 다시는 작동하지 않습니다. 내가 Python27 32