현재 과학 데이터 세트를 기가 바이트로 작업해야하는 프로젝트를 진행 중입니다. 데이터 세트는 정수와 부동 소수점 수의 매우 큰 배열 (30,000 요소) 형태입니다. 여기서 문제는 너무 커서 메모리에 적합하지 않기 때문에 저장 및 작업을위한 디스크 솔루션이 필요하다는 것입니다. 이 문제를 더욱 재미있게 만들기 위해 32 비트 아키텍처를 사용하기로 했으므로이 솔루션의 성능을 극대화해야합니다.과학적 데이터 세트를 디스크에 저장하는 최선의 방법 C++
지금까지 HDF5를 사용해 보았지만 괜찮 았지만 작동하기가 너무 복잡했습니다. 그래서 NoSQL 데이터베이스를 시도하는 것이 최선의 방법이라고 생각했지만 배열을 데이터베이스에 저장하고 문자 배열에 캐스팅하지 않고 저장하는 좋은 방법을 찾지 못했습니다. 나쁜 포인터 두통.
그래서, 나는 당신이 뭘 추천하는지 알고 싶습니다. 어쩌면 HDF5로 작업하는 데 어려움을 덜 줄뿐만 아니라 동시에 성능을 극대화 할 수 있습니다. 또는이 유형의 데이터를 저장하는 데 잘 작동하는 NoSQL 데이터베이스를 알고있을 수도 있습니다. 아니면 이걸로 완전히 잘못된 방향으로 가고있어, 너는 내게 어떤 의미를 더하고 싶어.
어쨌든, 지혜의 말씀을 감사하겠습니다 너희들은 나에게 제공 할 수 있습니다 :
30,000 개의 요소가 Apple II의 메모리에 적합하지 않을 수도 있지만, 합리적으로 현대적이며 유능한 메모리에도 적합해야합니다. –
네, 정확 합니다만 배열은 데이터 집합의 한 요소에 해당합니다. 수백만 개의 배열이 있으므로 30,000 * 1,000,000에 가까워 질수록 메모리에 저장하는 것이 더 어려워 질 것입니다. – Andrewziac