I은 대부분 다음과 같이 포맷 될 것이다 많은 양의 데이터를 수집하고 :빅 데이터베이스
사용자 1 (A, O, X, Y, Z, t, H를, u)
모든 변수는 시간을 기준으로 동적으로 변경됩니다. 단, u는 사용자 이름을 저장하는 데 사용됩니다. "큰 데이터"에서 배경이 너무 강하지 않아서 이해하려고하는 것은 배열로 끝날 때마다 108000 x 3500과 같이 매우 커질 것입니다. 각 시간 단계에서 분석을 수행 할 것이므로, 그것을 그래프로 나타낼 때이를 관리 할 수있는 적절한 데이터베이스가 무엇인지 결정하려고합니다. 이것은 과학 연구를위한 것이기 때문에 나는 CDF와 HDF5를보고 있었고 여기서 내가 읽은 것을 바탕으로 NASA 나는 CDF를 사용하고 싶다고 생각한다. 그러나 속도와 효율성을 위해 이러한 데이터를 관리하는 올바른 방법입니까?
최종 데이터 세트에는 모든 사용자가 열로 포함되며 행에 타임 스탬프가 지정되므로 분석 프로그램에서 데이터를 해석하기 위해 행을 한 행씩 읽습니다. 그리고 데이터 세트에 항목을 만듭니다. 어쩌면 CouchDB 및 RDBMS와 같은 것을보아야 할 것입니다. 시작하기에 좋은 장소를 알지 못합니다. 조언을 부탁드립니다. 당신이 장치를 생략 한하지 않는