사용할 데이터베이스 시스템을 결정할 때 도움이 필요합니다. (저는 지난 몇 시간 동안 인터넷 검색과 독서를 해왔으며 직접 지식을 가진 사람에게 도움을 요청하는 것이 좋습니다.)200MIPS/일, 월간 요약 쿼리를위한 데이터베이스 솔루션
근무일 기준으로 8 시간당 2 억 회 이상을 기록해야합니다. 데이터베이스를 검색 한 다음 해당 데이터에 대한 주간/월간/연간 요약 쿼리를 수행합니다. 요약 쿼리는 청구 명세서와 같은 것에 대한 데이터를 수집하는 것입니다 (예 : "이번 달에 각 사용자가 A 유형의 거래를 몇 번이나 했습니까?" (더 복잡 할 수 있지만 일반적인 생각입니다).
필요에 따라 여러 대의 컴퓨터에 데이터베이스를 분산시킬 수는 있지만 오래된 데이터를 오프라인으로 가져갈 수는 없다고 생각합니다. 필자는 1 개월 분량의 데이터를 쿼리 할 수 있어야합니다. 어쩌면 1 년이 걸릴 수도 있습니다. 이러한 쿼리는 내 용도로 사용되며 최종 사용자에게 실시간으로 생성 될 필요는 없습니다 (필요할 경우 야간에 실행할 수 있음).
누구에게 적합한 데이터베이스가 좋을까요?
P. 카산드라는 글을 다룰 때 아무런 문제가 없을 것 같지만 거대한 월별 테이블 스캔은 어떨까요? Cassandra/Hadoop MapReduce 성능에 익숙한 사람이 있습니까?
나는 큰 문제가 있고 기존 데이터베이스 인프라가 없다는 것에 놀랐다. 지금까지 시스템이 어떻게 작동 했습니까? – Summer
그래, 솔직히 말해서, 금요일 오후에 나는 세부 사항이 부족했다. 나는 주말에 이것을보고 싶었다.하지만 포스트 작업 맥주가 기다리고 있었다;) 데이터는 현재 PostgreSQL 데이터베이스, 쓰기 버퍼로 작동하는 SQLite 데이터베이스가 몇 개 있습니다 (RAM에 있음). 이것은 현재 잘 작동합니다. 쓰기와 계속 유지되며 초당 수 백 메가 바이트 (postgres db는 약 4TB입니다)를 통해 질의합니다.실제로 그것은 확장 인 문제입니다. 볼륨이 꾸준히 증가하면서 시스템을 확장하는 현실적인 계획을 세우는 것이 좋을 것입니다. –