2012-09-20 3 views
0

Google은 클릭 수, 조회수 및 도달 목표를 저장하는 데이터베이스를 보유하고 있습니다. 추측 할 수 있듯이 데이터베이스의 클릭 수는 수백만에 달하며 더 빠른 통계를 위해 데이터를 집계하기 시작했습니다. 현재 모든 레코드를 삭제하고 집계 테이블에 새로운 레코드를 작성합니다 (mysql 키가 빠르게 올라간다는 것을 정확하게 추측 할 수 있습니다). 그러나 이것은 오류없이 통계를 집계하는 가장 쉬운 방법입니다.데이터베이스에서 집계/비정규 화를 수행하는 가장 좋은 방법은 무엇입니까?

인터넷에서 데이터베이스 집계를 검색했습니다. 데이터를 저장/비정규 화하는 것과 마찬가지로 여러 테이블을 경외하지 않고도 올바른 데이터를 신속하게 선택할 수 있습니다. 그러나 이것에 대한 답변을 찾지 못했습니다.

집계 된 데이터가 빠르게 커지고 시작부터 끝까지 선택할 수 있기 때문에 (예 : 1 년 동안 통계를 선택하는 것과 같이) mysql이 집계 된 데이터를 저장하는 올바른 데이터베이스가 아닌 것으로 생각됩니다. 내 결론이 옳은가? 그렇다면 어떤 데이터베이스를 추천 해 주시겠습니까?

비록 여러 솔루션에 대한 여러 테이블을 통해 데이터를 분할하지만 이것은 영리한 지 확실하지 않습니다.

내 질문은 :

당신이 정확한 당신의 집계 테이블을 유지하기 위해 사용하고있는 통합 기술
  • ?
  • 집계를 저장하는 데 가장 적합한 데이터베이스는 무엇입니까?
  • 여러 테이블에 걸쳐 집계를 분할해야합니까? 아니면 여러 유형의 데이터 요청을 처리 할 수있는 하나의 일반 테이블을 만들어야합니까?
  • 속도 문제를 어떻게 처리합니까?
  • 데이터 집계에 다른 이름이 있습니까?

오랜 질문은 죄송합니다. :) 저는 SO와 인터넷을 수색했으며이 질문들에 대해 좋은 대답을 찾지 못했습니다.

+0

당신은 "나에게 이것을 말하지 마라. 나는 이것을했다."라고 말하면서 실제로 당신이 한 일을 게시하고, 정보에 대한 당신의 탐구 결과가 무엇인지, 적합하다. 마찬가지로, 당신의 질문은 당신에게 가장 좋은 경우에는 버려진 답변을 줄 것이며, 최악의 경우에는 토론 주제가 될 수 있기 때문에 '너무 광범위하게'또는 '건설적이지 않은'것으로 마감 될 수도 있습니다. // 목록 - 주제. – Nanne

+0

나는 자세를 잃은 더 많은 정보를 가지고 편집했습니다. – RJD22

답변

-1

집계를 저장하는 데 가장 적합한 데이터베이스는 무엇입니까?

"협잡"에 대한 정의를 이해하는 경우 모든 관계형 항목을 제거하므로 아마도 noSQL 해결 방법을 모색 중입니다.

여러 테이블에 대해 집계를 분할해야합니까? 또는 여러 유형의 데이터 요청을 처리 할 수있는 하나의 일반 테이블을 만들어야합니까?

불가능한 것은 원하는 것에 달려 있습니다. 당신이하는 일은 비정규 화 (de-normalizing)이므로 데이터를 더 빨리 얻을 수 있습니다. 그러나 너무 비정규 화하면 올바른 데이터를 찾을 수 없습니다. 그래서 그것은 정말로 상황마다 다릅니다.

속도 문제를 어떻게 처리합니까?

다시 말하면 불가능합니다. 대략적으로 : 원인을 찾아 문제를 해결하십시오.

데이터 집계에 다른 이름이 있습니까?

"데이터웨어 하우스"를 만드는 것처럼 보입니까? 그것에 대한 자세한 내용은 임의의 인터넷 (예 : http://en.wikipedia.org/wiki/Data_warehouse)을 참조하십시오.

+0

Nanne은 말하기 어려운 모든 질문에 대해 말하고 있습니다. 누락 된 정보를 알려주십시오. – RJD22

+0

글쎄, 내가 그 일을하지 않은 것은 시작을하지 않고도 대답 할 수 있을지 의심 스럽기 때문이다. 이렇게하는 이유는 속도 문제 때문입니다. 첫 번째 단계는 ... "할 일"입니다. 그렇다면 거기에서 갈 수 있습니다. I/O가 충분히 빠르며, 색인이 당신을 위해 일하고 있으며, 크기 등을 줄일 수 있습니까? 분할하는 경우 : 유지해야 할 정보에 따라 다릅니다. 현재 데이터베이스 스키마와 집계의 최종 목표부터 시작할 수 있습니다. 그러나 속도에 따라서도 달라집니다. 미안 나는 더 명확 할 수 없다 :) – Nanne