2016-08-10 6 views
2

데이터가 일정한 간격으로로드 된 다음 나중에 꺼내는 시스템이 있습니다. 판매가 일어날 때 판매 데이터가 발생한다고 말한 다음 나중에 한 달 동안 모든 판매 데이터를 가져오고 싶습니다. 단일 풀에서 최대 200K 행. 별로 OLTP가 진행되지 않습니다. 새 데이터가 들어올 때만 삽입합니다.데이터웨어 하우스 RedShift 대 다른 RDBM

데이터웨어 하우스 또는 RDBMS를 사용할 수 있습니다. 내 데이터가 여러 TB로 실행되지 않는 경우, 1TB 정도라고 가정하면웨어 하우스 태그가없는 기존의 RDBM 대 데이터웨어 하우스를 사용하는 이점이 있습니까? 창고에서 나에게 또 다른 무엇을 사 주겠습니까?

내가 RDBM과 함께 갈 수 있기 때문에 묻고 있는데, Redshift와 같은 시스템에서는 MPP 처리에 대해 말합니다. RedShift가 MPP 때문에 더 빠를까요? 일반 RDBM을 사용해야합니까? 데이터에웨어 하우스 종류 데이터 분석을 수행하지 않을 것임을 주목하십시오. 내 데이터가 너무 커져서 RedShift와 같은 제품의 슬라이스/다중 노드 기능이 필요하지 않습니다. RedShift를 사용하더라도 단일 노드에있을 가능성이 큽니다.

-Amit

답변

3

선택하는 시스템 (예 : RDS Redshift에 대)는 는 거래 오프 비용에 대한 귀하의 요구 사항에 의존해야한다.

Amazon Redshift는 일반적으로 많은 양의 정보 (예 : 수십억 개의 행)에 걸쳐 복잡한 쿼리 (예 : 많은 행, 많은 조인)에 더 적합한 옵션입니다.

일부 요소

고려해야 할 :

  • 데이터의 볼륨 - Redshift에가 TB의 저장 및
  • 데이터
  • 심지어 PB들 수 쿼리 속도와 복잡성 - 적색 편이 MPP에 자연은 큰 처리 할 수 기존 SQL 데이터베이스보다 빠른 데이터 볼륨
  • 확장 성 - 기존 SQL 데이터베이스는 수직으로 확장 가능 (대형 서버) 할 수 있지만 Redshift는 수직으로 확장 할 수 있습니다. d 가로로. 또한 추가 Redshift 노드는 저장 용량과 처리 용량을 모두 추가합니다.

대답은 두 가지 대안을 모두 시도하고 가장 적합한 것을 선택하는 것입니다.. Amazon RDS에서 실행되는 기존 SQL 데이터베이스가 사용자에게 적합하고 Redshift 솔루션보다 저렴하면 대단합니다!

비교를 수행 할 때는 데이터베이스 비용과 저장소 비용 (모두 Redshift 노드의 비용에 포함)을 포함시켜야합니다.

+0

질문의 요점은 "시도해"는 것을 피하는 것이 었습니다. 다른 경험을 통해 배우기를 희망했습니다. 나는 Redshit의 PB 스케일을 알고 있습니다. 그렇기 때문에 나는 PB 스케일로 가지 않을 것이라고 언급했다. DB가 PB 스케일 인 경우 내 경험에 따라 WareHouse에 제안 할 것입니다. – Amit