2013-06-11 4 views
2

기본 스타 스키마를 사용하여 팩트 테이블에는 최소한 각 차원의 행 수와 동일한 행 수가 있어야한다고 말했어.데이터웨어 하우징의 팩트 테이블 이해

예를 들어, 3 개의 제품, 5 개의 판촉 및 10 개의 상점은 제품이 실제로 모든 판촉 활동을했는지 또는 모든 상점에 있는지에 관계없이 팩트 테이블이 최소 150 개의 레코드를 가져야 함을 의미합니다. 특히 null 값은 예를 들어 제품에 특정 프로모션 등이없는 경우에 존재합니다.

지원할 수있는 학문적 소스를 제공 할 수 있습니까? 아니면 적어도이 아이디어를 확인하십시오.

내가 이것을 묻는 이유는 필자가 필자가 사실 테이블에 쓸모없는 대량의 데이터를 생성 할 것이라는 것을 이해한다는 것입니다.

감사합니다.

+0

킴볼 (Kimball) 서적을 꼼꼼하게 읽으십시오 - 잘 쓰여지고 간단합니다. –

+0

안녕하세요, 답장을 보내 주셔서 감사합니다. 벨로우즈 게시물을 참조하십시오. – Luke

답변

0

물론 아닙니다. 나는이 주장을 분명히하기 위해 당신의 출처를 물어볼 것을 제안한다. 마치 여기 어딘가에서 오해가있는 것처럼 들린다.

그리고 시간 차원을 추가하면 어떻게 될까요? 또한 프로모션이 누락 된 키로 null 값을 가질 수도 없습니다. 이유는 키 값이 null 값이 아닌 차원 값을 가리 키기 때문입니다.

크기 값은 사용자가 보유한 사실을 지원하기위한 것이며 다른 방법은 아닙니다.

+0

안녕하세요, 답장을 보내 주셔서 감사합니다. 벨로우즈 게시물을 참조하십시오. – Luke

1

안녕하세요. 답장을 보내 주셔서 감사합니다. 저는 강사와상의 한 후 실제로는 다음과 같은 페이지 참조를 발견했습니다. "... 3 개의 제품, 5 명의 고객, 30 일 및 10 명의 영업 담당자가 차원 테이블에서 행으로 표시되는 매우 단순한 예를 생각해보십시오. 팩트 테이블 행의 수는 4500이며 차원 테이블 행과 비교하면 매우 큽니다. "(Ponniah, P., 2009. 데이터웨어 하우징 : IT 전문가를위한 기본 사항, 2 판 John Wiley & Sons, Inc., New Jersey, p.237)

그러나 저자는 다음과 같이 말합니다. "사실 테이블의 한 행은 특정 제품, 특정 달력 날짜, 특정 고객 및 즉, 특정 제품, 특정 달력 날짜, 특정 고객 및 개별 영업 담당자의 경우 해당 제품에 해당 행이 있습니다. 사실 테이블. 날짜가 휴무일인데 주문이 접수되어 처리되지 않으면 어떻게됩니까? 그러한 날짜의 사실 테이블 행에는! 수 값이 없습니다. 또한 차원 테이블 속성의 다른 조합, 사실 테이블 행에 널 치수가있는 값이있을 수 있습니다. 사실 테이블에 nulls 측정 값과 같은 행을 유지해야합니까? 이럴 필요가 없습니다. 따라서 스파 스 데이터의 유형을 실현하고, 사실 테이블이 차이가있을 수 있음을 이해하는 것이 중요합니다. "한마디로

이, 너희들이 올바른 것 같습니다 감사합니다!

+0

강사는 모든 고객이 모든 영업 담당자로부터 매일 모든 제품을 구매한다고 생각하지 않기를 바랍니다. 사실 테이블 행은 일반적으로 레코드 (판매 등)가없는 곳에는 존재하지 않습니다. –

+0

@David 이상하게도 Kimball이 자신의 저서 중 하나에서 사용하는 Snapshot Fact의 예가 거의 완벽하게 설명 된 것 같습니다 : 고객이 거래를 완료했는지 여부에 관계없이 매일 모든 고객에 대해 행이 채워지는 CRM웨어 하우스 . 미스터 킴볼 (Kimball)의 말처럼 나는 건강한 회의론과주의를 기울여 치료한다. – sqlvogel

+0

@David, 사실, 제 강사는 ...하지만 소금 한 덩어리로 찍을 것입니다. 분명히 그 가치는 다음 학기의 데이터 마이닝에서 분명해진다. – Luke

0

이 특정 종류의 관련 될 수있다 사실 테이블 :.. 랄프 킴볼 용어 주기 스냅 팩트 테이블을 패턴 팩트 표에는 각 시점에 대한 행의 전체 모집단을 반복하는 곳이된다 IMO 그 방법의 유용성은 매우 제한된다

를했다. 스냅 샷 팩트 테이블은 팩트 테이블이 차원의 결과물임을 암시 적으로 요구하지 않지만 w의 잠재적 인 문제를 제기합니다 모자는 각 스냅 샷의 정확한 인구가 있어야합니다. 치수의 교차 곱은 내가 가정 할 수있는 한 가지 방법입니다.