안녕하세요, 저는 datawarehouse에 대한 프로젝트를 진행하고 있으며, 제 데이터웨어 하우스를 올바르게 모델링하고 있는지 확실하지 않습니다. 내 datawarehouse 비즈니스 프로세스에 따라서 나는 그것에 대해 아주 작은 정보를 찾을 수 없습니다.계층 적 모델링 데이터웨어 하우스 - 눈송이 또는 별?
기본적으로 나는 많은 라이브러리 정보가 들어있는 라이브러리 파일을 가지고 있으며 각 셀에는 많은 핀 정보가 들어 있으며 각 핀에는 타이밍 및 전원 정보가 들어 있습니다. 서로 다른 라이브러리 파일은 기본적으로 셀의 같은 수도 형성 핀, 단지 타이밍/전력 정보는 differen입니다
라이브러리 -> 셀 -> 핀 -> 타이밍/전력 내가 알고 관심
셀 속성 -timing/power 그래서 나중에 비교할 수 있습니다.
사실 테이블에 라이브러리 차원 및 날짜 차원의 외래 키만 포함되어있는 snowflake 스키마에서웨어 하우스로 모델링해야합니까? 그런 다음 라이브러리 차원을 셀 차원으로 더 나누고 셀 차원을 핀 차원으로 더 나눈 다음 핀 차원을 타이밍 및 전원 차원으로 나눕니다
또는 내 사실 테이블에 라이브러리의 외래 키가 들어있는 스타 스키마에서, 셀, 핀, 타이밍, 전력 및 날짜 차원?
내 데이터는 약 200 개의 라이브러리 파일을 가지고 있으므로 각 라이브러리 파일에는 약 20k 셀이 포함되어 있으므로 각 셀에는 몇 개의 핀이 포함되어 있고 각 핀에는 몇 가지 타이밍 및 전원 정보가 들어 있습니다. 따라서 전체 크기는 그 큰 200 X 20,000 X 4 ×
4 I 의지 나에게 어느 제안을 줄 수
을 발표 라이브러리 파일의 새 버전이있을 때마다 지속적으로 데이터의 큰 세트 펌프 수 ?Library A
Cell A
Pin A1
Condition A11
riseTimingTemplate
fallTimingTemplate
risePowerTemplate
fallPowerTemplate
계층 구조는 위의 쇼 : 더 나은
편집을 dfdf. 다른 라이브러리에는 동일한 셀, 핀 및 조건이 포함되며 타이밍 및 전원 템플릿 만 다릅니다.
하자 내 사실 곡물이
그래서 내 치수가 라이브러리, 세포, 핀, 조건, risingTimingTemplate, fallTimingTemplate, risePOwerTemplate 및 fallPowerTemplate, 정확한 팩트 테이블에 대한 모든 링크가 것 특정 셀의 타이밍 및 전력 값이 될 것이다라고?
간단한 쿼리 엔진을 만듭니다. 그래서 내가 눈송이를 사용하든 안 했든 위의 언급처럼 8 차원 테이블을 갖게 될까요 (제 편집 질문)? 2+ 라이브러리는 동일한 셀과 일치하므로 중복을 피할 수있는 방법이 많이 생깁니 까? –
2 + 라이브러리가 셀과 일치한다고 말하면 lib1이 cell2와 cell3에 링크되거나 cell2에 lib1과 lib2에 대한 링크가 있습니까? 위의 내용을 일단 확인하면 업데이트 될 것입니다. 또한, 상승과 하강이 서로 의미 상으로 일치합니까? 이러한 측정 값이 서로 관련되어 있으면 실제로 하나의 사실 테이블 일 수 있습니다. 그렇지 않은 경우에도 네 세트의 사실/측정 값 열이 될 수 있습니다. –
lib1에 cellA cellB cellC가 포함되어 있고 lib2에 cellA cellB와 cellC도 포함되어있는 경우 pin과 동일합니다. 타이밍/전원 정보가 다릅니다. 라이브러리는 작동 조건에 따라 특성이 다르며 작동 조건 (라이브러리)이 다르며 동일한 셀과 핀이 있지만 각기 다른 riseTiming, fallTiminf, risePOwer, fallPower 정보가 포함되어 있습니다. 또한 팩트 테이블을 사용해야합니까? 어디에 내 타이밍/전력 정보가 실제로보다는 차원에 저장되어 있습니까? –