1

스타 스키마의 차원에서 37 가지 다른 속성/"체크 포인트"(합격/불합격/해당 없음으로 평가 될 수 있음)를 모델링하는 가장 좋은 방법은 무엇인가요? 팩트 테이블의 각 행은 문제의 체크 포인트에 대해 채점되는 통신입니다.별표 스키마에서 많은 세미 부울 애트리뷰트를 모델링하는 방법에 대한 질문

TL; DR은 :

나는 사실 테이블의 각 행은 단일 통신하는 스타 스키마 모델을 개발했습니다. 이러한 통신은 일련의 등급이 매겨진 "수표"(예 : "시간대에 게시 됨", "전자 메일 제목 수정", "XYZ 내용이 올바르게 복사 됨"등)을 통과하며 각 수표는 "합격", "누락" 또는 "해당 사항 없음".

다른 유형의 통신은 각기 다른 검사 세트에 따라 등급이 매겨집니다 (예 : 한 가지 유형의 통신은 세 가지 검사에서만 등급이 매겨지고 나머지는 "적용 불가능 함", 다른 유형의 통신은 19 가지 검사에서 등급이 매겨집니다). 총 37 개의 고유 검사가 있습니다.

"CommunicationGrading"Type 2 천천히 변화하는 차원을 구축하여 어떤 "수표"통신이 가장 저조한지를 쉽게보고 할 수있게했습니다. 이 차원에는 각 속성에 대해 하나씩 37 개의 열이 있으며 각 행은 속성 및 해당 열에서 수신 할 수있는 점수의 순열입니다 (통과/실패/NA). 새로운 순열을 사용할 수있게되면 새로운 행이 추가됩니다. 가능한 모든 순열을 채우면 불행히도 수백만 행이 반환되지만이 방법은 < 개의 행으로 훨씬 적은 오버 헤드입니다. 37 개의 개별 "점검"을 놓친 통신 수를 집계하는 37 개의 개별 측정을 작성했습니다.

신속하게 PBI에 트리 맵을 만들고, 거기에 37 개의 측정 값을 드래그하고, 각 "확인"을 놓친 통신의 총 개수를보고, X 개의 통신에서 X 검사 점을 놓친 것으로 판단 할 수 있습니다. 문제는 슬라이서로 시각을 사용하고자 할 때입니다 (예 : 트리 맵의 체크/타일을 선택하여 개별 통신이 트리 맵 아래의 테이블에서 그 체크를 놓친 것을 확인). 슬라이스가 주어진 경우 상위 N 개의 "체크"를 결정합니다. 데이터의.

내가 말할 수있는 것부터, 하나의 특성과 하나의 측정 값 대신 37 개의 다른 특성과 측정 값을 사용하기 때문에 문제가 발생합니다 (단일 측정 값을 값으로 끌어 올 수있는 단일 특성/모든 검사를 포함하는 열). 트리 맵의 시각적 그룹 필드). 문제는,이 모델링/그레이딩 차원을 가장 잘 모델링하는 방법에 난처한 점입니다. 그 중 하나는 수표와 수표의 가능한 점수에 대해 하나씩 두 개의 열로 차원을 트리밍 한 다음 M : M 관계를 처리 할 브리지 테이블을 만드는 것입니까? 다른 아이디어?

답변

0

귀하의 차원 (Google에 뭔가 정크 차원으로 구현 됨)은 그 일을하는 한 가지 방법입니다. 도로를 따라 가면 관련 체크 포인트의 여러 차원으로 나누어 각각의 순열을 크게 줄일 수 있습니다. 또한 이것이 왜 유형 2 일 필요가 있는지 명확하지 않습니다. 추적해야 할이 차원의 역사가 있습니까?

그러나 각 탐색 점에서 각 통신 점수에 대해 새로운 사실을 탐색하는 것이 좋습니다. 하나의 차원 결과 (통과, 실패, 적용 불가)와 각 체크 포인트의 한 차원을 가질 수 있습니다. 체크 포인트 설명 일뿐입니다). 또한 37 가지 조치를 취하는 것보다 그 사실을 의지 할 수 있습니다. 보유 할 집계 정보가있는 경우 커뮤니케이션 수준에서 사실을 유지하고 싶지만 요구 사항에 따라 달라질 수 있습니다.

+0

답장을 보내 주셔서 감사합니다. Rich! Type-2 SCD와 관련하여 모든 가능한 순열을 차원에 채우는 대신 필요에 따라 행을 추가한다는 의미였습니다. 나는 여전히 모든 용어에 대해 조금 새로운 것이므로 믹스에 대한 사과드립니다! 올바르게 이해했다면 각 통신에 대한 새로운 사실로부터 통신마다 각 체크 포인트에 대한 새로운 사실로 통신 사실 테이블의 그레인을 낮추라고 제안 하시겠습니까? 이전에 생각했던 것이 아니지만 작동해야한다고 생각합니다. 감사! –

+0

아 예, 유형 2 SCD는 행에 따라 다가가는 기술이 아닌 기록 추적 기술입니다. 걱정하지 마세요, 용어는 중요하지 않습니다. 아이디어가 중요합니다. 네, 의사 소통의 각 체크 포인트에 대한 각 결과에 대해 더 낮은/더 자세한 그레인을 제안했습니다. 이상적이지는 않지만 시험 할 수있는 한 가지. – Rich