0

스프레드 시트 사용은 확실히 신뢰할 수 없습니다. ETL 작업을 디자인하고 테스트 할 때 소스 매핑이 변경됩니다. ETL 디자인 프로세스가 발전함에 따라 모든 원본 매핑의 단일 카탈로그 또는 권한있는 카탈로그로 기능했던 스프레드 시트가 업데이트되지 않거나 잘못되었거나 불완전한 정보로 업데이트 될 수 있습니다. 데이터 매핑 문제를 어떻게 해결합니까?"Pre-Etl"소스를 매핑 문제를 해결하는 방법은 무엇입니까?

+1

이 질문은 많은 사람들이 인터뷰에서 묻는 질문과 비슷합니다 (매우 좋지 않은 인터뷰는 아닙니다 ...) –

+1

문제의 진술은 약간 분명하지 않습니다. "pre-ETL "? BI 솔루션의 데이터 계보를 문서화하려고하십니까? –

답변

1

한 명만 사전을 변경할 수 있습니다. 그러나 모든 사람들이 그것을 볼 수 있도록합니다. 시트 중 하나에서 모든 변경 요청 (예 : 수동)을 추적합니다. 사람 이름, 날짜 시간, 업데이트 할 필드.

ETL 문제보다 버전 제어 문제가있는 것 같습니다.

+0

업계에서 가장 큰 대다수의 사람들이 겪은 통합 문제 중 하나입니다. 데이터 통합 ​​/ 데이터웨어 하우징 업계에서 일하는 사람이라면 누구나 데이터웨어 하우스를 구축 할 때 이러한 복잡한 사전 ETL ETL 개발자가 작업을 시작하기 전에 소스 매핑. 대부분의 조직에서 스프레드 시트를 사용하는 방식입니다. 모든 조직에는이 자료를 문서화하는 데 사용하는 엄청난 양의 스프레드 시트가 있습니다. 일단 개발자가 ETL 개발자에게 넘겨 주면 결코 유지 관리되지 않습니다. – azad