데이터에 두 가지 세트가 필요하지만 데이터 품질이 좋지 않기 때문에 추가 된 문제가 있습니다.SSIS가 일치하지 않습니다. Join
두 데이터 세트는 통화 (전화 통화) 및 통신 (전화 통화에 대해 생성 된 레코드)입니다. ID는 각각 call_id 및 comm_id입니다. 통신 레코드에는 join을 수행하기위한 call_ids도 있습니다. 문제는 데이터 수집 시스템이 올바르게 작동하지 않아 특정 통화와 일치하지 않는 수많은 통신이 있다는 것입니다. 모든 전화가 통신을 생성하지는 않습니다.
매일 분석을 수행하기 위해 가입 목록을 만들어야합니다.
- 그냥 호출,
- 그냥 컴즈,
- 링크 통신과 전화 : 문제 때문에 링크의 일부의 부족으로 내가 3 개 별개의 행 유형을 얻을 수 있다는 것입니다.
주어진 날짜에 "Just Comm"행 인 모든 행에 대해 동일한 날짜에 대해 "Just Call"행을 제거해야합니다. 나는 전화에서 어떤 가치도 필요 없어요, 나는 단지 일어난 전화를 알아야합니다. 이렇게하면 "올바른 통신"으로 인해 통신을 만든 호출이 알 필요가있는 "그냥 호출"행이 제거되기 때문에 올바른 행으로 끝납니다.
내 문제는 SSIS에서이를 수행하는 방법입니다. 필자는 필자가 필요로하는 모든 데이터를 포함하고 위에 언급 한 3 행 유형이 혼합되어있는 데이터 세트를 가지고있는 지점에 도달했습니다. "Just Call"행을 삭제하는 과정을 어떻게 추천합니까?
그래서 첫 번째 단계는 이미 수행 한 작업입니다. 통신 및 호출에 대한 완전 외부 조인을 통해 3 가지 유형의 행이 모두있는 데이터 세트를 생성합니다. where 절은 "호출 및 통신"인 행을 제거합니다. 보기를 사용하는 두 번째 쿼리는 내가 원하는 것을 수행하지 않습니다. 다음 설명에서 자세히 설명 드리겠습니다 ... –
필적 할만한 통화 및 통신 기록을 모두 갖고 싶습니다. 통화 기록을 시작하고 동일한 날짜의 모든 통신 기록과 일치하는 목록으로 이동하십시오. 각 통신 레코드는 한 번만 사용해야합니다. 통화 기록이 일치하는 날짜와 함께 사용되지 않는 통신을 찾지 못하면 null로 남아 있어야합니다 ... –
무작위로 통화 기록 (일치하지 않는 통신 기록의 수까지)을 건너려고하는 경우 - 어떤 통화 기록이 무작위로 교차할지 그게 남아 있어야합니까? 그들은 당신에게 어떤 가치가 있습니까? 카운트 이상에 관심이 있습니까? 그렇지 않다면 단순히 별도의 쿼리로 계산하지 않는 것이 어떻습니까? – Tomalak