2013-01-31 4 views
1

Visual Studio 2008의 SSIS를 사용하여 고객 테이블에서 일부 퍼지 그룹화를 수행합니다.SSIS 2008 중복 연락처를 식별하지만 구두점을 무시하는 퍼지 그룹화

열 ID 이름 이메일 등

내가 수동 검사의 중복을 식별하기 위해 퍼지 그룹화를 사용하여 현재 수 동일한 이메일 주소 메신저와 함께 테이블에 일부 중복 고객을 가지고있다.

또한 거의 중복되지만 약간의 구두점이있는 레코드가 있습니다.

예를 들어 현재

ID Name Email 
    1 bob [email protected] 
    2 bob [email protected] 
    3 bob [email protected] 
    7 tom [email protected] 
    9 frog [email protected] 

내가 ID 1과 2에 맞게 얻을 수 있습니다하지만 난 1, 2, 3 일치하고 동일한 키

7과 9도에 그룹화 할 것 왜냐하면 나는 더블 풀 스톱을 무시하고 그것을 단지 하나의 풀 스톱으로보고 싶기 때문이다. 또한 이름은 중요하지 않으며 이메일 주소 열만 현재 중요합니다.

제안 사항 및 도움주세요. 때로는 단순하고있다 퍼지 도구를 사용하여이 작업을 수행하기 위해 귀하의 회신, 내가 영리한 방법을 찾고 있었다

REPLACE([Email], "..", ".") 

답변

0

원하지 않는 문자를 제거하기 위해 퍼지 그룹화 변환하기 전에 파생 열 변환을 사용하여 대답은가는 길입니다. 때로는 너무 단순해서 생각할 수도 없습니다. 중대한 응답 및 그것은 대우를 일했다.
+1

감사 : –