이번 주 초에 런타임시 순차적으로 중복 값을 필터링하는 것에 대해 질문합니다. 몇 가지 좋은 해답을 얻었지만 데이터의 양은 느려지고 실행 불가능했습니다. 현재 Google 데이터베이스에서 이벤트 값은 필터링되지 않습니다. 데이터 값이 중복되어 (타임 스탬프가 달라짐) 런타임에 데이터를 처리해야하며 데이터베이스 수준에서 비용이 많이 소요됩니다 (저장된 프로
rowID, 경도, 위도, businessName, url, caption이있는 테이블이 있습니다. 어떻게 중복을 모두 삭제 않지만, 단지 URL (우선)을 가지는 하나를 유지하거나 다른이없는 경우 캡션이있는 한 계속 rowID | long | lat | businessName | url | caption
1 20 -20 Pizza Hut
우리는 데이터를 가져 와서 같은 데이터를 가진 제 3 자에게 다른 웹 서비스 호출을하는 C# WCF 서비스 (3.0)가 있습니다. 타사 호출 전에 입력 데이터가 데이터베이스에 레코드로 저장 된 다음 타사 웹 서비스의 응답 데이터로 업데이트됩니다. 일부로드/스트레스 테스트를 시작했으며 데이터베이스의 중복 레코드가 저장되고 있음을 알았습니다 (임의로 생성 된
주로 데이터 중복 제거 알고리즘을 찾고 싶습니다. 주로 중복 파일을 찾습니다. 첫 번째 단계는 타임 스탬프, 크기 및 파일 이름이 동일한 파일을 식별하는 것입니다. 나는 그 파일들에 대해 MD5 체크섬을 수행하고 비교할 수 있습니다. 그 외에도 파일의 내용을 비교할 수 있습니다. 내가 뭘 더 볼까?
몇 가지 예를 들자면, Text::DeDupe을 사용하여 small script을 작성하면 블로그 게시물의 중복을 제거하기 전에 해당 게시물을 볼 수 있습니다. 구현을 기반으로하는 Syntactic Clustering of the Web 종이를 읽은 후에 겹치는 문서 (예 : 전체 텍스트가 아닌 블로그 스 니펫, 따옴표 등)를 찾을 수 있기를 바랍니다. 내
ListID와 PersonID라는 두 개의 열만있는 테이블이 있습니다. 어떤 사람이 시스템에서 다른 사람과 합병되었을 때 나는 "대상자"의 모든 참조를 "대상자"에 대한 참조로 업데이트해야했습니다. 적으로는, 내가 대상 사람이 이미 중복 된 항목이 될 것이다 소스 사람과 같은 ListID이 테이블에 존재하는 경우, 그러나 UPDATE MailingListS
성 (姓)과 생년월일이 포함 된 큰 테이블이 있습니다. 마지막 이름과 생년월일이 테이블의 다른 행에있는 행과 동일한 행만 반환하는 쿼리를 작성해야합니다. 응용 프로그램을 만든 사람에 대한 정보가 들어있는 테이블입니다. 나는 한 번 이상 신청 한 사람들을 밝히고 싶다. 설정 작업을 사용하여이 작업을 수행하는 방법을 생각할 수 있지만 MS Access에서이를