계정 연결 구조를 지정하는 두 개의 열이있는 CSV 파일이 있습니다. 내가 가지고있는 문제는 각각의 링크에 대해 역방향 역방향 항목이 있다는 것입니다.Python - 고유 한 값을 기반으로 찾기, 일치, 정렬 및 추가
예
Column1 Column2
12513 52188
52188 12513
나는 또한과 같은 계좌 번호에서 다른 연결을 지정하는 항목을 더 이상있을 수 있다는 것입니다이 다른 문제
Column1 Column2
12513 52188
52188 12513
52188 19922
19922 52188
19922 12812
12812 19922
18216 59888
59888 18216
3856 59888
59888 3856
당신은 모두를 볼 수있는 계정이 어떻게 든간에 서로 연결되어 있다면, 찾고있는 출력은 종속 계정에 연결된 하나의 마스터 계정 (아마도 가장 가치가 낮은 계정)을 만들고 두 개의 역방향 항목을 제거해야합니다. 위의 데이터에서
예 출력 :
Column1 Column2
12513 52188
12513 19922
12513 12812
3856 59888
3856 18216
파일은, 하나 개의 마스터 계정뿐만 아니라이 유의하시기 바랍니다과 주변에 20,000 선이 포함되어 있습니다.
는 불분명하다 – RomanPerekhrest
'자식 클론 https : //로 github.com/NiallCosgrove/kayboxa' –
그것의 최대 GitHub의에 이제 복사/붙여 넣기 오류를 피하십시오. 나는 20000 쌍의 무작위 수를 테스트하여 한 시간 반 정도 걸렸습니다. 나에게 당신이 어떻게되는지 알려주세요 –