많은 사람들이 겪었던 데이터 문제가 발생했습니다. 현재 거래 정보가 포함 된 데이터 세트가 있습니다. Transaction_Number에 따라 거래에 참여한 각 개인이 얼마나 오랫동안 지출했는지 확인할 수 있습니다. 나는 하나의 열을 잃었 것을이일대 다 병합 행 수준
Transaction_Number Created On Created_By Time_Diff
27327920232 2014-12-08 03:29:08 jake NaN
27323232336 2017-04-28 18:39:03 James 0
27323232336 2017-04-28 18:26:23 Tony 760.0
가 지금 직면하고있는 문제가 같은
최종 출력을 보인다. 어느 DB에서 쿼리하여 해결하고 "Product_Number"라는 필드를 가져 왔습니다. 나는 Transaction_Number에 두 테이블을 합류시키고있다. 여기서 문제가 발생하는 곳은 두 번째 데이터 프레임 이름 D에 Product_Number와 일치하는 Transaction_Number가 한 번만 나열되어 있습니다. 마스터 데이터 프레임에는 트랜잭션이 여러 번 발생합니다. 따라서 다음 코드를 실행하면 결과가 의미가 없습니다. 12K + 가능성에 따라 4 개의 일치 만 출력합니다.
X D D
Transaction_Number Transaction_Number Product_Number
27327920232 27327920232 Cw-xs-re-89
27327920232 72732332323 pw-ts-sf-89
27327920232 32338033383 Cw-ns-tn-86
results = pd.merge(X, D, how='inner', on= "Transaction_Number")
올바른 일치 항목을 찾으려면 어떻게해야합니까? 나는 또한 왼쪽 조인을 시도했다, 팁의 모든 유형이 도움이 될 것입니다. - 감사합니다
그냥이 질문을하지 않았습니까? 왜 첫 번째 거래 번호 앞에는 대시가 있습니까? –
* 올바른 일치 항목을 찾으려면 어떻게해야합니까 *? '병합 '이 필요에 따라 작동하는 것처럼 여러분 만이 사실을 우리에게 말할 수 있습니다. 어떤 * Product_Number *에서 여러 * Transactions *을 가져올 수 있습니까? 먼저? 마지막? – Parfait