나는 df1과 df2를 가지고있다.을 사용하여 df1의 열 A와 df2의 A 열을 일치시키고 특정 비율 일치에 따라 df2의 B 열에 ID를 반환합니다.Python에서 FuzzyWuzzy를 사용하여 두 데이터 프레임 간의 이름을 일치시키는 방법?
예를 들어 :
DF1은 다음과 같습니다
이름
샐리 조개를 판매
DF2은 다음과 같습니다
이름 | ID
Sally slls sshells | 내가 할 노력하고있어 28,904
는 DF2에서 열 A에 일치하는 항목을 찾아 DF2의 열 B에서 ID를 반환하는 DF1의 열 A의 모든 것을 비교입니다.
퍼지 비율의 기준을 설정할 수 있기를 바랍니다. 예를 들면 : 나는 단지 비율이 50
위 내 현재 코드의 경우에 ID를 반환 할 :
이import pandas as pd
import numpy as np
from fuzzywuzzy import fuzz
from fuzzywuzzy import process
df1=pd.read_csv('C:\\Users\\nkurdob\\Desktop\\Sheet1.csv')
df2=pd.read_csv('C:\\Users\\nkurdob\\Desktop\\Sheet2.csv')
for i in range(len(df1)):
em = df1['A'][i]
test = fuzz.partial_ratio(em, df2['A'])
if test > 50:
print df1['A'][i]==df2['B']