Я пытаюсь рассчитать коэффициенты нечеткости для нескольких строк в двух фреймах данных:
df1:
id name
1 Ab Cd E
2 X.Y!Z
3 fgh I
df2:
name_2
abcde
xyz
Я хочу рассчитать коэффициент нечеткости между всеми значениями в df1.name и df2.name_2:
Для этого у меня есть код:
for i in df1['name']:
for r in df2['name_2']:
print(fuzz.ratio(i,r))
Но я хочу, чтобы конечный результат также имел идентификаторы из df1. В идеале это выглядело бы так:
final_df:
id name name_2 score
1 Ab Cd E abcde 50
1 Ab Cd E xyz 0
2 X.Y!Z abcde 0
2 X.Y!Z xyz 60
3 fgh I abcde 0
3 fgh I xyz 0
Спасибо за помощь!
for i, r in zip(df1['name'], df2['name_2']): ...
Это будет работать только для того, что вы хотите, если оба фрейма данных имеют одинаковую длину, но должно работать для вашего примера. - person L. MacKenzie   schedule 13.10.2017