如何使用Fuzzy Wuzzy更改行值？

问题描述

我正在尝试遍历数据框，并用状态列表中的最佳近似值替换状态名称。

这是我的数据框

Uri2        Count
copy_all    2
delete      3
merge_all   1
select      4

我有一个带有正确州名的向量

State              Homicides
----------------- -------------
Colima               5
Ciudad de Mxico      5
Veracruz Ignacio     7
Hidalto              9
.
.
.

我想做的是检查列状态和我的向量的近似值，并根据给定的向量在df中更改状态的正确名称。

这是我的尝试：

v_correct_states = [  "Aguascalientes","Baja California","Baja California Sur","Campeche","Coahuila".... ]

请有人帮我。

这是我希望的结果

col_list = ["State"]
    
for filename in sorted(glob.glob(dirname + '/*.csv')):
    df = pd.read_csv(filename,usecols=col_list)
        for col in df[['State']]:
            df[col] = df[col].str.strip()
            aprox = process.extractOne(df[col],v_correct_states)
            print(aprox)
>>TypeError: expected string or bytes-like object

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

dataframe fuzzy-comparison fuzzywuzzy pandas python