问题描述
我正在尝试遍历数据框,并用状态列表中的最佳近似值替换状态名称。
这是我的数据框
Uri2 Count
copy_all 2
delete 3
merge_all 1
select 4
State Homicides
----------------- -------------
Colima 5
Ciudad de Mxico 5
Veracruz Ignacio 7
Hidalto 9
.
.
.
我想做的是检查列状态和我的向量的近似值,并根据给定的向量在df中更改状态的正确名称。
这是我的尝试:
v_correct_states = [ "Aguascalientes","Baja California","Baja California Sur","Campeche","Coahuila".... ]
请有人帮我。
这是我希望的结果
col_list = ["State"]
for filename in sorted(glob.glob(dirname + '/*.csv')):
df = pd.read_csv(filename,usecols=col_list)
for col in df[['State']]:
df[col] = df[col].str.strip()
aprox = process.extractOne(df[col],v_correct_states)
print(aprox)
>>TypeError: expected string or bytes-like object
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)