在带有错别字的句子中从数组中查找一个或多个字符串

问题描述

我正在尝试在句子中查找街道名称
问题是该句子可能有错别字(互联网上的人写了错字)

所以我考虑使用difflib.get_close_matches
但是我只能比较单词,而不能拆分这句话中的单词,因为其中有2个甚至3个单词的街道

我给你举个例子:

句子:

我有一间带2门,2扇窗户和1个屋顶的公寓, 该公寓位于曼哈顿(应该是曼哈顿)

我住在超大的公寓里,里面有很多房间 在美洲大道(应该是“美洲大道”),我们在附近有一个Macdonalds,我们很喜欢!

我拥有阵列中的所有城市街道名称(大约3000个)

['Manhattan','Bowery','broadway','Avenue of the Americas'] But about 3000 of them

在该句子中找到“曼哈顿”的最快,最准确的方法是什么?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)