amatch() 文本匹配 - R

问题描述

我正在尝试匹配单词以从列表中选择最接近的匹配案例。我正在使用 amatch() 包中的函数 stringdist,但它给出了一些令人困惑的结果。例如:

library(stringdist)    

# list of words to match
l = c("Assura","Newmark Security PLC")

# find closest match
amatch(tolower("Assura Plc"),tolower(l),method = "osa",weight = c(d = 0.5,i = 0.05,s = 1,t = 1),maxdist = Inf)
# result is "2"

# get match comparison ratings
stringdist(tolower("Assura Plc"),t = 1))
# result is "0.2" "6.1"

为什么当第一个词产生更接近的匹配时选择第二个词?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)