解析人名并在Ruby中匹配它们

我正在寻找一个宝石或项目,让我发现两个名字是同一个人.例如

J.R. Smith == John R. Smith == John Smith == John Roy Smith == Johnny Smith

我想你应该已经明白了.我知道什么都不会100%准确,但我想得到的东西至少可以处理大多数情况.我知道最后一个可能需要一个昵称数据库.

解决方法

我认为一种选择是使用 Levenshtein distance的ruby实现

两个字符串之间的Levenshtein距离定义为将一个字符串转换为另一个字符串所需的最小编辑数,允许的编辑操作是单个字符的插入,删除或替换.

然后你可以定义距离小于X的名字(X是你必须调整的数字)来自同一个人.

编辑
通过一点点搜索,我能够找到另一种算法,基于名为Metaphone的语音

它还有很多漏洞,但我认为在这种情况下,每个人都可以做的最好的事情就是为你提供替代方案来测试并看看什么效果最好

相关文章

validates:conclusion,:presence=>true,:inclusion=>{...
一、redis集群搭建redis3.0以前,提供了Sentinel工具来监控各...
分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣...
上一篇博文 ruby传参之引用类型 里边定义了一个方法名 mo...
一编程与编程语言 什么是编程语言? 能够被计算机所识别的表...
Ruby类和对象Ruby是一种完美的面向对象编程语言。面向对象编...