问题描述
|
我想运行Levenshtein,但是要快一些,因为它是我正在构建的实时应用程序。距离大于10时可以终止。
解决方法
Levenshtein距离度量允许添加,删除或替换操作。如果您正在寻找更快但不太精确的指标,则可以使用最长的公共子序列(仅允许添加和删除),甚至可以使用汉明距离(仅允许替换)。
但是,我建议您尝试优化Levenshtein距离算法,因为它可以提供最佳结果。
, 从评论来看,人们似乎对Sift3非常满意。
http://sift.codeplex.com
, 如果要比较UTF-8内容,请使用
sift4
:
https://siderite.dev/blog/super-fast-and-accurate-string-distance.html
我还准备了一个jsPerf,它显示了这些库之间的性能差异:http://jsperf.com/levenshtein-perf