正则表达式拼写错误

我有一个数据库中的列表创建的正则表达式,以匹配游戏中建筑物类型的名称.问题是拼写错误,有时那些在游戏中为团队编写说明的人会拼错一个建筑名称,显然正则表达式不会捡起它(即拼写为“大学”和“大学”).

有关于使正则表达式拼写错误拼写为1或2个字母的建议吗?

正则表达式是动态生成的,并且可以在能够处理更多负载的本地计算机上运行,​​因此我作为最后的手段以算法方式创建每个单词的版本,其中缺少一个字母,然后另一个添加了字母.

我正在使用PHP但我希望这个问题的任何解决方案都不是PHP特定的.

请允许我向您介绍 Levenshtein Distance,它是字符串之间差异的度量,它是将一个字符串转换为另一个字符串所需的转换次数.

它也是built into PHP.

因此,我将输入文件拆分为非单词字符,并测量每个单词与目标建筑物列表之间的距离.如果距离低于某个阈值,则假设它是拼写错误.

我认为你有更多的运气匹配,而不是试图为每个特殊情况制作正则表达式.

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...