使用 hunspell 查找 jamspell 中的错误单词

问题描述

我正在使用 jamspell 库来检查拼写,对于我的用例来说似乎没问题。

https://github.com/bakwc/JamSpell

如果我理解正确,任何不属于训练语料库的词都被认为是错误的。如果我的语料库有“begt”和“cherken”,那么不会为这一行建议任何词......“我是 begt 拼写 cherken”。我说的对吗?

是否可以使用 hunspell 来确定哪些单词是错误的,然后使用 jamspell 提出建议? 如果这是不可能的,是否有任何脚本可以读取冗长的文本,根据 hunspell 字典检查它并简单地删除无效的单词?

我之所以这么问是因为我的训练语料库似乎有很多拼错的单词,我正在寻找一种方法来清理它。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)