问题描述
我正在阅读最上面的例子:http://www.openfst.org/twiki/bin/view/FST/FstExamples 关于标记化。
在示例中,他们创建了三个 fst:Mars.fst
、Martian.fst
和 man.fst
,并手动运行一些 fst 命令将它们合并为一个大转换器。他们从 wotw.syms
得到“火星”、“火星人”和“人”这个词,其中有 7102 个词。
我的问题是,是否有一种聪明的方法可以为所有 7102 个单词创建一个 word.fst
,以便可以将所有 7102 个单词组合成一个大自动机,还是必须像他们那样手动完成火星、火星和人这三个词?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)