如何使用Kenlm检查句子中的单词对齐方式?

问题描述

我见过很多博客都说语言模型可以用于许多任务,但是除了文本生成之外,我找不到任何好的实现方式。

我的查询是 我如何使用像kenlm这样的语言模型来纠正句子中的对齐和拼写错误。我知道kenlm已经为深语音做了这个,但是我想了解它的实际作用以及如何实现相同的作用。

解决方法

KenLM的有趣用例。它基本上是一个树形结构,用于说明哪些单词最有可能与其他单词一起出现。 DeepSpeech使用它为提供的音频中找到的字母找到最可能的单词。如果您想做类似的事情,请先阅读有关CTC光束搜索的信息,然后研究代码。