基于markov的语言模型,在遇到未登录词时,会将语法合理的句子概率计算为0.这是不合理的。
Add-one Smoothing (laplace smoothing)
分母上加一个V(词典大小)的一个理由,使概率之和为1.
Add-K Smoothing
以perplexity为优化目标,计算最优的
Interpolation平滑
核心思想:计算Trigram概率时同时考虑Unigram,Bigram,Trigram出现的频次。
Good-Turing平滑