问题描述
通过给上下文无关文法的每个规则一个概率,我们可以获得概率上下文无关文法。现在我们有一个概率性的上下文无关文法和上下文无关文法。
所有句子都是从概率上下文无关文法生成的。语法识别器是基于无上下文语法实现的。
我想确认识别器将认为所有生成的句子在语法上都是正确的。是吗?
解决方法
假设您为概率CFG中的每个生产规则分配了非零概率,那么PCFG生成的每个字符串也是可以从原始CFG派生的。毕竟,PCFG具有与CFG相同的规则,只是分配的权重偏向于生成特定字符串的概率。因此,只要原始CFG具有所有生成的字符串在语法上都是正确的属性,则生成的字符串在语法上将始终正确。