从概率上下文无关语法生成的所有句子在语法上是否正确?

问题描述

通过给上下文无关文法的每个规则一个概率,我们可以获得概率上下文无关文法。现在我们有一个概率性的上下文无关文法和上下文无关文法。

所有句子都是从概率上下文无关文法生成的。语法识别器是基于无上下文语法实现的。

我想确认识别器将认为所有生成的句子在语法上都是正确的。是吗?

解决方法

假设您为概率CFG中的每个生产规则分配了非零概率,那么PCFG生成的每个字符串也是可以从原始CFG派生的。毕竟,PCFG具有与CFG相同的规则,只是分配的权重偏向于生成特定字符串的概率。因此,只要原始CFG具有所有生成的字符串在语法上都是正确的属性,则生成的字符串在语法上将始终正确。