如何跟踪语法框架解析:示例 WordNet 导入严重

问题描述

我正在尝试使用 WordNetEng 具体语法 https://github.com/GrammaticalFramework/gf-wordnet,据我所知 - 使用所有标准语法功能(来自 GF 基础安装),但极大地扩展了词典。我的 GF 安装工作正常,例如:

> import C:\Workspace-Data\GF\AllEng.gfo
linking ... OK

Languages: AllEng
3031 msec
AllEngAbs> parse "turtle is good"
The parser Failed at token 1: "turtle"
31 msecAllEngAbs> parse "dog is good"
PredVPS (MassNP (UseN dog_N)) (MkVPS (TTAnt TPres ASimul) PPos (UseComp (CompAP (PositA good_A))))
PredVPS (MassNP (UseN dog_N)) (MkVPS (TTAnt TPres ASimul) PPos (UseComp (CompNP (AdjAsNP (PositA good_A)))))
...

但是我可以导入W​​ordNetEng,但是它不识别,也不识别turtle,也不识别其他常用词,包括dog:

AllEngAbs> import C:\Workspace-Data\GF\WordNetEng.gf
linking ... OK

Languages: WordNetEng
5468 msec
WordNet> parse "tortoise is good"
The parser Failed at token 1: "tortoise"
4234 msec
WordNet> parse "dog is good"
The parser Failed at token 1: "dog"
0 msec

怎么了? GF怎么会导入语法(相当复杂的一组文件),然后连最简单的句子都解析不出来?我该如何调试并纠正它?谢谢!

也许可以选择列出会话中导入的所有语法类别或终端,例如这样我就可以看到 "tortoise" 是否被导入?

我尝试生成随机句子,但出现奇怪的错误

WordNet> gr
no trees found
0 msec

解决方法

WordNet 词典只是一个词典。它使用标准 RGL 中的类别,但不使用其余 RGL 函数。这是the abstract syntax

abstract WordNet = Cat ** {

fun a_bomb_N : N ; 
...
fun zymotic_2_A : A ; 
}

所以你的结果完全在意料之中。

使用 RGL+WordNet 解析

如果您想使用 RGL 和 WordNet 词典进行解析,您可以使用同一个 repo gf-wordnet/Parse.gf 中的 Parse 模块。不过需要注意的是,该语法可能非常含糊。

如果您发现 Parse 过于含糊,并且只想使用 WordNet 词典增强标准 RGL,您可以从 Parse module 注释掉 ParseExtend,如下所示:

abstract Parse = 
  Noun - [PPartNP,UseN2,RelNP,DetNP],Verb - [PassV2,ReflVP,ComplVV,SlashVV,SlashV2V,SlashV2VNP],Adjective - [ReflA2,CAdvAP],Adverb - [AdnCAdv,ComparAdvAdj,ComparAdvAdjS],Sentence - [EmbedVP],Question,Relative,Conjunction,Phrase - [UttAP,UttVP],Idiom,Tense,--  ParseExtend,-- Comment out this line in the abstract and the concrete(s)
  Construction,WordNet,Documentation ** {
  
flags
  startcat = Phr ;
}

像这样使用它:

$ gf ParseEng.gf
Parse> p "I am a human"
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron iFem_Pron) (UseComp (CompCN (UseN human_N)))))) NoVoc
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron iFem_Pron) (UseComp (CompNP (DetCN (DetQuant IndefArt NumSg) (UseN human_N))))))) NoVoc
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron i_Pron) (UseComp (CompCN (UseN human_N)))))) NoVoc
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron i_Pron) (UseComp (CompNP (DetCN (DetQuant IndefArt NumSg) (UseN human_N))))))) NoVoc

但它仍然是模棱两可的,因为有些词属于许多不同的同义词集(单词 good 的 20 个同义词集),并且一个长句子可能包含几个这样的词。

在应用语法中使用 WordNet 词典

如果您编写应用程序语法,您可以随时在其中打开 WordNet,就像任何其他模块一样。例如,要重新创建教程中的 Foods example,我们可以像这样编写参数化模块(函子)FoodsI.gf

    incomplete concrete FoodsI of Foods = open Syntax,WordNet in {
    lincat
      Phrase = Cl ;
      Item = NP ;
      Kind = CN ;
      Quality = AP ;
    lin
      Is item quality = mkCl item quality ;
      This kind = mkNP this_Det kind ;
      That kind = mkNP that_Det kind ;
      These kind = mkNP these_Det kind ;
      Those kind = mkNP those_Det kind ;
      QKind quality kind = mkCN quality kind ;
      Very quality = mkAP very_AdA quality ;
  
      Wine = mkCN wine_1_N ; -- All these from WordNet
      Fish = mkCN fish_2_N ;
      ...
    }

并为这样的具体语言实例化它

    concrete FoodsEng of Foods = FoodsI with
      (Syntax = SyntaxEng),(LexFoods = WordNetEng) ;