问题描述
我正在尝试使用 WordNetEng 具体语法 https://github.com/GrammaticalFramework/gf-wordnet,据我所知 - 使用所有标准语法功能(来自 GF 基础安装),但极大地扩展了词典。我的 GF 安装工作正常,例如:
> import C:\Workspace-Data\GF\AllEng.gfo
linking ... OK
Languages: AllEng
3031 msec
AllEngAbs> parse "turtle is good"
The parser Failed at token 1: "turtle"
31 msecAllEngAbs> parse "dog is good"
PredVPS (MassNP (UseN dog_N)) (MkVPS (TTAnt TPres ASimul) PPos (UseComp (CompAP (PositA good_A))))
PredVPS (MassNP (UseN dog_N)) (MkVPS (TTAnt TPres ASimul) PPos (UseComp (CompNP (AdjAsNP (PositA good_A)))))
...
但是我可以导入WordNetEng,但是它不识别,也不识别turtle,也不识别其他常用词,包括dog:
AllEngAbs> import C:\Workspace-Data\GF\WordNetEng.gf
linking ... OK
Languages: WordNetEng
5468 msec
WordNet> parse "tortoise is good"
The parser Failed at token 1: "tortoise"
4234 msec
WordNet> parse "dog is good"
The parser Failed at token 1: "dog"
0 msec
怎么了? GF怎么会导入语法(相当复杂的一组文件),然后连最简单的句子都解析不出来?我该如何调试并纠正它?谢谢!
也许可以选择列出会话中导入的所有语法类别或终端,例如这样我就可以看到 "tortoise"
是否被导入?
WordNet> gr
no trees found
0 msec
解决方法
WordNet 词典只是一个词典。它使用标准 RGL 中的类别,但不使用其余 RGL 函数。这是the abstract syntax:
abstract WordNet = Cat ** {
fun a_bomb_N : N ;
...
fun zymotic_2_A : A ;
}
所以你的结果完全在意料之中。
使用 RGL+WordNet 解析
如果您想使用 RGL 和 WordNet 词典进行解析,您可以使用同一个 repo gf-wordnet/Parse.gf 中的 Parse 模块。不过需要注意的是,该语法可能非常含糊。
如果您发现 Parse 过于含糊,并且只想使用 WordNet 词典增强标准 RGL,您可以从 Parse module 注释掉 ParseExtend,如下所示:
abstract Parse =
Noun - [PPartNP,UseN2,RelNP,DetNP],Verb - [PassV2,ReflVP,ComplVV,SlashVV,SlashV2V,SlashV2VNP],Adjective - [ReflA2,CAdvAP],Adverb - [AdnCAdv,ComparAdvAdj,ComparAdvAdjS],Sentence - [EmbedVP],Question,Relative,Conjunction,Phrase - [UttAP,UttVP],Idiom,Tense,-- ParseExtend,-- Comment out this line in the abstract and the concrete(s)
Construction,WordNet,Documentation ** {
flags
startcat = Phr ;
}
像这样使用它:
$ gf ParseEng.gf
Parse> p "I am a human"
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron iFem_Pron) (UseComp (CompCN (UseN human_N)))))) NoVoc
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron iFem_Pron) (UseComp (CompNP (DetCN (DetQuant IndefArt NumSg) (UseN human_N))))))) NoVoc
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron i_Pron) (UseComp (CompCN (UseN human_N)))))) NoVoc
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron i_Pron) (UseComp (CompNP (DetCN (DetQuant IndefArt NumSg) (UseN human_N))))))) NoVoc
但它仍然是模棱两可的,因为有些词属于许多不同的同义词集(单词 good 的 20 个同义词集),并且一个长句子可能包含几个这样的词。
在应用语法中使用 WordNet 词典
如果您编写应用程序语法,您可以随时在其中打开 WordNet,就像任何其他模块一样。例如,要重新创建教程中的 Foods example,我们可以像这样编写参数化模块(函子)FoodsI.gf
:
incomplete concrete FoodsI of Foods = open Syntax,WordNet in {
lincat
Phrase = Cl ;
Item = NP ;
Kind = CN ;
Quality = AP ;
lin
Is item quality = mkCl item quality ;
This kind = mkNP this_Det kind ;
That kind = mkNP that_Det kind ;
These kind = mkNP these_Det kind ;
Those kind = mkNP those_Det kind ;
QKind quality kind = mkCN quality kind ;
Very quality = mkAP very_AdA quality ;
Wine = mkCN wine_1_N ; -- All these from WordNet
Fish = mkCN fish_2_N ;
...
}
并为这样的具体语言实例化它
concrete FoodsEng of Foods = FoodsI with
(Syntax = SyntaxEng),(LexFoods = WordNetEng) ;