java – 从解析树中获取某些节点

我正在研究一个涉及通过Hobbs算法进行回指解析的项目.我使用Stanford解析器解析了我的文本,现在我想操纵节点以实现我的算法.

目前,我不明白如何:

>根据其POS标签访问节点(例如,我需要以代词开头 – 我如何获得所有代词?).
>使用访客.我有点像Java的菜鸟,但在C中我需要实现一个访问者编程器然后处理它的钩子.我找不到Stanford Parser的Tree结构.那是jgrapht吗?如果是的话,你可以在代码片段中提供一些指示吗?

解决方法:

@ dhg的答案工作正常,但这里有两个其他选项,它们可能也有用了解:

> Tree类实现了Iterable.您可以在预先遍历遍历中遍历树的所有节点,或者严格地遍历每个节点的子树,其中:

for (Tree subtree : t) { 
    if (subtree.label().value().equals("PRP")) {
        pronouns.add(subtree);
    }
}

>您还可以通过使用tregex获得满足某些(可能非常复杂的模式)的节点,tregex的行为与java.util.regex相似,允许在树上进行模式匹配.你会有类似的东西:

TregexPattern tgrepPattern = TregexPattern.compile("PRP");
TregexMatcher m = tgrepPattern.matcher(t);
while (m.find()) {
    Tree subtree = m.getmatch();
    pronouns.add(subtree);
}

相关文章

python方向·数据分析   ·自然语言处理nlp   案例:中...
原文地址http://blog.sina.com.cn/s/blog_574a437f01019poo....
ptb数据集是语言模型学习中应用最广泛的数据集,常用该数据集...
 Newtonsoft.JsonNewtonsoft.Json是.Net平台操作Json的工具...
NLP(NaturalLanguageProcessing)自然语言处理是人工智能的一...
做一个中文文本分类任务,首先要做的是文本的预处理,对文本...