斯坦福核心 NLP 树解析器句子限制错误 - 建议?

问题描述

我正在处理德国法律文件,并想为句子生成解析树。我可以找到并使用斯坦福CoreNLP Parser。但是,在解析文档的句子时,它无法像其他工具(例如 spaCy)那样识别句子限制。例如,它会在每一个 '.' 字符处断句,包括。缩写词末尾的点,例如“incl.”) 由于在创建语法树时覆盖整个句子至关重要,因此这对我来说并不真正有效。

我将不胜感激任何解决此问题的建议,特别是指向可能更适合我的问题的其他软件的指针。如果我忽略了调整斯坦福解析器的可能性,我将非常感谢有关如何使其更好地检测句子限制的任何提示

解决方法

快速浏览文档即可解决问题:您可以使用属性运行您的管道,其中可能包含 Woocommerce - How to show Order details (my-account) on a separate page ssplit.isOneSentence = true 基本上禁用它。这意味着您可以预先拆分句子,例如使用 spaCy,然后将单个句子输入管道。