在实践中如何将非结构化文本转换为 rdf 海龟?

问题描述

我目前正在进行一个研究项目,我必须将 NHTSA 数据库 (https://catalog.data.gov/dataset/nhtsas-office-of-defects-investigation-odi-complaints) 中的车辆投诉描述转换为 rdf-turtle,然后转换为可能使用 GraphDB 等的知识图表示。可以在附件中找到一组描述。

我的研究课题有 NER、关系提取、OpenIE、FRED、知识图谱构建、RDFS、OWL 和理论上的本体论。

现在,我到了不知道如何实际去做的地步。

有人可以帮助我并指导我完成它吗? 我应该从哪里开始,从什么开始?

非常感谢, 丹尼斯

Examples customer complaints

解决方法

Stanford CORE NLP 有 Open IE,可以从文本中提取三元组。 https://nlp.stanford.edu/software/openie.html

如果你想用python来做,看看Stanza https://github.com/stanfordnlp/stanza。 它有一个官方的 Python 包装器,可以在后端启动一个基于 JAVA 的 CORE NLP 服务器。