SpaCy 和 Flask API 构建 Python 命名实体自动提取器

如果数据可以被结构化,那么当今可用的大量非结构化文本数据提供了丰富的信息来源。 命名实体识别 (NER)(也称为命名实体提取)是从半结构化和非结构化文本源构建知识的第一步。

只有在 NER 之后,我们才能至少揭示信息包含的内容内容。 因此,数据科学团队将能够在语料库中看到所有人员、公司、地点等名称结构化表示,可作为进一步分析和调查的出发点。

自然语言工具包(NLTK)和 SpaCy 构建 Python 命名实体识别 文章中,我们学习并实践了如何使用 NLTK 和 spaCy 构建命名实体识别器。 为了更进一步,创建一些有用的东西,本文将介绍如何使用 spaCy 开发和部署一个简单的命名实体提取器,并使用 Python 中的 Flask API 为其提供服务。

Flask API 步骤

index.html 中处理及其代码

Python 主代码 app.py 及其分解解释

测试 Flask API

代码

详情参阅http://viadean.com/spacy_python_flask_api.html

相关文章

Jinja2:是Python的Web项目中被广泛应用的模板引擎,是由Pyt...
监听QQ消息并不需要我们写代码,因为市面上已经有很多开源QQ...
【Flask框架】—— 视图和URL总结
python+web+flask轻量级框架的实战小项目。登录功能,后续功...
有了这个就可以配置可信IP,关键是不需要企业认证,个人信息...