NLP学习笔记12---信息抽取(Information Extraction 简称IE)、命名实体识别(Named Entity Recognition 简称NER)

1.信息抽取介绍

 

从非结构化数据中,抽取数据。

非结构化数据包括图片、文本、视频、音频等内容,提取特征输入到model中,而结构化数据类似于数据库中的一个个字段。

 

信息抽取主要包括两个部分:一个是抽取实体,另一个是抽取关系。

信息抽取的典型应用:

 

 

2.命名实体识别

(1)简介

小案例:

 

 

(2)开源工具

<1>英文工具

<2>中文工具

(3)常用方法

3.特征工程(Feature engineering)和特征表示

 

相关文章

python方向·数据分析   ·自然语言处理nlp   案例:中...
原文地址http://blog.sina.com.cn/s/blog_574a437f01019poo....
ptb数据集是语言模型学习中应用最广泛的数据集,常用该数据集...
 Newtonsoft.JsonNewtonsoft.Json是.Net平台操作Json的工具...
NLP(NaturalLanguageProcessing)自然语言处理是人工智能的一...
做一个中文文本分类任务,首先要做的是文本的预处理,对文本...