使用BERT提取产品功能

问题描述

如何使用BERT从文本中提取产品功能?

例如,如何从下一封电子邮件中提取ID-WSK30015675,KTXFFC156、4569TT11DRE

Hello John,Please order 15 dresses ID WSK30015675 from our storage. Thanks.

Hello Dan,this week we need to make sure we have KTXFFC156. And please make sure to order more of 4569TT11DRE. tnx :)

注意:

  • 没有正则表达式
  • id未知
  • 标记的数据(电子邮件>> id)足够
  • id是不同长度的数字和字母的组合

解决方法

您需要检测哪些词是产品功能,因此您应该使用此架构

enter image description here

此架构在类似的任务中实现:

https://gab41.lab41.org/how-to-fine-tune-bert-for-named-entity-recognition-2257b5e5ce7e

https://towardsdatascience.com/named-entity-recognition-ner-with-bert-in-spark-nlp-874df20d1d77

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...