使用BERT提取产品功能

问题描述

如何使用BERT从文本中提取产品功能

例如,如何从下一封电子邮件提取ID-WSK30015675,KTXFFC156、4569TT11DRE

Hello John,Please order 15 dresses ID WSK30015675 from our storage. Thanks.

Hello Dan,this week we need to make sure we have KTXFFC156. And please make sure to order more of 4569TT11DRE. tnx :)

注意:

  • 没有正则表达式
  • id未知
  • 标记的数据(电子邮件>> id)足够
  • id是不同长度的数字和字母的组合

解决方法

您需要检测哪些词是产品功能,因此您应该使用此架构

enter image description here

此架构在类似的任务中实现:

https://gab41.lab41.org/how-to-fine-tune-bert-for-named-entity-recognition-2257b5e5ce7e

https://towardsdatascience.com/named-entity-recognition-ner-with-bert-in-spark-nlp-874df20d1d77