如何使用NLP和实体识别从文本中正确提取诸如设施和场所之类的实体?

问题描述

我需要使用自然语言处理和NER从给定文本中识别所有establishmentsfacilities

示例文本:

政府急忙为城外建造新的公园,游泳池和商业综合体,并改善现有的住宅综合体,学校和联排别墅。

要识别的预期实体:

公园,游泳池,商业综合体,住宅综合体,学校和联排别墅

我确实研究了一些Python库(例如Spacy和NLTK),但结果并不理想,仅发现了2个实体。我认为数据需要进行适当的预处理。

我应该怎么做才能改善结果?是否还有其他适合此用例的库/框架?有什么办法可以使用现有的数据库来训练我们的模型?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)