python – 使用Web查找相关名称的一种方法是什么?

我正在处理名称消歧问题.我想知道是否有办法通过使用网络“众包”这些相关名称来找到一个单词的所有常见用法.

例如,在我的数据中,我有“加州大学伯克利分校”这个词.我可以使用谷歌搜索(或其他类型的应用程序)查找“加州大学伯克利分校”的所有常见同义词,例如“加州大学伯克利分校”,“伯克利分校”,“UCB”等吗?

我可以想象这可能不适合直接进入堆栈溢出类型的问题.我非常愿意转发到不同的地点或论坛.请告诉我在哪里.

解决方法:

你可以使用FreeBase.例如,“加州大学伯克利分校”页面
https://www.freebase.com/m/02zd460

一个字段:/ common / topic / alias

其中列出了该大学的不同通用名称,尽管其中一些可能有噪音:

UC Berkeley
Cal
Università della California (Berkeley) it
Universiteit van Californië - Berkeley nl
Universitato de Kalifornio, Berkeley eo
Berkeley
University of California, Berkeley Campus
University of California, Berkeley main campus
Berkeley Üniversitesi tr
California tr
加州大學柏克萊分校 zh-CN
Університет Каліфорнії uk
加州大学伯克利分校 zh-CN
Калифорнийски университет, Бъркли bg
University of California, Berkeley pl
Universiteit van Californië - Berkeley nl
Universitat de Califòrnia a Berkeley ca
Πανεπιστήμιο της Καλιφόρνιας, Μπέρκλεϋ el
加州大學柏克萊分校 zh-TW

相关文章

python方向·数据分析   ·自然语言处理nlp   案例:中...
原文地址http://blog.sina.com.cn/s/blog_574a437f01019poo....
ptb数据集是语言模型学习中应用最广泛的数据集,常用该数据集...
 Newtonsoft.JsonNewtonsoft.Json是.Net平台操作Json的工具...
NLP(NaturalLanguageProcessing)自然语言处理是人工智能的一...
做一个中文文本分类任务,首先要做的是文本的预处理,对文本...