我正在处理名称消歧问题.我想知道是否有办法通过使用网络“众包”这些相关名称来找到一个单词的所有常见用法.
例如,在我的数据中,我有“加州大学伯克利分校”这个词.我可以使用谷歌搜索(或其他类型的应用程序)查找“加州大学伯克利分校”的所有常见同义词,例如“加州大学伯克利分校”,“伯克利分校”,“UCB”等吗?
我可以想象这可能不适合直接进入堆栈溢出类型的问题.我非常愿意转发到不同的地点或论坛.请告诉我在哪里.
解决方法:
你可以使用FreeBase.例如,“加州大学伯克利分校”页面:
https://www.freebase.com/m/02zd460
有一个字段:/ common / topic / alias
其中列出了该大学的不同通用名称,尽管其中一些可能有噪音:
UC Berkeley
Cal
Università della California (Berkeley) it
Universiteit van Californië - Berkeley nl
Universitato de Kalifornio, Berkeley eo
Berkeley
University of California, Berkeley Campus
University of California, Berkeley main campus
Berkeley Üniversitesi tr
California tr
加州大學柏克萊分校 zh-CN
Університет Каліфорнії uk
加州大学伯克利分校 zh-CN
Калифорнийски университет, Бъркли bg
University of California, Berkeley pl
Universiteit van Californië - Berkeley nl
Universitat de Califòrnia a Berkeley ca
Πανεπιστήμιο της Καλιφόρνιας, Μπέρκλεϋ el
加州大學柏克萊分校 zh-TW