问题描述
|
我的网站需要开发与其行业相关的广泛关键字和关键词列表,以便用户在发布有关某些事物的帖子时,可以对其进行相关标记。
除了手动创建数千个单词和短语的列表之外,生成此类列表的常用方法是什么?
它是通过将帖子解析为常用关键字还是其他方式完成的?
思想:
我似乎一开始就依靠帖子的解析是相当有限的,这意味着只有在网站上的内容开发了更长的时间之后,我才能拥有一个不错的关键字列表。
解决方法
我会寻求用户的帮助;当用户发布消息时,他或她可以选择已经存在的标签并添加新标签。新的可以直接出现,也可以进入队列由您审核。
, 您可以尝试训练专家系统(可能是贝叶斯分类器)对文件(标签)进行分类,类似于专家(人类)对相似文件的分类方式。但是,您需要人工培训,因此您应该首先使它起作用。然后,您可能会发现尝试向用户推荐标签是一项繁重的工作,而且容易出错,因此可以跳过这一部分。