如何在 wordcloud 中取消“耶稣”以获取“耶稣”?

问题描述

尝试使用 wordcloud 从一本关于圣经的书中获取 .png 图像。 “耶稣”这个词的词根是“耶稣”。有没有办法单独给这个词一个例外?奇怪的是,'Moses' 没有词干。

{file_content = open("Wheres_Heaven.txt").read()}

{wordcloud = WordCloud(stopwords=None,background_color = 'white',width=1200,height=1000,max_words = 500,).generate(file_content)}

{plt.figure( figsize=(20,10) )
{plt.imshow(wordcloud)}
{plt.axis('off')}
{plt.savefig('Heaven.png')}
{plt.show()}

Heaven.png

解决方法

如果您有 1.8.1 版本,那么您可以在停用词中加入“Jesu”。

逻辑是当它在文本中同时看到“Jesu”和“Jesus”时,代码假定它是复数。显然文本没有“摩西”,这就是为什么它不被视为复数。