对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧!
机器学习中很重要的应用场景就是机器自动分类,而分类的关键是词干提取。所以我们要用到snowball。
两种方法:
方法一:
# 来自jb51.cc
>>> from nltk import snowballstemmer
>>> snowballstemmer.languages # See which languages are supported
('danish','dutch','english','finnish','french','german','hungarian','italian','norwegian','porter','portuguese,'romanian','russian','spanish','swedish')
>>> stemmer = snowballstemmer(german) # Choose a language
>>> stemmer.stem(uAutobahnen) # stem a word
u'autobahn'
# End www.jb51.cc
但是当你知道你使用的语言场景的时候可以使用下面的方法直接调用:方法二:
# 来自jb51.cc
>>> ps = nltk.stem.snowball.Portuguesestemmer()
>>> ps.stem('celular')
u'celul'
>>> ps.stem('celular')
u'celul'
# End www.jb51.cc