Python nltk 之 snowball 提取词干的简单示例

对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧!

机器学习中很重要的应用场景就是机器自动分类,而分类的关键是词干提取。所以我们要用到snowball

下面说一下snowball 提取词干的两种方法

两种方法

方法一:


# 来自jb51.cc 
>>> from nltk import snowballstemmer
>>> snowballstemmer.languages # See which languages are supported
('danish','dutch','english','finnish','french','german','hungarian','italian','norwegian','porter','portuguese,'romanian','russian','spanish','swedish')
>>> stemmer = snowballstemmer(german) # Choose a language
>>> stemmer.stem(uAutobahnen) # stem a word
u'autobahn'

# End www.jb51.cc
但是当你知道你使用的语言场景的时候可以使用下面的方法直接调用

方法二:

# 来自jb51.cc 
>>> ps = nltk.stem.snowball.Portuguesestemmer()
>>> ps.stem('celular')
u'celul'
>>> ps.stem('celular')
u'celul'

# End www.jb51.cc

相关文章

功能概要:(目前已实现功能)公共展示部分:1.网站首页展示...
大体上把Python中的数据类型分为如下几类: Number(数字) ...
开发之前第一步,就是构造整个的项目结构。这就好比作一幅画...
源码编译方式安装Apache首先下载Apache源码压缩包,地址为ht...
前面说完了此项目的创建及数据模型设计的过程。如果未看过,...
python中常用的写爬虫的库有urllib2、requests,对于大多数比...