问题描述
|
我想从词干中切出词缀。我用以下命令尝试了后缀,对于“'菜''来说还可以。但是,当我想使用前缀(例如\'undo \')时,如何在Python中定义前缀以获取撤消结果?
>>> def stem(word):
for suffix in [\'ing\',\'lity\',\'es\']:
if word.endswith(suffix):
return word[:-len(suffix)]
return word
>>> re.findall(r\'^(.*)(ing|lity|es)$\',\'dishes\')
[(\'dish\',\'es\')]
解决方法
好吧,为什么不像以前那样使用正则表达式呢?
>>> re.findall(r\'^(un|ir)(.*)$\',\'undo\')
[(\'un\',\'do\')]