问题描述
我想使用Sastrawi(使用Python)在数据框中阻止我的推文,但我想在开始阻止之前排除其中一个词。 我该怎么办?
我试图从Sastrawi词典中删除该单词,但是Sastrawi不支持使用Python删除词典中的单词的功能。
这是我的Sastrawi的代码
from Sastrawi.stemmer.stemmerFactory import stemmerFactory
factory = stemmerFactory()
stemmer = factory.create_stemmer()
def stemmed_wrapper(term):
return stemmer.stem(term)
term_dict = {}
for document in training["Tweet"]:
for term in document:
if term not in term_dict:
term_dict[term] = ' '
print(len(term_dict))
print("------------------------")
for term in term_dict:
term_dict[term] = stemmed_wrapper(term)
print(term,":",term_dict[term])
print(term_dict)
print("------------------------")
def get_stemmed_term(document):
return [term_dict[term] for term in document]
training["Tweet"] = training["Tweet"].apply(get_stemmed_term)
training.to_csv("RESULT PREPROCESSING2.csv")
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)