为什么这些停用词没有从我的数据中删除?

问题描述

数据的标记化

tidy_text <- data %>% 
  unnest_tokens(word,q_content)

去除停用词

data("stop_words")
stop_words
tidy_text <- tidy_text %>% anti_join(stop_words,by ="word")
tidy_text %>% count(word,sort = TRUE)

输出包括最重要的 10 个单词

1                                                                                   im 13012
2                                                                                 dont 11197
3                                                                                 feel  9168
4                                                                                 time  6697
5                                                                                 life  4464
6                                                                                  ive  4403
7                                                                               people  4233
8                                                                                 told  4150
9                                                                              friends  4045
10                                                                                love  3281

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)