如何从R中的文本语料库中删除特定单词？提供用于修改的代码

假设你有一个语料库，例如

myCorpus <- c("Carles werwa went to sadaf buy trsfr in the supermanket","Marta needs to werwa sadaf go to Jamaica")

我有一本字典 (data_int_syllables)，其中包含我想从 mytext 中删除的单词列表。

使用 library('quanteda')，我尝试了以下操作：

myTokens <- tokens(myCorpus,remove_punct = TRUE,remove_numbers = TRUE)
myTokens <- tokens_select(myTokens,names(data_int_syllables))

问题是，此代码修改了 myTokens 以仅保留在英语词典 (data_int_syllables) 中找到的标记。相反，我想删除在 data_int_syllables 中找到的所有单词。

有谁知道如何调整代码，使文字被删除，而不是保留？

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

相关问答