linux – 使用grep过滤掉一个停用词文件中的单词

我想使用grep和一个stopwords文件来过滤掉另一个文件中的常用英语单词.文件“somefile”每行包含一个单词.
cat somefile | grep -v -f stopwords

这种方法的问题是:它检查某些文件中是否出现停用词中的单词,但我想要相反,即检查某些文件中的单词是否出现在停用词中.

这该怎么做?

somefile包含以下内容:

hello
o
orange

停用词包含以下内容:

o

我想从somefile中过滤掉单词“o”,而不是hello和orange.

解决方法

我想了一下,找到了解决方案……

使用grep的-w开关来匹配整个单词:

grep -v -w -f stopwords somefile

相关文章

linux常用进程通信方式包括管道(pipe)、有名管道(FIFO)、...
Linux性能观测工具按类别可分为系统级别和进程级别,系统级别...
本文详细介绍了curl命令基础和高级用法,包括跳过https的证书...
本文包含作者工作中常用到的一些命令,用于诊断网络、磁盘占满...
linux的平均负载表示运行态和就绪态及不可中断状态(正在io)的...
CPU上下文频繁切换会导致系统性能下降,切换分为进程切换、线...