在一行中按字数对字符串向量进行子集化 数据

问题描述

我有一个字符串向量

rownames
[1] "multifarmacias descuento" "multifarmacias"           "multifarmacias"

我的目标是通过仅包含一个单词的字符串将rownames排成一行,结果将是

[1] "multifarmacias"           "multifarmacias"

我尝试了以下操作,但会引发错误

rownames[which(sapply(strsplit(rownames," "),length)) == 1]

Error in which(sapply(strsplit(rownames,length)) : 
  argument to 'which' is not logical

是否有一种优雅的解决方案,可以根据字符串的字长来替换字符串向量?

解决方法

使用str_count

会更容易
library(stringr)
rownames[str_count(rownames,"\\w+") == 1]
#[1] "multifarmacias" "multifarmacias"

如果我们将strsplit与{{1}一起使用lengths,则效率更高

base R

OP帖子中的错误是基于rownames[lengths(strsplit(rownames,"\\s+")) == 1] #[1] "multifarmacias" "multifarmacias" 的错误放置,它应该在)之后,因为==1直接应用于长度为矢量的向量,即

which

其中((c(2,1,1)):错误的参数是不合逻辑的

数据

 which(c(2,1,1))
,

base R解决方案是:

#Data
x <- c("multifarmacias descuento","multifarmacias","multifarmacias")

#Code
x[which(lapply(strsplit(x,split = ' '),length)==1)]

输出:

[1] "multifarmacias" "multifarmacias"
,

这是使用grep

的另一个基本R选项
grep("\\s",rownames,invert = TRUE,value = TRUE)

给出

> grep("\\s",value = TRUE)
[1] "multifarmacias" "multifarmacias"