使用正则表达式选择R数据帧中的行

我正在尝试在数据帧中选择列,其中列中包含的字符串与正则表达式或子字符串匹配:

数据帧:

aName   bName   pName   call  alleles   logRatio    strength
AX-11086564 F08_ADN103  2011-02-10_R10  AB  CG  0.363371    10.184215
AX-11086564 A01_CD1919  2011-02-24_R11  BB  GG  -1.352707   9.54909
AX-11086564 B05_CD2920  2011-01-27_R6   AB  CG  -0.183802   9.766334
AX-11086564 D04_CD5950  2011-02-09_R9   AB  CG  0.162586    10.165051
AX-11086564 D07_CD6025  2011-02-10_R10  AB  CG  -0.397097   9.940238
AX-11086564 B05_CD3630  2011-02-02_R7   AA  CC  2.349906    9.153076
AX-11086564 D04_ADN103  2011-02-10_R2   BB  GG  -1.898088   9.872966
AX-11086564 A01_CD2588  2011-01-27_R5   BB  GG  -1.208094   9.239801

例如,我想要一个仅包含列bName列中的ADN的数据帧。其次,我想在列bName中包含ADN的所有行,并且在列pName中匹配2011-02-10_R2。

我尝试使用函数grep(),agrep()等等,但没有成功…

subset(dat,grepl("ADN",bName)  &  pName == "2011-02-10_R2" )

注“&” (而不是向量化的“&&”)和“==”(而不是“=”这是赋值)。

请注意,您可以使用:

dat[ with(dat,bName)  &  pName == "2011-02-10_R2" ),]

…并且在内部函数中使用时可能会更为可取,但是将返回dat $ pName为NA的任何行的NA值。该缺陷(某些视为特征)可以通过添加& !is.na(dat $ pName)到逻辑表达式。

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...