问题描述
我目前有数百个包含唯一 ID 和非标准化读取计数的文件。我想从每个文件中获取读取计数,并将它们全部与第一列中的唯一 ID 匹配。但是,每个文件都有不同数量的计数和不同的 ID,这些 ID 可能包含也可能不包含来自最后一个文件的重复项。 (基本上我想为 DESeq2 制作一个计数文件)
我使用下面的代码来合并这些文件,但计数与原始 ID 不匹配。
我的总体目标是从每个文件中获取未规范化的读取计数,并将它们与一个数据框与相应的唯一 ID 的总列表相匹配——如果该文件没有该特定 ID 的计数,则可以填充0.
'''
DF = do.call(cbindX,lapply( list.files(pattern=".*.txt"),FUN=function(x) {
aColumn = read.delim(x,header=T)[,c("MINTbase.Unique.ID","Unnormalized.read.counts")];
colnames(aColumn)[2] = x;
aColumn;
}
)
)
DF = DF[,!duplicated(colnames(DF))]
'''
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)