如何通过匹配 R 中的特定列将数百列合并到一个数据框中?

问题描述

我目前有数百个包含唯一 ID 和非标准化读取计数的文件。我想从每个文件获取读取计数,并将它们全部与第一列中的唯一 ID 匹配。但是,每个文件都有不同数量的计数和不同的 ID,这些 ID 可能包含也可能不包含来自最后一个文件的重复项。 (基本上我想为 DESeq2 制作一个计数文件

我使用下面的代码来合并这些文件,但计数与原始 ID 不匹配。

我的总体目标是从每个文件获取未规范化的读取计数,并将它们与一个数据框与相应的唯一 ID 的总列表相匹配——如果该文件没有该特定 ID 的计数,则可以填充0.

'''

DF = do.call(cbindX,lapply( list.files(pattern=".*.txt"),FUN=function(x) { 
                       aColumn = read.delim(x,header=T)[,c("MINTbase.Unique.ID","Unnormalized.read.counts")];
                       colnames(aColumn)[2] = x;
                       aColumn;
                     }
             )
)
DF = DF[,!duplicated(colnames(DF))]

'''

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)