问题描述
我将测量数据作为数据框导入,并希望在文件名中给出的数据中包含实验条件。我想将新列添加到表示条件的数据框中,并且我想分配具有文件名指定的值的列。稍后,一旦我从每个单独的样本/文件中合并编辑过的数据帧,这将有助于与其他实验条件的比较。
这是我预先存在的数据框的示例Measurements
:
Measurements <- data.frame(
X = 1:4,Length = c(130,150,170,140)
)
以下是从文件名派生的变量和值的示例向量:
FileVars.vec <- c("Condition","Plant")
FileInfo.vec <- c("aKG","1")
for (i in 1:length(FileVars.vec)) {
Measurements[FileVars.vec[i]] <- FileInfo.vec[i]
}
这给出了所需的输出:
X Length Condition Plant
1 130 aKG 1
2 150 aKG 1
3 170 aKG 1
4 140 aKG 1
但我对 R 的(有限的)理解是,它是一种矢量化语言,通常不需要使用 for 循环。我觉得这个更简单的代码应该可以工作:
Measurements[FileVars.vec] <- FileInfo.vec
但它不是为一整列分配一个值,而是回收每一列中的值:
X Length Condition Plant
1 130 aKG aKG
2 150 1 1
3 170 aKG aKG
4 140 1 1
有没有办法做一个类似的简单赋值但不回收,即一个值只分配给一个完整的列?我想有一个简单的格式修复,但我已经搜索了超过 6 个小时的解决方案,但我没有在哪里看到这样的作业。我还想过创建一个仅包含实验条件的单独数据框,然后合并到实际数据框,但这对我来说似乎更迂回,尤其是比这些示例更多的实验条件和观察结果。
此外,如果有一个更成熟的管道/包来从文件名中获取信息并将其以整洁的方式添加到数据中,那也太棒了!原始文件名类似于:
"aKG_1.csv"
感谢您帮助 R 菜鸟!祝你在调试时获得良好的编码业力!
解决方法
我们可以转换为 list
然后分配以避免列明智的值的回收。由于它是一个 list
,每个元素将被视为一个单元,并通过回收这些元素为各个列进行分配
Measurements[FileVars.vec] <- as.list(FileInfo.vec)
-输出
Measurements
# X Length Condition Plant
#1 1 130 aKG 1
#2 2 150 aKG 1
#3 3 170 aKG 1
#4 4 140 aKG 1
如果我们想重置 type
,请使用 type.convert
Measurements <- type.convert(Measurements,as.is = TRUE)
请注意,通过为 vector
创建 FileInfo.vec
,它将只有一个 type
,即 character
。相反,如果我们想要有多种类型,它可以是一个 list
Measurements[FileVars.vec] <- list("akg",1)
对于问题的第二部分,如果我们有一个字符串
str1 <- "aKG_1.csv"
并希望从中创建两列,使用 read.csv
或 strsplit
Measurements[FileVars.vec] <- read.table(text = tools::file_path_sans_ext(str1),sep="_",header = FALSE)