问题描述
因此,我在xlsx中有很多文件,每个文件都需要几张纸。结构是这样的:
3张最终成绩纸,如成绩单。第一个是整体得分,第二个是我们评估的第一件事,称为“ a”;第三个是“ b”分数。全局分数是介于“ a”和“ b”之间的索引。
文件没有相同的行数。例如,我们评估“ 1”,“ 2”,“ 3”,“ 4”,“ 5”和“ 6”。但是,许多文件没有“ 2”和“ 5”。其他人没有“ 5”,只有极少数人拥有我们评估的所有事物。在“ 1”表中,有人用多个条件的评估值填充单元格:“它显示所有信息?” “信息是一个csv文件?”并得分。
在每个文件中,每个数字都有一个隐藏的表,其演算数为“ a”,而每个数字都有一个隐式工作表,其演算数为“ b”:即a1,b1,a2,b2,a3,b3等。我知道,听起来很乱。
除此之外,我们还有另外两个隐藏表,其摘要版本为a1,b1等。
我需要摘要版本。
因此,我提取了我们评估的行的名称(即1、2、4、6)和R Studio中工作表的名称(全局索引,索引,b索引,a1,b1,摘要a1,摘要a2等),并使用map为每件事物创建一个列表。
所以...
我有一个dir_ls(folder)
,其中包含所有xlsx文件
我用purrr::map()
创建的数据帧列表,以及每个xlsx文件所需的工作表名称。这里是一个列表,列表的每个元素是一个数据框,在每个数据框中的每一行都是我需要提取的工作表的名称。
我尝试了这个,其中da是带有工作表名称的数据帧列表:
read_excel(dir_ls(inp)[1],sheet = map(da,~ as.character(.x)))
map(dir_ls(inp),~
read_excel(.x,~
as.character(.y))))
try <- da[["2_Eva_23_AGatan.xlsx"]]
read_excel(paste(inp,list.files(inp),sep = "/")[1],sheet = as.character(try[1,1]))
编辑: 我尝试这个:
read_excel(dir_ls(inp)[[1]],sheet = map_chr(try,~ .))
并获得以下消息
Error: Result 1 must be a single string,not a character vector of length 10
希望可以提供帮助。
我一直在想这是purrr具有不同向量长度的问题。
编辑2:
我知道了!
因此,我一直在考虑两个不同长度的向量,因此决定制作一个包含Excel文件路径和工作表名称的数据框。
使用唯一的数据框,我使用map2。
map2(df$path,df$sheet,~ read_excel(path = .x,sheet = .y))
现在,我必须过滤和清理数据帧(超过1000个)。
解决方法
我知道了!
因此,我一直在考虑两个不同长度的向量,因此决定制作一个包含Excel文件路径和工作表名称的数据框。
使用唯一的数据框,我使用map2。
map2(df$path,df$sheet,~ read_excel(path = .x,sheet = .y))
现在,我必须过滤和清理数据帧(超过1000个)。