我需要从数据框列表中按名称提取Excel工作表,其中每一行都是工作表的名称

问题描述

因此,我在xlsx中有很多文件,每个文件都需要几张纸。结构是这样的:

3张最终成绩纸,如成绩单。第一个是整体得分,第二个是我们评估的第一件事,称为“ a”;第三个是“ b”分数。全局分数是介于“ a”和“ b”之间的索引。

文件没有相同的行数。例如,我们评估“ 1”,“ 2”,“ 3”,“ 4”,“ 5”和“ 6”。但是,许多文件没有“ 2”和“ 5”。其他人没有“ 5”,只有极少数人拥有我们评估的所有事物。在“ 1”表中,有人用多个条件的评估值填充单元格:“它显示所有信息?” “信息是一个csv文件?”并得分。

在每个文件中,每个数字都有一个隐藏的表,其演算数为“ a”,而每个数字都有一个隐式工作表,其演算数为“ b”:即a1,b1,a2,b2,a3,b3等。我知道,听起来很乱。

除此之外,我们还有另外两个隐藏表,其摘要版本为a1,b1等。

我需要摘要版本。

因此,我提取了我们评估的行的名称(即1、2、4、6)和R Studio中工作表的名称(全局索引,索引,b索引,a1,b1,摘要a1,摘要a2等),并使用map为每件事物创建一个列表。

所以...

我有一个dir_ls(folder),其中包含所有xlsx文件 我用purrr::map()创建的数据帧列表,以及每个xlsx文件所需的工作表名称。这里是一个列表,列表的每个元素是一个数据框,在每个数据框中的每一行都是我需要提取的工作表的名称

我尝试了这个,其中da是带有工作表名称的数据帧列表:

read_excel(dir_ls(inp)[1],sheet = map(da,~ as.character(.x)))

map(dir_ls(inp),~
         read_excel(.x,~
                                      as.character(.y))))

文件适用于具有1个工作表名称的1个文件

try <- da[["2_Eva_23_AGatan.xlsx"]]

read_excel(paste(inp,list.files(inp),sep = "/")[1],sheet = as.character(try[1,1]))

但是,我需要146个文件和1348个工作表名称

编辑: 我尝试这个:

read_excel(dir_ls(inp)[[1]],sheet = map_chr(try,~ .))

并获得以下消息

Error: Result 1 must be a single string,not a character vector of length 10

希望可以提供帮助。

我一直在想这是purrr具有不同向量长度的问题。

编辑2:

我知道了!

因此,我一直在考虑两个不同长度的向量,因此决定制作一个包含Excel文件路径和工作表名称的数据框。

使用唯一的数据框,我使用map2。

map2(df$path,df$sheet,~ read_excel(path = .x,sheet = .y))

现在,我必须过滤和清理数据帧(超过1000个)。

写这篇文章我有很大帮助。

解决方法

我知道了!

因此,我一直在考虑两个不同长度的向量,因此决定制作一个包含Excel文件路径和工作表名称的数据框。

使用唯一的数据框,我使用map2。

map2(df$path,df$sheet,~ read_excel(path = .x,sheet = .y))

现在,我必须过滤和清理数据帧(超过1000个)。