如何将 xlsb 文件添加到 Kedro 的目录中?

问题描述

1.我在catalog.yml文件中使用这个代码

equipment_data:
  type: pandas.ExcelDataSet
  filepath: data\01_raw\Equipment Profile.xlsb
  layer: raw

  1. 执行kedro run命令后出错。

` kedro.io.core.DataSetError: 从数据集 ExcelDataSet 加载数据失败(filepath=C:/Users/Akshay Salvi/Desktop/Bizmetrics/kedro-environment/petrocaeRepo/data/01_raw/2. Cycle data (per trip)- 20210113T042557Z-001/2. 循环数据(每次行程)/CycleData,2020.xlsb,load_args={'engine': xlrd},protocol=file,save_args={'index': False},writer_args={'engine': xlsxwriter})。

Excel 2007 xlsb 文件不支持 `

解决方法

所以 pandas.ExcelDataset 只是在下面调用 pandas 所以希望你能在 this example from another thread 之后运气好,引擎(由 pip install pyxlsb 安装另一个包提供)用于解析它只需在您的 YAML 目录中将 engine 参数提供为 load_args