在熊猫中打开多个文件-其中一些是“所有者”文件

问题描述

我正在尝试将多个带有熊猫的文件打开到一个数据框中。

只有前缀〜$的文件显示错误

XLRDError: Unsupported format,or corrupt file: Expected BOF record; found b'\x15Microso'

这是我的文件路径列表中的两个:

bulk_uploads /~$0730-0731.xlsx',bulk_uploads /0701-0702.xlsx'

一个没有前缀的文件可以很好地打开,我不确定另一个为什么会引发错误

这是我正在尝试的代码

import pandas as pd
import glob

path = 'bulk_uploads ' # use your path
all_files = glob.glob(path + "/*.xlsx")

li = []

for filename in all_files:
    df = pd.read_excel(filename,sheet_name = 1)
    df['Date'] = str(filename)[:-4]
    li.append(df)

# frame = pd.concat(li,axis=0,ignore_index=True)

是否有办法使所有带有该前缀的文件丢失,或者以其他方式解决

似乎它们是我以前打开的文件(我目前没有打开的文件

解决方法

import pandas as pd
import glob
import re

path = 'bulk_uploads ' # use your path
all_files = glob.glob(path + "/*.xlsx")

li = []
special=re.compile('$~')  #####add more special characters if any

for filename in all_files:
   if special.search(filename):
      os.remove(filename)
   else:
        df = pd.read_excel(filename,sheet_name = 1)
        df['Date'] = str(filename)[:-4]
        li.append(df)

您可以尝试一下,看看是否可以正常工作吗? 看来您的文件夹中有临时文件。