我将文件名添加到数据框中,但它只添加了相同的名称

问题描述

我有很多 csv 文件要打开,我需要添加一个包含这些文件名称的额外列。例如,我有 x.csv、y.csv、z.csv 等。在 csv 文件中,它如下所示:

X  Z
1 3
4 5
4 6

它应该是这样的

    X  Z name
    1 3  x
    4 5  x
    4 6  x
    4 5  y
    4 5  y
    1 2  y 

我的代码在下面,但它只返回 1 个值...

import pandas as pd
import os
import rglob

file_list = rglob.rglob("path","*")
    
li = []
    
for path in file_list:
    df = pd.read_csv(path,index_col=None,header=0,)
    file_name = os.listdir('path')[0]
    df["file_name"] = file_name
    li.append(df)

知道如何修复它吗?

最好的问候

解决方法

您的 os.listdir 是错误的。 os.listdir 返回目录中的文件列表。您应该使用 os.basenamepathlib.Path.name

使用路径库:

import pandas as pd
from pathlib import Path

file_list = Path("path").rglob("*.csv")
    
li = []
    
for path in file_list:
    df = pd.read_csv(path,index_col=None,header=0,)
    df["file_name"] = path.name
    li.append(df)