Python:列出所有包含字符串的文件名,如其列名

问题描述

我是python的新手。我有一个包含许多子文件夹的文件夹,其中包含100 + GB数据的Parquet文件。一些文件的大小也以GB为单位。我试图列出所有包含列名称的文件,例如“ Email”(开头,结尾或中间)case = False。输出应为.txt文件。我已经尝试了以下代码,但无法正常工作。有人可以帮忙吗?

inp=["Email","Mail"]
    op=[]
    for elem in listOfFiles:
        if(elem.endswith(".parquet")):
            full_path=elem
            filename = elem.split(".")
            filename = filename[0]
            pfile=pq.read_table(elem)
           stri  =  str(pfile.schema)
            for val in inp:
                if(stri.count(val)>0):
                    op.append(full_path)

解决方法

inp=["Email","Mail"]
op=[]
for elem in listOfFiles:
  if(elem.endswith(".parquet")):
    full_path=elem
    filename = elem.split(".")
    filename = filename[0]
    pfile=pq.read_table(elem)
    stri = str(pfile.schema)
    for val in inp:
      if(stri.count(val)>0):
        op.append(full_path)

尝试一下。如果您遇到错误,请在此处发布,我可以进一步解决问题。

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...