在列中定位特定文件类型

问题描述

报告中的一列标题为“文件名”,并且有几个可能的选项“xxxx.pdf”、“xxxx.Empty”。

例如,如何让 Python 仅定位“.Empty”的文件

我一直在尝试以下代码,它不会产生错误,但在应该时也不会产生任何结果

df3.loc[df3['Filename'] == '.Empty']

提前致谢

解决方法

假设你有一个这样的数据框

df = pd.DataFrame([['a.Empty'],['b.pdf']],columns=['file'])
    file
0   a.Empty
1   b.pdf

要获取所有为空的文件,请使用 str.contains

df[df['file'].str.contains('.Empty')]
    file
0   a.Empty

如果你想要除空之外的所有文件

df[~df['file'].str.contains('.Empty')]
    file
1   b.pdf