将dataframe.loc与多个字符串一起使用

问题描述

相对较新的python。我正在尝试使用df.loc函数来索引我的数据框中的列。我想返回该列等于多个字符串的数据框中的行。

使用df.loc索引一列,其中该列与一个值/字符串匹配,如下所示...

import pandas as pd

df_original = pd.read_csv('example.csv')

columnalias = df_original['colname']

dataframe1 = df_original.loc[columnalias == "value"]

这会将df_original中“ colname”中的值等于“ value”的每一行加载到新的数据帧(dataframe1)中。

我的问题出在我需要'colname'中的值来匹配大量值时。

例如,假设我要返回df_original中的行,其中“ colname”中的值等于value1,value2,... value10000。

这个...

values = [value 1,value2,... value10000]

dataframe2 = df_original.loc[columnalias == for x in values]

不起作用。也不

dataframe3 = df_original.loc[columnalias == "value1" or "value2"

或任何类似的解决方案。

错误消息包括将我指向a.any()或a.all(),但将变量加载到这些变量中也提供了类似的错误。我不知道接下来要尝试什么(由于某些原因df.loc文档似乎很稀疏),所以我创建了一个stackoverflow帐户来提出问题。希望这些信息足以供某人提供帮助。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)