问题描述
相对较新的python。我正在尝试使用df.loc函数来索引我的数据框中的列。我想返回该列等于多个字符串的数据框中的行。
使用df.loc索引一列,其中该列与一个值/字符串匹配,如下所示...
import pandas as pd
df_original = pd.read_csv('example.csv')
columnalias = df_original['colname']
dataframe1 = df_original.loc[columnalias == "value"]
这会将df_original中“ colname”中的值等于“ value”的每一行加载到新的数据帧(dataframe1)中。
我的问题出在我需要'colname'中的值来匹配大量值时。
例如,假设我要返回df_original中的行,其中“ colname”中的值等于value1,value2,... value10000。
这个...
values = [value 1,value2,... value10000]
dataframe2 = df_original.loc[columnalias == for x in values]
不起作用。也不
dataframe3 = df_original.loc[columnalias == "value1" or "value2"
或任何类似的解决方案。
错误消息包括将我指向a.any()或a.all(),但将变量加载到这些变量中也提供了类似的错误。我不知道接下来要尝试什么(由于某些原因df.loc文档似乎很稀疏),所以我创建了一个stackoverflow帐户来提出问题。希望这些信息足以供某人提供帮助。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)