熊猫数据框多行查询

问题描述

我有一个数据框

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randint(10,size=(10,3)),columns=['a','b','c'])

如果我现在尝试使用query方法进行查询

这有效:

df.query('''a > 3 and b < 9''')

这会引发错误

df.query(
    '''
        a > 3 and
        b < 9
    '''
)

我尝试了多行字符串的许多变体,但结果始终是以下错误

~/ven/lib/python3.6/site-packages/pandas/core/computation/eval.py in eval(expr,parser,engine,truediv,local_dict,global_dict,resolvers,level,target,inplace)
    306     if multi_line and target is None:
    307         raise ValueError(
--> 308             "multi-line expressions are only valid in the "
    309             "context of data,use DataFrame.eval"
    310         )

ValueError: multi-line expressions are only valid in the context of data,use DataFrame.eval

有人知道如何使它工作吗? 问题在于,实际上我要进行很长的查询,而必须全部写在一行中会非常不便。 我知道我可以改用布尔索引,但是我的问题只是关于如何在query方法中使用多行。

谢谢

解决方法

使用多行字符反斜杠(\

例如:

df = pd.DataFrame(np.random.randint(10,size=(10,3)),columns=['a','b','c'])
print(df.query(
    '''
        a > 3 and \
        b < 9
    '''
))