pandas 数据帧多行查询 [英] pandas dataframe multiline query

查看:33
本文介绍了 pandas 数据帧多行查询的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

假设我有一个数据帧

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])

如果我现在尝试使用query方法查询它:

这行得通:

df.query('''a > 3 and b < 9''')

这将引发错误:

df.query(
    '''
        a > 3 and
        b < 9
    '''
)

我尝试了多行字符串的多种变体,但结果总是出现以下错误:

~/ven/lib/python3.6/site-packages/pandas/core/computation/eval.py in eval(expr, parser, engine, truediv, local_dict, global_dict, resolvers, level, target, inplace)
    306     if multi_line and target is None:
    307         raise ValueError(
--> 308             "multi-line expressions are only valid in the "
    309             "context of data, use DataFrame.eval"
    310         )

ValueError: multi-line expressions are only valid in the context of data, use DataFrame.eval

有人知道怎么使它工作吗? 问题是,在现实中,我有一个很长的查询要做,必须在一行中写下所有内容,这将是非常不方便的。 我知道我可以改用布尔索引,但我的问题只是关于如何将multiline与query方法一起使用。

谢谢

推荐答案

使用多行字符反斜杠()

示例:

df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])
print(df.query(
    '''
        a > 3 and 
        b < 9
    '''
))

这篇关于 pandas 数据帧多行查询的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆