问题描述
我正在使用 pandasql 在Jupyter Notebook中工作,该脚本使用 sqlight 语法。我正在尝试从某个月中选择条目,具体取决于变量。我打算创建一个Python函数,该函数将更改所使用的变量的值,但是现在我正在尝试使“参数化查询”起作用。
我的表中有列DATE PAYED,PAYEE,AMOUNT
这是我的SQL查询的样子:
varMonth= "01"
q = """
SELECT
*,strftime('%m',"DATE DUE") as "months"
FROM
year2020
WHERE
"months" = "01"
"""
test2020 = sqldf(q,globals())
上面的代码成功地选择了一月份的所有条目。我想更改 WHERE 条件,以与变量varMonth
进行比较。
我已经看到有多种方法可以在SQL查询中传递值,例如?,:1,:varMonth,%s,%(varMonth)s,+varMonth+
,但这些方法似乎不适用于我的代码。在尝试时,他们产生了以下错误:PandasqlException: (sqlite3.ProgrammingError) Incorrect number of bindings supplied. The current statement uses 1,and there are 0 supplied
。我可以将它们放在引号中而不会出现错误,但随后将变量视为字符串。我已经看到.execute()
(1) (2)是传递查询变量的一种方法,但是,当我将最后一行更改为sqldf.execute(q,[varMonth])
时,收到了错误AttributeError: 'function' object has no attribute 'execute'
。
关于如何使用 pandasql 在JupyterNotebooks的SQL查询中使用变量的任何建议?
解决方法
似乎pandasql和pysqldf没有像普通数据库那样在查询中使用变量的方法-因此您必须使用字符串格式
q = """
SELECT
*,strftime('%m',"DATE DUE") as "months"
FROM
year2020
WHERE
"months" = "{}"
""".format(varMonth)
或f-string
q = f"""
SELECT
*,"DATE DUE") as "months"
FROM
year2020
WHERE
"months" = "{varMonth}"
"""
编辑:
我检查了两个模块的源代码,并且都使用了pandas.read_sql(),它们可以像普通数据库一样获得params=(...)
,但是模块不使用它。
如果您使用?
,%s
等,则只会得到错误,因为params
是None