pd.read_sql_query字符串列表参数折叠到第一个元素

问题描述

我在使用pandas.read_sql_query()方法时遇到了一个奇怪的问题,当我传递参数(该参数是格式为字符串的列表)时,该参数仅读取列表的第一个元素,并删除其他所有内容。原始列表是将数字重新格式化为字符串的列表,因此,从理论上讲,应保留列表的所有元素。例如,此代码返回的数据框:

    l = [1,2,3]
    l_as_str =  ",".join([x for x in map(str,l)])
    
    QUERY = """SELECT * FROM table WHERE id in (%(l_as_str)s)"""
    
    df = pd.read_sql_query(QUERY,params={"l_as_str": l_as_str},con=engine) 

...仅包含id = 1的项目,l的第一个元素。如果我切换元素的顺序(例如l = [2,1,3]),则它仅返回id = 2的项目。换句话说,l_as_str似乎只折叠到第一个元素。知道是什么问题吗?

解决方法

只需使用f字符串简化即可。无需通过params

l = [1,2,3]
l_as_str =  ",".join([x for x in map(str,l)])
    
QUERY = f"""SELECT * FROM table WHERE id in ({l_as_str})"""
df = pd.read_sql_query(QUERY,con=engine)