问题描述
为什么此代码会出错 - UnboundLocalError: local variable 'tab' referenced before assignment
这是我的代码 -
def univar_tables(col_name):
if col_name in cat_cols:
tab = pd.DataFrame(pd.crosstab(df[col_name],columns = "count"))
tab["Row %"] = tab["count"]/len(df)
elif col_name in num_cols:
df["binned"] = pd.qcut(df[col_name],q=10,duplicates ='drop',precision = 2)
tab = pd.DataFrame(pd.crosstab(df["binned"],columns = "count"))
tab["Row %"] = tab["count"]/len(df)
return tab
解决方法
您收到错误,因为 tab
对象是有条件地创建的,并且对于某些输入日期,这两个条件都可能无法满足。您可以通过使用一些默认值 tab
创建 None
对象来避免该错误。
def univar_tables(col_name):
tab = None
if col_name in cat_cols:
tab = pd.DataFrame(pd.crosstab(df[col_name],columns = "count"))
tab["Row %"] = tab["count"]/len(df)
elif col_name in num_cols:
df["binned"] = pd.qcut(df[col_name],q=10,duplicates ='drop',precision = 2)
tab = pd.DataFrame(pd.crosstab(df["binned"],columns = "count"))
tab["Row %"] = tab["count"]/len(df)
return tab
,
您的函数 (univar_tables) 实际上有 3 条执行路径:
-
col_name in cat_cols
, -
col_name in num_cols
, - 否则(第一个和第二个条件都不满足)。
在前两种情况下,tab 变量被先设置,然后然后被引用。
但是在第三种情况下 tab 没有被设置,它只在 return 指令中被引用。
这可能是您错误的真正原因。 也许在这种(第三种)情况下,您应该将 tab 设置为某个值。