问题描述
我尝试将以下代码(最小示例)应用于我的200万行DataFrame,但是由于某种原因.apply向函数返回了多行并中断了我的代码。我不确定发生了什么变化,但是代码确实在之前运行过。
def function(row):
return [row[clm1],row[clm2]]
res = pd.DataFrame()
res[["clm1","clm2"]] = df.swifter.apply(function,axis=1)
有人有想法或类似的问题吗?
重要,没有做得很快,一切都很好,但是由于行数太慢了。
解决方法
基于this previous answer的操作,如果您按照以下方式进行更改,则应该可以正常工作:
def function(row):
return [row.swifter[clm1],row.swifter[clm2]]
res = pd.DataFrame()
res[["clm1","clm2"]] = df.apply(function,axis=1,result_type='expand')
这是因为apply on a column缺少result_type
作为arg,而apply on a dataframe却没有
axis=1
表示列,因此它将垂直插入。那是你要的吗?尝试删除axis=1