如何将列表列转换为非嵌套列表?

当列元素为列表时,如何将列转换为非嵌套列表?

例如,该列就像

column
[1, 2, 3]
[1, 2]

我想最后关注.

[1,2,3,1,2]

但是现在有了column.tolist(),我会得到

[[1,2,3],[1,2]]

编辑:感谢您的帮助.我的目的是找到最简单(优雅)和最有效的方法来执行此操作.现在,我使用@jezrael方法.

from itertools import chain
output = list(chain.from_iterable(df[column])

最简单的方法由@pirsquared提供,但可能更慢.

output = df[column].values.sum()

解决方法:

您可以使用numpy.concatenate

print (np.concatenate(df['column'].values).tolist())
[1, 2, 3, 1, 2]

要么:

from  itertools import chain
print (list(chain.from_iterable(df['column'])))
[1, 2, 3, 1, 2]

一个解决方案,谢谢juanpa.arrivillaga

print ([item for sublist in df['column'] for item in sublist])
[1, 2, 3, 1, 2]

时序:

df = pd.DataFrame({'column':[[1,2,3], [1,2]]})
df = pd.concat([df]*10000).reset_index(drop=True)
print (df)

In [77]: %timeit (np.concatenate(df['column'].values).tolist())
10 loops, best of 3: 22.7 ms per loop

In [78]: %timeit (list(chain.from_iterable(df['column'])))
1000 loops, best of 3: 1.44 ms per loop

In [79]: %timeit ([item for sublist in df['column'] for item in sublist])
100 loops, best of 3: 2.31 ms per loop

In [80]: %timeit df.column.sum()
1 loop, best of 3: 1.34 s per loop

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...