python – pandas将dataframe列单元格初始化为空列表

我需要将DataFrame列中的单元格初始化为列表.

df['some_col'] = [[] for _ in no_of_rows]

我想知道在时间效率方面有更好的方法吗?

解决方法:

因为您正在寻找时间效率,低于一些基准.我认为列表理解已经非常快,可以创建列表对象的空列表,但是您可以使用itertools.repeat挤出一个边际改进.在插入件上,应用速度慢3倍,因为它循环:

import pandas as pd
from itertools import repeat
df = pd.DataFrame({"A":np.arange(100000)})

%timeit df['some_col'] = [[] for _ in range(len(df))]
100 loops, best of 3: 8.75 ms per loop

%timeit df['some_col'] = [[] for i in repeat(None, len(df))]
100 loops, best of 3: 8.02 ms per loop

%%timeit 
df['some_col'] = ''
df['some_col'] = df['some_col'].apply(list)
10 loops, best of 3: 25 ms per loop

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...