python,pandas之随机抽样

'''
生成抽样数据
'''
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(600).reshape(100,6),   #100行6列
                columns=['A','B','C','D','E','F'])
print(df)

在这里插入图片描述

#设置随机种子
np.random.seed(10) #若不设置随机种子,则每次抽样的结果都不一样
#按个数抽样,不放回
df.sample(n=10)#抽取10个数据,这10个数据肯定不一样,因为是不放回抽样

#按个数抽样,有放回抽样
df.sample(n=20,replace=True)#抽取20个数据,这20个数据里可能有一样的数据,因为是放回抽样

#按照百分比抽样,不放回
df.sample(frac=0.2) #抽取20%的数据
#按照百分比抽样,有放回
df.sample(frac=0.2,replace=True) #抽取20%的数据

print(np.random.seed(10))

在这里插入图片描述

徕胖 发布了59 篇原创文章 · 获赞 23 · 访问量 9648 私信 关注

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...