生成列
查看。pandas的底层是numpy,所以效率很高
通过索引
一些方法
从列对象转成其它对象。tolist中间没有_
下面是重头戏,DataFrame生成和列名,索引的修改
提取pandas里的数据
增删列,增删行
df.iloc[] 查询的是内存上的物理顺序,不受中间删掉一行索引不连续的影响。iat取单个值用法
使用比较运算筛选数据
pandas导入数据
sort排序
排名 rank
合并两张表:merge列合并,concat行合并
异常值的分析
下面是我拿到一个商城的出售信息后做的一些处理
下面是time和datetime两个模块的一些用法
pandas对时间序列的操作
生成时间序列,将时间序列作为索引
- 公司里的数据会很复杂,也很大,有的时候甚至要求到服务器上跑,这就要我们对Linux要有点补充知识,但是Linux的命令很简单。