python 数据分析库介绍

1 引言

高效处理数据的python工具:

与外界进行交互:

  读写各种文件格式和数据库

准备:

  对数据进行清理、修整、整合、规范化、重塑、切片切换、变形等处理以便进行分析

转换:

  对数据集做一些数学和统计运算以产生新的数据集。你如说,根据分组变量对一个大表进行聚合

建模和计算:

  将数据进行统计模型、机器学习或其他计算工具联系起来

展示:

  创建交互式或静态的图片文字摘要

2 重要的库

(1)NumPy(Numerical Python)

菜鸟教程

numerical 英 /njuː'merɪk(ə)l/ 美 /nʊ'mɛrɪkl/N

NumPy是python科学计算的基础包

英 /nʌm/ py

一维数组:[ ];二维数组:[ [ ],[ ] ];三维数组:[ [ [ ],[ ] ],[ [ ],[ ] ] ]

NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:
矩阵运算
一个强大的N维数组对象 ndarray 用于对数组执行元素级计算以及直接对数组执行数学运算的函数
用于毒血硬盘上基于数组的数据集个工具 整合 C
/C++/Fortran 代码的工具 线性代数、傅里叶变换、随机生成功能

 

import numpy as np

(2)pandas

pandas是numpy的升级版本

提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数

pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据库(如sql)灵活的数据处理功能。他提供了复杂的精细索引功能

以便便捷完成重塑、切片和切块、聚合以及选取数据子集等操作

首先需要了解他主要两个数据结构:Series和DataFrame。

(3)matplotlib数据可视化神器

[mæt'plɒtlib] 美式读音:[mæt'plotlib] 

是最流行的用于绘制数据图表的Python库

import matplotlib.pyplot as plt

线图; 散点图; 等高线图; 条形图; 柱状图; 3D 图形, 甚至是图形动画等等.

 

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...