pandas计数 value_counts()的使用

这篇文章主要介绍了pandas计数 value_counts()的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

在pandas里面常用value_counts确认数据出现的频率。

1. Series 情况下:

pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序。

import pandas as pd df = pd.DataFrame({'区域' : ['西安', '太原', '西安', '太原', '郑州', '太原'], '10月份销售' : ['0.477468', '0.195046', '0.015964', '0.259654', '0.856412', '0.259644'], '9月份销售' : ['0.347705', '0.151220', '0.895599', '0236547', '0.569841', '0.254784']}) print(df)

统计每个区域出现多少次:

print(df['区域'].value_counts())

每个区域都被计数,并且认从高到低排序。

如果想升序排列,设置参数 ascending = True:

print(df['区域'].value_counts(ascending=True))

如果想得出计数占比,可以加参数 normalize=True

print(df['区域'].value_counts(normalize=True))

注:空值认剔除掉的。value_counts()返回的结果是一个Series数组,可以跟别的数组进行计算。

2. DataFrame 情况下:

import pandas as pd df = pd.DataFrame({'区域1' : ['西安', '太原', '西安', '太原', '郑州', '太原'], '区域2' : ['太原', '太原', '西安', '西安', '西安', '太原']}) print(df.apply(pd.value_counts))

区域2中没有郑州,所以是NaN。

相关文章

功能概要:(目前已实现功能)公共展示部分:1.网站首页展示...
大体上把Python中的数据类型分为如下几类: Number(数字) ...
开发之前第一步,就是构造整个的项目结构。这就好比作一幅画...
源码编译方式安装Apache首先下载Apache源码压缩包,地址为ht...
前面说完了此项目的创建及数据模型设计的过程。如果未看过,...
python中常用的写爬虫的库有urllib2、requests,对于大多数比...