分箱时如何包含0值

问题描述

你能告诉我如何在此处也包含 0 吗?

data['count_comma'] = pd.cut(data['comma'],bins=[0,6,np.inf],labels=['lt6','ge6'])

按上述方式尝试,当文本中没有逗号(即 0)时,我会得到 NaN 值。它应该被包含并获得价值 lt6

非常感谢。

解决方法

使用 include_lowest=True 参数。

import pandas as pd
data = pd.DataFrame({'comma': [0,1,2,3,4,5,6,7,8]})

data['count_comma'] = pd.cut(data['comma'],bins=[0,np.inf],labels=['lt6','ge6'],include_lowest=True)

   comma count_comma
0      0         lt6
1      1         lt6
2      2         lt6
3      3         lt6
4      4         lt6
5      5         lt6
6      6         lt6
7      7         ge6
8      8         ge6