如何处理具有35个唯一值的分类数据?

问题描述

我正在处理IPL板球数据集,该数据集包含有关所有球队的击球统计数据。

我想想像一下不同的板球场地如何影响击球队的总成绩。我尝试绘制一个简单的散点图,但是体育场名称太长,并且不能清楚地显示名称

我必须将35个值转换为数字值吗?当我尝试找到与目标变量的相关性时,它什么也不打印。

数据集:

The dataset

读取图(x轴)的问题:

The problem with reading the plot(the x axis)

解决方法

您可以更改字体大小和/或旋转字体:https://matplotlib.org/api/matplotlib_configuration_api.html#matplotlib.rc

,

您可以通过设置figsize来扩大绘图。 (在第一行添加):

plt.figure(figsize(14,8))

,然后旋转xticks。 (最后):

plt.xticks(rotation=90)