如何一起解释箱形图和直方图?

问题描述

enter image description here

我有这些图,都是根据相同的数据绘制的。但是我觉得它们没有意义(如果我错了,请纠正我)。

在箱形图中,第50个百分位数/中位数是11.7

据我了解,这意味着全部数据的50%小于此值11.7

数据大小为3404个数据点。 这意味着3404/2 = 1702个数据点小于11.7,对吧?

但是在直方图中,没有。 0-20 bin中的值的总和是1257。 没有20-40 bin中的值的总和为311。 没有40-60 bin中的值的最大值是113。

0-60之间的总数据点占整个数据的1681〜49%。

现在我很困惑,因为当〜50%的数据位于0-60之间时,中位数怎么可能是11.7?

有人可以对此进行说明吗?我可能错得很厉害,感谢任何帮助我的人!

谢谢!

解决方法

我的猜测是,箱形图的统计数据不包括众多异常值。您可能有足够的异常值来创建您描述的条件。实际上,您的箱形图最多只能达到60个。