问题描述
我有两个数据集,我想找出它们的相关程度。
数据集代表两支球队的比赛结果,其中 1 代表赢,0 代表平局,-1 代表输。
例如5场比赛
team1 = [1,1,-1,0]
team2 = [0,0]
计算皮尔逊相关系数直到一支球队赢得最后 5 场比赛为止都很好,因此是一个常数数组,例如
team1 = [1,1]
在这种情况下,无论团队 2 做了什么,皮尔逊相关系数都将不确定。
我觉得这很奇怪,因为如果 team2 也赢了 5 场比赛中的大部分,那么相关性实际上应该接近 1,而不是不确定的。
反之亦然,如果team2输掉了大部分比赛,根据我的理解,相关性应该接近-1。
我在这里做错了吗?或者我的数据需要另一种方法来确定数据集之间的关系有多强?
提前致谢
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)