问题描述
我有一个二进制列,其中 0 表示失败,1 表示成功。此列已由名为 events
的第二列分组。这是分组前的数据样本:
isPaid isEvent
0.0 event
0.0 event
1.0 event
1.0 unkNown
1.0 unkNown
我只考虑isPaid==0
(失败)的情况对数据进行分组,因为这是我感兴趣的。分组后,我得到每个 isPaid
值的总数,如下所示:
df[df['isPaid'] == 0].groupby('isEvent')['isPaid'].count()
这就是我得到的:
isEvent
event 308991
unkNown 251063
我如何测试 python
中 2 个计数之间的差异是否具有统计显着性?
我考虑过配对 t 检验,但由于我使用的是二进制数据,我不确定这是正确的方法。此外,这些测试会检查均值,但我只想知道计数之间的差异是否具有统计显着性。
我如何在 python 3
中执行此操作?
提前致谢
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)