从超过 100 亿个数字的双打流中计算运行中位数

问题描述

我的应用正在接收总数量超过 100 亿的双打数据流。我需要从这些数字中计算出一些统计参数。我找到了计算平均值和众数的方法。 但我有中位数问题。 为此有最大堆/最小堆解决方案(在第一个答案中给出 Running median)。但是通过这种方式,我必须在每个堆(或更​​多)中存储 50 亿个双精度数。数组、列表或字典无法做到这一点。我该怎么做?如果我的下一个元素与 maxHeap 的元素相同,我在描述的解决方案中必须做什么?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)