从超过 100 亿个数字的双打流中计算运行中位数

问题描述

我的应用正在接收总数量超过 100 亿的双打数据流。我需要从这些数字中计算出一些统计参数。我找到了计算平均值和众数的方法。但我有中位数问题。为此有最大堆/最小堆解决方案（在第一个答案中给出 Running median）。但是通过这种方式，我必须在每个堆（或更多）中存储 50 亿个双精度数。数组、列表或字典无法做到这一点。我该怎么做？如果我的下一个元素与 maxHeap 的元素相同，我在描述的解决方案中必须做什么？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

c#c#median statistics streaming streaming