对于我的用例，是否有比最小堆更快的东西？

问题描述

我的用例如下：

我需要获取一组不断增长的元素中的最小值；我只需要任何迭代的最小值
我将更新最小值，之后它保证不再是最小值，但它在订单中的新位置通常无法直接计算。
我将这个新值推回到集合中，然后进入下一次迭代，查看新的 min 元素。

现在我以下列方式使用 std::vector 和 std::pop_heap std::push_heap 。我在我的向量上调用 std::pop_heap 将最小元素推到向量的后面，我得到最后一个元素的引用并更新它，然后我调用 std::push_heap 将最后一个元素移动到它的新位置.所以我不必从 std::vector 复制结构体来更新它。有问题的结构体有 16 个字节，可以简单地构造，它的基本结构完全由整型组成。

根据我的分析器和一系列问题大小，我看到我在 std::pop_heap 上花费了超过 75% 的 cpu 时间，在 std::push_heap 上花费了大约 10%。现在在每个被检查的最小元素上执行的逻辑非常简单，主要包括添加和与固定输入的一些比较，所以我认为这可能是最好的。但是，如果有一个不同的或随机的奇怪数据结构可能比我目前使用的 min_heap 更快，那么尝试一下会很有趣。

我已经尝试过 std::min_element、std::nth_element、std::sort，对于 1,000,000 或更少的问题大小，每一个都需要我当前的不到 1 秒的解决时间，并按顺序增加运行时间量级（许多 10 秒）。鉴于它们都具有比 std::push_heap 和 std::pop_heap 更糟糕的复杂性，我会期待这一点。

我也尝试过使用像 std::map 和 std::set 这样的树结构，但这些也会降低性能（我现在手头没有数字）。

那么对于这个用例，有人知道比 min_heap 更好的东西吗？

（遗憾的是我无法提供源代码，但鉴于 85% 的 cpu 时间都花在了 pop_heap/push_heap 上，我认为无论如何它都不会非常有用）

编辑：比较运算符是两个整数类型之间的单个比较。所以它不像在堆中使用的比较运算符做了大量的工作。

解决方法

与其移除最小元素并重新插入更新的值，您还可以就地更改值并从根开始向下冒泡。删除最小元素通常会用最糟糕的元素之一替换根元素，通常会花费向下气泡，然后重新插入相对较小的值也会花费相对较长的向上气泡.就地更改密钥仅用一个向下气泡代替这两者，只要新值平均保持相对接近根，这通常也更短。

遗憾的是，在 <algorithm> 中没有此功能，但推出自己的功能并不难。把它写成移动到一个通过制作根的临时副本留下的“洞”，而不是一系列的std::swap。使用交换来完成它的总加载和存储数量大约翻倍。

使用 heap of larger arity（可能是 4，也可能是 8）可能会有所帮助。

c++data-structures performance performance performance