对于我的用例,是否有比最小堆更快的东西?

问题描述

我的用例如下:

  1. 我需要获取一组不断增长的元素中的最小值;我只需要任何迭代的最小值
  2. 我将更新最小值,之后它保证不再是最小值,但它在订单中的新位置通常无法直接计算。
  3. 我将这个新值推回到集合中,然后进入下一次迭代,查看新的 min 元素。

现在我以下列方式使用 std::vector 和 std::pop_heap std::push_heap 。我在我的向量上调用 std::pop_heap 将最小元素推到向量的后面,我得到最后一个元素的引用并更新它,然后我调用 std::push_heap 将最后一个元素移动到它的新位置.所以我不必从 std::vector 复制结构体来更新它。有问题的结构体有 16 个字节,可以简单地构造,它的基本结构完全由整型组成。

根据我的分析器和一系列问题大小,我看到我在 std::pop_heap 上花费了超过 75% 的 cpu 时间,在 std::push_heap 上花费了大约 10%。现在在每个被检查的最小元素上执行的逻辑非常简单,主要包括添加和与固定输入的一些比较,所以我认为这可能是最好的。但是,如果有一个不同的或随机的奇怪数据结构可能比我目前使用的 min_heap 更快,那么尝试一下会很有趣。

我已经尝试过 std::min_element、std::nth_element、std::sort,对于 1,000,000 或更少的问题大小,每一个都需要我当前的不到 1 秒的解决时间,并按顺序增加运行时间量级(许多 10 秒)。鉴于它们都具有比 std::push_heap 和 std::pop_heap 更糟糕的复杂性,我会期待这一点。

我也尝试过使用像 std::map 和 std::set 这样的树结构,但这些也会降低性能(我现在手头没有数字)。

那么对于这个用例,有人知道比 min_heap 更好的东西吗?

(遗憾的是我无法提供源代码,但鉴于 85% 的 cpu 时间都花在了 pop_heap/push_heap 上,我认为无论如何它都不会非常有用)

编辑:比较运算符是两个整数类型之间的单个比较。所以它不像在堆中使用的比较运算符做了大量的工作。

解决方法

与其移除最小元素并重新插入更新的值,您还可以就地更改值并从根开始向下冒泡。删除最小元素通常会用最糟糕的元素之一替换根元素,通常会花费 向下气泡,然后重新插入相对较小的值也会花费相对较长的向上气泡.就地更改密钥仅用一个向下气泡代替这两者,只要新值平均保持相对接近根,这通常也更短。

遗憾的是,在 <algorithm> 中没有此功能,但推出自己的功能并不难。把它写成移动到一个通过制作根的临时副本留下的“洞”,而不是一系列的std::swap。使用交换来完成它的总加载和存储数量大约翻倍。

使用 heap of larger arity(可能是 4,也可能是 8)可能会有所帮助。