使用 alpha-beta-pruning

问题描述

问题

我正在尝试使用带有 alpha-beta-pruningnegamax 算法来解决完美的信息零和游戏(如滴答声或国际象棋)。目标是证明一个玩家是否可以强制获胜或平局。这意味着没有深度限制,但算法总是评估游戏树,直到出现赢/平局。

我花了数周时间针对我的特定游戏优化我的代码,并将其缩减为我想说的几天的运行时间。但问题就在这里

由于 alpha-beta 剪枝,极大极小算法的运行时间是高度不可预测的。在我实际模拟之前,我无法确定是在接下来的 5 分钟内完成还是再运行 5 周。我希望能够预测剩余的运行时间,并且不会出现几个数量级的偏差。

到目前为止我尝试了什么

我正在记录所有子分支的结果,最多5*个子分支以及我花费的时间机器来模拟它们。然后我只是假设同一级别的职位需要相同的时间来评估并收工。这些预测有时会偏离10 倍或更多

我还查看了记录的数据,以了解我的假设是否成立。评估一个 5*sub-branch 所需的时间在 0.01s180s 之间变化。这就是为什么我的预测不正确的原因。谁会知道。

我的问题

我认为这适用于极小极大的所有实现:

  1. 是否有更复杂的算法来准确预测具有 alpha-beta 修剪的极小极大算法的剩余运行时间?还是极小极大只是设计不可预测的?

  2. 如果是这样,它们是如何工作的?

解决方法

我在 Negamax 算法上花了很多时间,我强烈建议您切换到这些算法。它将给出与 Minimax 相同的结果,但更容易调试和进一步优化,因为它只是代码的一半。

我对您要解决的游戏一无所知,但即使是最复杂的游戏,我认为如果没有超级计算机,这将是不可能的。不过要回答您的问题:

  1. 带 alpha-beta 修剪的极小极大高度依赖于您尝试移动的顺序(使用棋盘游戏术语)。您想先尝试最好的走法,这是在国际象棋中通过对可能的走法功能进行排序来完成的,例如捕获移动高于城堡。

    您还可以根据您要解决的问题,使用不同的技术进一步优化算法。例如换位表,如果相同的位置可以出现在另一个分支中。

  2. 我们需要更多地了解您正在尝试解决的游戏,才能知道哪种算法最有效。

最后的话:如果你想知道解决需要多长时间以及一段时间后你得到了多远,我建议你使用迭代深化。这也将加快您的搜索速度,因为您可以首先尝试从先前迭代中得出的最佳猜测,从而在下一次迭代中获得更快的 beta 截止:

for depth in range(1,inf):
    score = minimax(alpha,beta,depth....)
    time = elapsed_time()

现在您可以打印每个深度的经过时间并查看它在特定时间段内走了多远。如果您的优化产生任何结果,这也有助于衡量。由于 Minimax 树对于每个深度都呈指数级增长,因此您可以了解下一个深度需要多长时间。

因此,如果您知道赢/平/输需要多少步,您就可以很容易地估计通过这种技术是否可行。

希望我说清楚,英语不是我的母语 :) 如果有什么不清楚的地方,请随时在评论中提问。