PyPy 与 CPython 3.8 - 相同代码的“迭代次数”差异?

问题描述

我在修补用 Python 编写的数独求解算法时偶然发现了一个有趣的现象。

我正在计算回溯算法中的迭代次数并将该数字保存在日志文件中。 (该算法似乎完全是确定性的,因此我对为了获得相同输出而突然增加的迭代次数很感兴趣。)

现在有趣的部分是:

当我尝试使用 PyPy(3.7-v7.3.3-win32)而不是 Python 3.8(64 位)运行相同的代码时,使用 PyPy 运行时的迭代次数大约翻了一番,从 362073 运行到 629505 cpython。

我的问题是:有谁知道为什么迭代次数会有这种差异?

日志:

Iterations: 629505,Time Taken: 0.8950409889221191,File: ./sudokus/9x9.csv  -- PyPy 3.7
Iterations: 629505,Time Taken: 0.895305871963501,File: ./sudokus/9x9.csv  -- PyPy 3.7
Iterations: 362073,Time Taken: 2.1060104370117188,File: ./sudokus/9x9.csv -- Python 3.8
Iterations: 362073,Time Taken: 2.1779544353485107,File: ./sudokus/9x9.csv -- Python 3.8

对于另一个数独文件,差异也存在但可以忽略不计:

Iterations: 19443164,Time Taken: 106.15500068664551,File: test_0.csv -- Python 3.8
Iterations: 19443259,Time Taken: 13.188998937606812,File: ./sudokus/test_0.csv  -- PyPy 3.7
Iterations: 19443259,Time Taken: 13.118957042694092,File: ./sudokus/test_0.csv  -- PyPy 3.7

我的代码是这样的: https://github.com/kasztp/kiwi.com-sudoku-solver/blob/OCR/sudoku_solver.py

解决方法

我认为您正在枚举第 117 行的集合。在 CPython 中,这个顺序是未指定的,即任意的。在 PyPy 中,您可以获得将项目放入集合中的顺序。

,

我已经在两个并发调试会话中逐步完成了您的代码,每个解释器一个。 set 中的 self.mask 在两个解释器之间看起来并不相同 - 它们包含相同的值,但顺序不同。即使在 solve 的第二次递归(当 self.iterations 变成 2 时),执行流程也会因为这种差异而发散。我不知道这是否是您看到的差异的确切原因,但我猜这与 set 在一个实现中保证插入顺序有关,而在另一个实现中没有。