理解 for 循环中的分叉

问题描述

我正在学习 Python 中的多处理，但在想象 os.fork() 时遇到了一些麻烦。我得到了网站上的一般案例，但我真的很难处理这个问题。

代码如下：

import os

for i in range(2):
    pid1 = os.fork()
    pid2 = os.fork()
    if (pid1>0):
            print("A")
    if (pid2==0):
            print("B")

我所知道的是打印了 10 个 A 和 10 个 B。我用 print() 弄乱了进程树的样子，我发现它符合我最初的想法，如下所示：

此图表示代码的行为，其中“类型”仅表示它们来自“pid1”还是“pid2”行。绿色圆圈代表循环的第一次迭代，蓝色圆圈代表第二次迭代。使用这个图表，我可以解释打印的 10 个 B，因为有 10 个类型 2 的进程，并且每个进程都打印 B。我遇到问题的地方是无法理解哪些打印 A。提前致谢。

解决方法

这是一个棘手的问题。考虑这个问题的最简单方法是迭代。第一次迭代，一开始我们有多少个流程？一。最后有多少？四。希望根据 fork 的工作原理，这是不言自明的。让我们计算一下，当我们在单次迭代中从一个进程开始时，应该打印多少个“A”。

现在，我喜欢将 pid1 和 pid2 视为“基因”，它们有时会被带入子进程。例如，在第一个 fork 中，父代持有 pid1 > 0，子代持有 pid1 == 0。但是第二个fork，下一代的孩子会“继承”和他们父母一样的pid1值，因为我们没有在第二个pid1中修改fork，只需pid2。

那么，如果我们只看 pid1，在迭代 1 结束时我们的 4 个进程中有多少个将具有 pid1 > 0？只有两个：第一个 fork 的原始父代和继承其 fork 值的第二个 pid1 的父代的第二个子代。因此这次迭代，只会打印两个“A”。

现在，第二次迭代，我们从 4 个过程开始，但关键是这 4 个过程中的每一个都将经历上述相同的迭代。我们已经知道每个启动过程将打印多少个“A”。在一次迭代中，一个启动进程最终打印了两个“A”，如果 4 个启动进程中的每一个都经过一次迭代，那么第二次迭代将导致打印 8 个“A”。

总共打印了多少个“A”？第一次迭代两个，第二次迭代八个。这意味着您应该看到该程序打印出 10 个“A”。

cycle cycle cycle fork fork operating-system python system-calls