理解 for 循环中的分叉

问题描述

我正在学习 Python 中的多处理,但在想象 os.fork() 时遇到了一些麻烦。我得到了网站上的一般案例,但我真的很难处理这个问题。

代码如下:

import os

for i in range(2):
    pid1 = os.fork()
    pid2 = os.fork()
    if (pid1>0):
            print("A")
    if (pid2==0):
            print("B")

我所知道的是打印了 10 个 A 和 10 个 B。我用 print() 弄乱了进程树的样子,我发现它符合我最初的想法,如下所示:

此图表示代码的行为,其中“类型”仅表示它们来自“pid1”还是“pid2”行。绿色圆圈代表循环的第一次迭代,蓝色圆圈代表第二次迭代。使用这个图表,我可以解释打印的 10 个 B,因为有 10 个类型 2 的进程,并且每个进程都打印 B。我遇到问题的地方是无法理解哪些打印 A。提前致谢。

解决方法

这是一个棘手的问题。考虑这个问题的最简单方法是迭代。第一次迭代,一开始我们有多少个流程?一。最后有多少?四。希望根据 fork 的工作原理,这是不言自明的。让我们计算一下,当我们在单次迭代中从一个进程开始时,应该打印多少个“A”。

现在,我喜欢将 pid1pid2 视为“基因”,它们有时会被带入子进程。例如,在第一个 fork 中,父代持有 pid1 > 0,子代持有 pid1 == 0。但是第二个fork,下一代的孩子会“继承”和他们父母一样的pid1值,因为我们没有在第二个pid1中修改fork,只需pid2

那么,如果我们只看 pid1,在迭代 1 结束时我们的 4 个进程中有多少个将具有 pid1 > 0?只有两个:第一个 fork 的原始父代和继承其 fork 值的第二个 pid1 的父代的第二个子代。因此这次迭代,只会打印两个“A”。

现在,第二次迭代,我们从 4 个过程开始,但关键是这 4 个过程中的每一个都将经历上述相同的迭代。我们已经知道每个启动过程将打印多少个“A”。在一次迭代中,一个启动进程最终打印了两个“A”,如果 4 个启动进程中的每一个都经过一次迭代,那么第二次迭代将导致打印 8 个“A”。

总共打印了多少个“A”?第一次迭代两个,第二次迭代八个。这意味着您应该看到该程序打印出 10 个“A”。