杀死红宝石中的整个过程树

问题描述

所以我正在做一些后台任务,最终不得不产生一个子进程(使用另一个团队提供的二进制文件)。如果超时,我想在某个时候停止这样的过程。

似乎很简单。

def run!(command,timeout)
  Timeout.timeout(timeout) do
    stdin,stdout,wait_thr = Open3.popen2e(command)
    @pid = wait_thr.pid

    # ... boring and irrelevant...
  end
rescue Timeout::Error
  Process.kill 'TERM',@pid
  Process.wait pid

  raise
end

现在,我还非常喜欢在命令之前加上time调用。尼斯日志和所有。这使命令如下所示(MacOS)

gtime -f 'Time spent %E memory used %M' some/binary --with parameters" 

所以我的进程树变成了这样的样子

ruby (my background job)
 \__ gtime
      \__ some/binary

当然,现在当我杀死子进程时,只有gtime被杀死,二进制文件仍然存在。

  1. 如果我可以控制要用作直接子进程的可执行文件,则可以处理TERM并杀死其直接子进程。但这是time / gtime,所以我显然没有。但是也许有一些奥术参数吗?
  2. docs提到了流程组,但是孩子当然与我的父流程共享相同的流程组。有没有办法在新的流程组中生成一个流程,从而使“杀死整个流程组”选项可行?

我也可能解析ps输出,构建一个进程树并遍历它,以一个一个的方式杀死进程,但这似乎有点过大(抱歉)。我在这里真的缺少一些基本的东西吗?

解决方法

您可以通过传递pgroup: true在新的 process组中启动该过程:(有关可用选项,请参见Process.spawn的文档)

stdin,stdout,wait_thr = Open3.popen2e(command,pgroup: true)

然后可以通过在其过程组ID前面加上减号kill来编辑整个过程组:

如果信号为负(或以减号开头),则杀死进程组而不是进程。

pgid = Process.getpgid(wait_thr.pid)
Process.kill '-TERM',pgid
,

您可能希望查看pgrep,而不是解析ps的输出。通过做一些侦探工作和discovering some code,我们发现此便捷功能:

# get child pids ordered by youngest descendants first
def child_processes(pid)
  pids = `pgrep -P #{pid}`.split("\n").map(&:to_i)
  pids.flat_map { |p| child_processes(p) } + pids
end

因此,我们有一个这样的进程树(来自我的计算机的示例):

 9088 pts/3    Sl+    1:13  \_ ruby smtserver.rb
 9092 pts/3    Sl     0:41      \_ /usr/local/bin/chromedriver --port=9516
 9101 pts/3    Sl    10:36          \_ /usr/lib/chromium-browser/chromium-browser
 9111 pts/3    S      0:00              \_ /usr/lib/chromium-bro ser/chromium-bro
 9113 pts/3    S      0:00              |   \_ /usr/lib/chromium-bro ser/chromium
 9154 pts/3    Sl    14:06              |       \_ /usr/lib/chromium-bro ser/chro
 9187 pts/3    Sl     0:07              |       \_ /usr/lib/chromium-bro ser/chro
 9135 pts/3    Sl     2:08              \_ /usr/lib/chromium-browser/chromium-bro
 9312 pts/3    Sl     4:44              \_ /usr/lib/chromium-browser/chromium-bro

现在做child_processes(9092),我们得到了:

[9154,9187,9113,9111,9135,9312,9101]

然后,您有足够的信息来根据需要单独杀死整个树。

对于gtime,只需杀死您的some/binary就足够了,然后gmtime会自行退出。假设some/binary没有创造更多的孩子,那么类似的事情应该可以解决您的问题:

rescue Timeout::Error
  Process.kill 'TERM',child_processes(@pid).last
  Process.wait @pid

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...