问题描述
所以我正在做一些后台任务,最终不得不产生一个子进程(使用另一个团队提供的二进制文件)。如果超时,我想在某个时候停止这样的过程。
似乎很简单。
def run!(command,timeout)
Timeout.timeout(timeout) do
stdin,stdout,wait_thr = Open3.popen2e(command)
@pid = wait_thr.pid
# ... boring and irrelevant...
end
rescue Timeout::Error
Process.kill 'TERM',@pid
Process.wait pid
raise
end
现在,我还非常喜欢在命令之前加上对time
的调用。尼斯日志和所有。这使命令如下所示(MacOS)
gtime -f 'Time spent %E memory used %M' some/binary --with parameters"
所以我的进程树变成了这样的样子
ruby (my background job)
\__ gtime
\__ some/binary
当然,现在当我杀死子进程时,只有gtime
被杀死,二进制文件仍然存在。
- 如果我可以控制要用作直接子进程的可执行文件,则可以处理
TERM
并杀死其直接子进程。但这是time
/gtime
,所以我显然没有。但是也许有一些奥术参数吗? - docs提到了流程组,但是孩子当然与我的父流程共享相同的流程组。有没有办法在新的流程组中生成一个流程,从而使“杀死整个流程组”选项可行?
我也可能解析ps
输出,构建一个进程树并遍历它,以一个一个的方式杀死进程,但这似乎有点过大(抱歉)。我在这里真的缺少一些基本的东西吗?
解决方法
您可以通过传递pgroup: true
在新的 process组中启动该过程:(有关可用选项,请参见Process.spawn
的文档)
stdin,stdout,wait_thr = Open3.popen2e(command,pgroup: true)
然后可以通过在其过程组ID前面加上减号kill
来编辑整个过程组:
如果信号为负(或以减号开头),则杀死进程组而不是进程。
pgid = Process.getpgid(wait_thr.pid)
Process.kill '-TERM',pgid
,
您可能希望查看pgrep
,而不是解析ps
的输出。通过做一些侦探工作和discovering some code,我们发现此便捷功能:
# get child pids ordered by youngest descendants first
def child_processes(pid)
pids = `pgrep -P #{pid}`.split("\n").map(&:to_i)
pids.flat_map { |p| child_processes(p) } + pids
end
因此,我们有一个这样的进程树(来自我的计算机的示例):
9088 pts/3 Sl+ 1:13 \_ ruby smtserver.rb
9092 pts/3 Sl 0:41 \_ /usr/local/bin/chromedriver --port=9516
9101 pts/3 Sl 10:36 \_ /usr/lib/chromium-browser/chromium-browser
9111 pts/3 S 0:00 \_ /usr/lib/chromium-bro ser/chromium-bro
9113 pts/3 S 0:00 | \_ /usr/lib/chromium-bro ser/chromium
9154 pts/3 Sl 14:06 | \_ /usr/lib/chromium-bro ser/chro
9187 pts/3 Sl 0:07 | \_ /usr/lib/chromium-bro ser/chro
9135 pts/3 Sl 2:08 \_ /usr/lib/chromium-browser/chromium-bro
9312 pts/3 Sl 4:44 \_ /usr/lib/chromium-browser/chromium-bro
现在做child_processes(9092)
,我们得到了:
[9154,9187,9113,9111,9135,9312,9101]
然后,您有足够的信息来根据需要单独杀死整个树。
对于gtime
,只需杀死您的some/binary
就足够了,然后gmtime会自行退出。假设some/binary
没有创造更多的孩子,那么类似的事情应该可以解决您的问题:
rescue Timeout::Error
Process.kill 'TERM',child_processes(@pid).last
Process.wait @pid