Ruby:从Windows上的外部进程的stdout和stderr读取大数据

问候,所有,

我需要从Windows上的Ruby 1.9.2运行一个可能长时间运行的进程,然后从外部进程的标准输出错误中捕获和解析数据.可以向每个数据发送大量数据,但我一次只对一行感兴趣(不捕获和存储整个输出).

经过一番研究后,我发现Open3 class将负责执行该过程并给我IO对象连接到过程的标准输出错误(通过popen3).

Open3.popen3("external-program.bat") do |stdin,out,err,thread|
  # Step3.profit() ?
end

但是,我不确定如何在不阻止程序的情况下连续读取两个流.由于在发送大量数据时调用IO#readlines on out或err导致内存分配错误,我正在尝试连续检查两个流以获取可用输入,但是我的任何实现都没有太多运气.

提前感谢任何建议!

解决方法

经过大量不同的试验和错误尝试后,我最终想出了使用两个线程,一个从每个流中读取(generator.rb只是我编写的一个脚本,用于输出标准输出错误):

require 'open3'

data = {}

Open3.popen3("ruby generator.rb") do |stdin,external|
  # Create a thread to read from each stream
  { :out => out,:err => err }.each do |key,stream|
    Thread.new do
      until (line = stream.gets).nil? do
        data[key] = line
      end
    end
  end

  # Don't exit until the external process is done
  external.join
end

puts data[:out]
puts data[:err]

它只是输出发送到标准输出的最后一行和调用程序的错误,但显然可以扩展为进行额外的处理(每个线程中有不同的逻辑).在我最终提出这个问题之前我使用的一种方法是由于竞争条件而导致一些失败;我不知道这段代码是否仍然容易受到攻击,但我还没有遇到类似的失败.

相关文章

validates:conclusion,:presence=>true,:inclusion=>{...
一、redis集群搭建redis3.0以前,提供了Sentinel工具来监控各...
分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣...
上一篇博文 ruby传参之引用类型 里边定义了一个方法名 mo...
一编程与编程语言 什么是编程语言? 能够被计算机所识别的表...
Ruby类和对象Ruby是一种完美的面向对象编程语言。面向对象编...