ruby-on-rails – 如何使用Nokogiri编写一个巨大的XML文件?

我有一个Rails应用程序,它在报告功能中使用delayed_job来运行一些非常大的报告.其中一个生成一个庞大的 XML文件,它可能需要几天时间才能编写代码.我认为,在互联网上看到令人印象深刻的基准测试后,Nokogiri可以为我们带来一些非常重要的性能提升.

但是,我能找到的唯一例子包括使用Nokogiri Builder创建一个xml对象,然后使用.to_xml来编写整个事物.但是我的邮政编码中没有足够的内存来处理这种大小的文件.

那么我可以使用Nokogiri将这些数据流式传输或写入文件吗?

解决方法

Nokogiri旨在构建内存,因为您构建了一个DOM并且它可以动态地将其转换为XML.它易于使用,但有一些权衡,在内存中进行操作就是其中之一.

您可能希望使用Erubis生成XML.不是在处理之前收集所有数据并将逻辑保存在控制器中,就像我们使用Rails一样,为了节省内存,您可以将逻辑放在模板中并让它迭代数据,这应该有助于满足资源需求.

如果您需要文件中的XML,则可能需要使用重定向来执行此操作:

erubis options templatefile.erb > xmlfile

这是一个非常简单的示例,但它表明您可以轻松定义模板以生成XML:

<% 
asdf = (1..5).to_a 
%>
<xml>
  <element>
<% asdf.each do |i| %>
    <subelement><%= i %></subelement>
<% end %>
  </element>
</xml>

当我调用erubis test.erb输出时:

<xml>
  <element>
    <subelement>1</subelement>
    <subelement>2</subelement>
    <subelement>3</subelement>
    <subelement>4</subelement>
    <subelement>5</subelement>
  </element>
</xml>

编辑:

The string concatenation was taking forever…

是的,它可以简单地因为垃圾收集.您没有显示有关如何构建字符串的任何代码示例,但是当您使用<<时,Ruby可以更好地工作.将一个字符串附加到另一个字符串而不是使用时. 最好不要尝试将所有内容保存在字符串中,而是将其立即写入磁盘,随后附加到打开的文件中. 再一次,没有代码示例,我在黑暗中拍摄你可能在做什么或为什么事情运行缓慢.

相关文章

validates:conclusion,:presence=>true,:inclusion=>{...
一、redis集群搭建redis3.0以前,提供了Sentinel工具来监控各...
分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣...
上一篇博文 ruby传参之引用类型 里边定义了一个方法名 mo...
一编程与编程语言 什么是编程语言? 能够被计算机所识别的表...
Ruby类和对象Ruby是一种完美的面向对象编程语言。面向对象编...