Marshal :: load中'proc'参数的目的是什么?

问题描述

我一直在寻找可以解释其目的的资源。我也找不到任何现实的实现。

下面是Ruby documentation的摘录:

load(source [,proc])→obj 返回转换 将源中的数据序列化为Ruby对象(可能与 下属对象)。源可以是IO的实例,也可以是 响应to_str的对象。如果指定了proc,则每个对象将 被反序列化时传递给proc。

我会很喜欢它的用法示例,或者至少将我引向一些资源。

解决方法

您可以通过执行以下操作来查看proc的调用方式:

irb(main):030:0> Marshal.load(Marshal.dump(a:1),lambda { |x| p [self,x]; x })
[main,:a]
[main,1]
[main,{:a=>1}]
=> {:a=>1}

与经过编组的字符串一起使用时,由于某种原因proc被调用了两次。

irb(main):031:0> Marshal.load(Marshal.dump('a'),"a"]
[main,true]
=> "a"
,

反序列化对象的转换

一个通用的用例是您要对要反序列化的对象执行一些操作或转换。例如,使用一些Ruby 2.7.1快捷方式:

Marshal.load Marshal.dump("abc"),->{ _1.to_s.upcase }
#=> "ABC"

在反序列化单个对象时,这不会增加太多价值,但是如果您要批量处理转储的对象,这可能会非常有用。我想不出一个实用的用例,在该用例中,您不能在反序列化之后转换 ,但是Ruby充满了有用的工具,无需中间步骤即可处理事情。这似乎是其中之一。

可能的错误:程序似乎两次运行但返回一次

在上面的示例中,我将第一个位置参数强制转换为字符串,因为否则会在通过lambda的两次通过之一中出现NoMethodError。您可以按如下方式解压缩正在发生的事情(但可能不是为什么):

prc = proc { |obj| pp obj }
Marshal.load Marshal.dump("abc"),prc
"abc"
true
#=> "abc"

无论出于何种原因,Proc或lambda的主体都会被调用两次,但只有返回才能通过第一遍。当在TrueClass上调用第二次调用时引发NoMethodError异常时,就会发生此问题,因此该调用永远不会返回值。

处理此问题的另一种方法是显式处理异常,例如:

prc = proc { |obj| obj.upcase rescue NoMethodError }

或避免在true上调用方法:

prc = proc { |obj| obj.upcase unless obj == true }

虽然我可以解释 的情况以及解决方法,但我不能告诉您为什么调用类似proc的对象的行为是这样的。这是Ruby核心团队的问题,还是Ruby bug tracker的饲料。