如何实现 NA缺失值?

问题描述

我想在我为自己编写的矢量化数据整理库中实现 NA(缺失值)。我研究了一些系统是如何做到的,并找到了 3 种方法

  1. 使用每个值的一位作为丢失的标志位。这会减少您可以在一组位中编码的值的范围。

  2. 使用单独的位域作为掩码来标记缺失值。这意味着您现在可以为每个操作读取两个向量。不过,我想它可以并行完成。

  3. 为每种类型选择一个特定的位模式。不过,我不明白这是如何工作的。我想这意味着例如选择 MAX_INT 作为值意味着您的整数类型只能达到 MAX_INT - 1,优点是 MAX_INT 可以在编译时依赖于平台? Rcpp 似乎就是这样做的。

我有人建议使用联合类型,这在语言级别很有意义,但我也需要将数据(反)序列化到磁盘,所以我有点迷茫。您是否知道可以帮助我深入了解该主题的论文或其他资源?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)