有没有一个Perl统计软件包,不能一次加载整个数据集?

我正在寻找Perl(CPAN是好的)的统计数据包,允许我增量地添加数据,而不必传递整个数据数组.

只有平均值,中位数,stddev,max和min是必要的,没有什么太复杂.

原因是因为我的数据集完全太大,无法适应内存.数据源在MySQL数据库中,所以现在我只是查询数据的一部分并计算它们的统计数据,然后再结合所有可管理的子集.

如果您有其他想法如何克服这个问题,我将非常有责任!

解决方法

Statistics::Descriptive::Discrete允许您以类似于Statistics :: Descriptive的方式执行此操作,但已针对大型数据集进行了优化. (例如,文档报告内存使用量提高了两个数量级(100x)).

相关文章

1. 如何去重 #!/usr/bin/perl use strict; my %hash; while(...
最近写了一个perl脚本,实现的功能是将表格中其中两列的数据...
表的数据字典格式如下:如果手动写MySQL建表语句,确认麻烦,...
巡检类工作经常会出具日报,最近在原有日报的基础上又新增了...
在实际生产环境中,常常需要从后台日志中截取报文,报文的形...
最近写的一个perl程序,通过关键词匹配统计其出现的频率,让...