问题描述
我想按时间维度对每年的数据集(netcdf文件)进行排序,然后取平均值。问题在于,dask仅支持“ topk”排序,如果包括整个范围的值,则会消耗所有内存。 Xarray仅支持对一维数组进行排序。 numpy排序可以完成这项工作,但同时也会消耗内存。有什么办法可以利用dask在整个轴上对整个大型数据集进行排序以减少内存占用吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)