由于计算导致的相等/错误的特征值的统计比较

问题描述

我有一个机器学习管道,我们在其中获取一些时间序列数据,进行一些预处理,将其划分为多个窗口并计算一些统计和领域相关的特征。早些时候我们在 MATLAB 中有我们的代码,但由于部署问题不得不转移到 python。所以我们在 python 中实现了我们的代码,但我们发现计算的特征(特征矩阵 nxm,其中 n=数据窗口,m=计算特征的数量)与 Matlab 输出相比(按列)有点不同。那么问题来了,

单独比较每个特征列的正确度量/指标是什么,以便它给出列之间的相等性/相似性或误差的度量。

我尝试使用均方根误差 (RMSE) 和平均绝对误差 (MAE)。但是由于特征列的范围不同,到达阈值是令人困惑的。相关性也是一个很好的衡量标准。

请提供指向此类指标的指导

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)