默认情况下始终标准化所有功能是不是一个坏主意?

问题描述

认情况下是否有理由不对所有功能进行标准化?我意识到它可能不是必要的,例如决策树,而是某些算法,如 KNN、SVM 和 K-Means。对我的所有功能进行常规操作会有什么危害吗?

此外,似乎一致认为标准化优于规范化?什么时候这不是一个好主意?

解决方法

根据我的经验,当您的数据集由具有非常不同范围的特征(例如年龄与每所房子的美元数)组成时,标准化和标准化具有最大的(积极)影响

根据我的专业经验,在使用汽车传感器进行项目时,我注意到归一化(最小-最大缩放),即使应用于神经网络,也会对训练过程产生负面影响,并且当然是最后的结果。诚然,传感器特征(值)彼此之间的值是否非常接近。考虑到我正在研究时间序列,这是一个非常有趣的结果,其中大多数数据科学家默认采用缩放(他们最终是神经网络,遵循理论)。

原则上,当涉及到数据集中的特定异常值时,最好应用标准化,因为标准化会产生较小的标准偏差值。以我的拙见,这就是标准化往往比标准化更受青睐的主要原因,它的稳健性优于异常值。

三年前,如果有人问我这个问题,我会说“标准化”是必经之路。现在我要说,遵循原则,但在得出某个结论之前先检验每个假设。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...