问题描述
我想对具有混合特征(数字和分类)的数据集进行离群值检测。搜索之后,我阅读了有关使用K-原型聚类进行异常检测的信息。我不知道如何将其用于此类目的?顺便说一句,数据集具有标签。如果你们知道另一种异常值检测方法,我将不胜感激。
我了解将分类从数字转换为数字的标签编码技术。我认为这会产生误导,因为大多数功能都是名义功能(非顺序功能)。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)