问题描述
我正在寻找一种为非冗余聚类生成合成数据集的方法。
非冗余我的意思是接收例如当使用 sklearn make_blobs
函数时,不仅单个 y
作为目标集群,而且对于同一数据集具有多个 y(多个可能的集群)。例如,可以想象按性别、国籍、大小等对人们进行聚类。相同的数据会导致不同的聚类结果。
有没有人遇到过……这可能对我有帮助,或者确实知道如何调整,例如make_blobs
适合我的场景吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)