用于非冗余聚类的合成数据生成器

我正在寻找一种为非冗余聚类生成合成数据集的方法。非冗余我的意思是接收例如当使用 sklearn make_blobs 函数时，不仅单个 y 作为目标集群，而且对于同一数据集具有多个 y（多个可能的集群）。例如，可以想象按性别、国籍、大小等对人们进行聚类。相同的数据会导致不同的聚类结果。

有没有人遇到过……这可能对我有帮助，或者确实知道如何调整，例如make_blobs 适合我的场景吗？

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

相关问答