问题描述
我有一个药物数据库,其中包含患者的年龄和性别以及每个人使用的药物。基地有大约 15000 行(患者)和 1500 列(药物)。我需要降低这个基的维数来分析哪一组患者使用哪组药物。由于它是二进制基础,我不能使用 PCA,那么我可以使用什么?
这是数据库的示例。
性 | 年龄 | med_1 | med_2 | med_3 | med_4 | med_5 | med_6 | med_7 | med_8 | med_9 | med_10 |
---|---|---|---|---|---|---|---|---|---|---|---|
0 | 67 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
0 | 16 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 |
1 | 7 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 |
0 | 44 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
0 | 23 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
1 | 74 | 0 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
0 | 12 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)