问题描述
根据有关网站页面浏览量和这些页面上发生的事件的数据对用户进行分类的任务。
准备好的数据片段看起来像这样(我没有弄清楚如何以随机顺序填充0和1的矩阵,样本用0或1填充整行):
/zapadnoe-prodvizhenie/SEO-usa/ 10% 100% 25% 50% 75% 90% Call
40 0 1 0 1 0 0 0 0
41 0 1 0 1 1 1 0 1
42 0 1 0 0 0 0 0 0
43 0 1 0 1 1 1 1 0
44 0 1 0 1 1 1 1 0
45 0 1 0 1 0 0 0 0
46 0 1 0 1 1 0 0 0
47 0 1 0 1 1 0 0 0
48 0 1 0 1 1 1 0 0
49 0 1 0 0 0 0 0 0
50 0 NA NA NA NA NA NA NA
51 0 1 0 0 0 0 0 0
52 0 1 0 0 0 0 0 0
53 0 1 0 1 0 0 0 0
54 0 NA NA NA NA NA NA NA
55 0 1 0 1 1 1 1 0
56 0 NA NA NA NA NA NA NA
57 0 1 0 1 1 0 0 0
58 0 1 0 1 0 0 0 0
59 0 1 0 0 0 0 0 0
60 0 1 0 1 1 1 0 0
清除空行和缩放:
df_ex <- na.omit(df_ex)
df_ex <- scale(df_ex)
df_ex <- df_ex[,-(1:3)]
我们应用 K-means 并构建一个图:
library(factoextra)
library(fpc)
library(cluster)
k2 <- kmeans(df_ex,centers = 2,nstart = 25)
fviz_cluster(k2,data = df_ex)
我如何确定我可以信任这些数据和结果? 如何找到将噪声引入数据的变量? 如何显示特定类的特定功能?
На реальных данных мой результат выглядит следующим образом: Cluster plot
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)