一种在 R 中的因子内对水平进行统计聚类/分组的方法

我有一个由数字因变量和许多数字和类别解释变量构建的大数据库。我的一个分类变量中有太多级别，我正在寻找一种统计方法来将某些级别聚集在一起。

分类变量看起来像这样：

crops<- c("barley","wheat","broccoli","sunflower","cabbage","carrot","cheak_pea","clover","jojoba"....)

我已经做了anova，发现不同级别之间存在差异，而tukey只给我所有对之间的差异。任何关于如何找到我可以组合并最终获得少量级别的接近级别的建议？

谢谢！

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）