在一个 glmtree 中代表 20 多个级别

问题描述

目前我正在 R 中使用 glmtree() 函数我有一些具有 20 多个级别的因子变量。问题在于树的表示。由于某些变量中的大量级别(即 i_mode 有 29 个级别),某些叶子上的某些信息无法可视化。

一种可能的解决方案是“虚拟化”这些级别。但是,如果可能的话,我宁愿不这样做。

你知道我可以用一种更易读的形式表示同一个图的方法吗?

有什么线索吗?

谢谢

Recursive partitioned tree

解决方法

我的感觉是,理解这样的情节是具有挑战性的,而且超出了标签问题。就我个人而言,我会尝试将这样一个因素分解为更易理解、级别更少的组(但不一定是二元的)。

话虽如此,在树中绘制边缘标签的面板函数 edge_simple() 有一些参数可以帮助提高可读性,例如,您可以改变它们的位置并更改字体大小。有关工作示例,请参阅: R partykit::ctree offset labels on edges 此外,您可以在学习树之前尝试缩写因子级别。但是,对于 29 个级别,恐怕所有这些都没有多大帮助。