分类变量年龄组的回归分析例如 0-10、20-30 ...

问题描述

我刚刚再次进入回归分析并开始练习。我现在有一个以年龄组为分类变量的 covid 数据集(比如 0-10、20-30 ...)。我拥有的另一列是该特定年龄组的住院人数。

我正在尝试对年龄(自变量)如何影响住院(因变量)进行回归分析。由于年龄组是分类变量,回归分析的输出并不是很有洞察力。

这是数据集现在的样子:

enter image description here

如果我运行一个简单的 LM,我会得到一个奇怪的输出

enter image description here

我正在绞尽脑汁如何转换此数据集以获取有意义的见解。例如。年龄是住院的影响变量吗?系数是多少 -> 例如,高一个年龄组,住院人数增加......

非常感谢您的帮助!

解决方法

尝试使用每组的平均年龄或中位数年龄并用数字表示。