问题描述
我刚刚再次进入回归分析并开始练习。我现在有一个以年龄组为分类变量的 covid 数据集(比如 0-10、20-30 ...)。我拥有的另一列是该特定年龄组的住院人数。
我正在尝试对年龄(自变量)如何影响住院(因变量)进行回归分析。由于年龄组是分类变量,回归分析的输出并不是很有洞察力。
这是数据集现在的样子:
如果我运行一个简单的 LM,我会得到一个奇怪的输出:
我正在绞尽脑汁如何转换此数据集以获取有意义的见解。例如。年龄是住院的影响变量吗?系数是多少 -> 例如,高一个年龄组,住院人数增加......
非常感谢您的帮助!
解决方法