问题描述
我对 R 非常陌生,并且遇到了很多困难。
我正在使用一个davis
数据集,该数据集将报告的身高和体重与 UCDavis 学生的测量结果进行比较。
我的导师问我们高个子的自我报告是否与矮个子相似。
我不只是为“矮”、“平均”、“高”选择一个任意的截止值,我想让 R 做到这一点。我认为 cut() 函数会很有用,但它会将其转换为因子,因此我“丢失”了数据值。
我最终想做一个 t.test 来比较自我报告,但我停留在初始阶段。任何帮助将不胜感激。理想情况下,我想坚持使用 Base R,而不是 tidyverse...
解决方法
关键思想是 cut()
产生一个 new 变量。如果您在 heights
中有高度,请使用 gp <- cut(heights)
为每个条目计算出相应的组。这样你就不会失去任何东西。