问题描述
我有一个Race
因子,具有34个级别。由于许多级别的数量都少于20,因此我想将它们折叠为一个类别-“其他”。请注意,我已经将"Other"
作为一个级别。
在您指定要折叠成一个级别但不确定如何实现fct_collapse()
的过程中,我看到了count() < 20
的文档。也许是case_when
,但我不确定如何。
解决方法
您可以使用fct_lump(f=factor,prop=0.05,other_level=“Other”)
折叠代表不到总数特定百分比的级别。您还可以使用n
而不是prop
来指定所需的确切级别,例如9到9级别+“其他”。