折叠数小于25时的折叠因子:ForCats R

问题描述

我有一个Race因子,具有34个级别。由于许多级别的数量都少于20,因此我想将它们折叠为一个类别-“其他”。请注意,我已经将"Other"作为一个级别。

在您指定要折叠成一个级别但不确定如何实现fct_collapse()的过程中,我看到了count() < 20的文档。也许是case_when,但我不确定如何。

解决方法

您可以使用fct_lump(f=factor,prop=0.05,other_level=“Other”)折叠代表不到总数特定百分比的级别。您还可以使用n而不是prop来指定所需的确切级别,例如9到9级别+“其他”。