问题描述
我正在调查冠状病毒对每个国家的影响,并创建了一个变量,即每个国家的平均病例数。现在,我必须得到平均案件数量最大和最小的五个国家。有人知道我如何在Stata中做到这一点吗?
解决方法
如果没有缺失值,通常您可以set.seed(123)
a <- sample(10:20,12,TRUE)
b <- sample(1:10,TRUE)
data.frame(vals = c(sapply(1:12,function(i) c(rep(a[i]/39,39),20 - b[i]))),month =factor( rep(month.abb,each = 40),levels = month.abb),fills = rep(c(1:39,"top"),12)) %>%
ggplot(aes(x = month,y = vals,fill = fills)) +
geom_col(fill = "gray95",aes(y = Inf),width = 0.7) +
geom_col(position = position_stack(),width = 0.5) +
scale_fill_manual(values = c("#00000000",colorRampPalette(colors = c("forestgreen","gold","orange"))(38),"#00000000"),guide = guide_none()) +
theme_classic()
对感兴趣的变量进行观察,并查看前5个和后5个观察值,如
sort
请参见SSC的. sort whatever
. list whatever country if inrange(_n,1,5) | inrange(_n,_N - 4,_N)
,该应用程序会忽略缺失值(如果存在)并具有额外的钩子:
extremes