如何轻松生成许多具有两个以上变量的加权交叉表？

问题描述

我有一个大型调查，需要针对该调查表中的所有项目生成一组表格，并按城市/位置和一组人口统计学变量进行交叉制表。即在每个城市中，我想找到每个人口对给定问题的回答比例。我需要这些在每个城市的人口统计中求和。数据是分类数据和数字数据的混合。这样可以对数据的外观有所了解，包括每个观测值的权重：

library(dplyr)
n = 30

df <- data.frame(city = sample(c("New York","Chicago","Boston"),n,replace = TRUE),gender = sample(c("Male","Female"),religion = sample(c("Protestant","Catholic","Jewish"),weights = runif(n,min = 0.1,max = 2.0),q1 = sample(c("good","bad","okay"),q2 = sample(c("always","sometimes","never"),q3 = sample(c(1:6),replace = TRUE))

我知道应该使用某种方法来使用dplyr中的加权计数和比例，但是运气不高。在for中使用wtd.table循环是行不通的，因为它一次只允许两个变量。非常感谢您提供关于如何使用多个交叉变量轻松将许多加权比例制成表格的建议。

df %>%
  group_by(city,religion,gender)  %>%
  count(names(df)[5:7],wt = weights) %>%
  summarise(weighted.mean())

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

r r survey