如何轻松生成许多具有两个以上变量的加权交叉表?

问题描述

我有一个大型调查,需要针对该调查表中的所有项目生成一组表格,并按城市/位置 和一组人口统计学变量进行交叉制表。即在每个城市中,我想找到每个人口对给定问题的回答比例。我需要这些在每个城市的人口统计中求和。数据是分类数据和数字数据的混合。这样可以对数据的外观有所了解,包括每个观测值的权重:

library(dplyr)
n = 30

df <- data.frame(city = sample(c("New York","Chicago","Boston"),n,replace = TRUE),gender = sample(c("Male","Female"),religion = sample(c("Protestant","Catholic","Jewish"),weights = runif(n,min = 0.1,max = 2.0),q1 = sample(c("good","bad","okay"),q2 = sample(c("always","sometimes","never"),q3 = sample(c(1:6),replace = TRUE))

我知道应该使用某种方法来使用dplyr中的加权计数和比例,但是运气不高。在for中使用wtd.table循环是行不通的,因为它一次只允许两个变量。非常感谢您提供关于如何使用多个交叉变量轻松将许多加权比例制成表格的建议。

df %>%
  group_by(city,religion,gender)  %>%
  count(names(df)[5:7],wt = weights) %>%
  summarise(weighted.mean())

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...