多年来使用 Tidycensus 创建大型国家数据集

问题描述

我正在使用 tidycensus 为该国所有人口普查区提取三年不同年份(2000 年、ACS 2009-2013、ACS 2015-2019 年)的论文数据。

基于 kyle walker 的 tutorial,我已经能够使用 map_df 函数来创建下面的调用,这很有效。结果是一个数据框,它为该国家的每个人口普查区提取向量中列出的所有变量的数据:

# get vector of state fips codes for US
us <- unique(fips_codes$state)[1:51]



# select my variables
my_vars19 <- c(pop = "B01003_001",racetot = "B03002_001",nhtot = "B03002_002",nhwht = "B02001_002",nhblk = "B02001_003",nhnat = "B02001_004",nhasian = "B02001_005",nhpac = "B02001_006",nhother = "B02001_007",nhtwo = "B02001_008",hisp = "B03003_003",male = "B01001_002",female = "B01001_026")



# function call to obtain tracts for US
acs2019 <- map_df(us,function(x) {
           get_acs(geography = "tract",variables = my_vars19,state = x)
})

glimpse(acs2019)

Rows: 949,728
Columns: 5
$ GEOID    <chr> "01001020100","01001020100","…
$ NAME     <chr> "Census Tract 201,Autauga County,Alabama","Census Tract 201,"…
$ variable <chr> "male","female","pop","nhwht","nhblk","nhnat","nhasian","nhpac","nhother","nhtwo",…
$ estimate <dbl> 907,1086,1993,1685,152,2,154,1967,26,1058,901,1959,759,1117,…
$ moe      <dbl> 118,178,225,202,78,12,5,120,226,36,137,133,113,180,…

不过,这只是一个练习电话。我需要为每年的分析(例如 2000、2009-2013 和 2015-2019)提取接近 150 到 200 个变量。我担心为这么多州和人口普查区提取这么多变量会对 API 造成很大负担。另外,我认为您可以一次拉取的变量数量是有限制的。

我可以按变量类型对调用进行分组,但我担心将调用分组会变得笨拙。而且我还需要将它们组合在一起。我想知道标准做法是使用 tidycensus 创建大型数据集吗?

人们通常会中断通话还是只是打电话给桌子?或者是否有比我概述的更有效的系统。我知道大多数人通常使用 tidycensus提取少量变量,但是当他们需要提取很多变量时他们会怎么做?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...