问题描述
我有上面的数据,我需要在最后一列中代表地图上每个美国县的公司。院长应能够将鼠标悬停在一个县上并说出公司名称。它来自一个Excel数据透视表,我将其折叠为一个csv。我的策略是添加一列汇总每个县的公司计数的列,以便我可以映射该变量。我不确定执行此操作的最佳方法,我假设列值显示为“ Alabama Power Company(4)Wetterhorn Wireless LLC(3)”或“ Alabama Power Company Alabama Power Company Alabama Power Company Alabama Power Company Wetterhorn无线有限责任公司Wetterhorn无线有限责任公司Wetterhorn无线有限责任公司”或类似的东西。我会使用分组方式吗?在地图上汇总此数据透视表的最佳方法是什么?
解决方法
如果将数据作为data.table
加载,则可以非常容易地获得计数。只需将.N
和'by'一起使用,即可按国家和公司分组
library(data.table)
dt=data.table(data)
dt[,count:=.N,by=.(country,company)]
注意:
-
data
应该是从csv加载的数据框 - 用data.table中的国家和公司列名称替换
country
和company
我终于弄清楚了如何使用聚合来表示它:
summary =汇总(dt $ company,列表(dt $ ccounty),粘贴,collapse =“”)
这将产生所有获奖者的名字