使用R可视化诊断矩阵

问题描述

我有一个包含大量变量的数据框,我想相互绘制数字变量并分析散点图。

可以如下读取数据集

library(readr)

big_epa_cars <- readr::read_csv("https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2019/2019-10-15/big_epa_cars.csv")

然后我按照以下步骤绘制我感兴趣的变量

library(tidyverse)
library(Ggally)

big_epa_cars %>%
  filter(year == 2019) %>%
  select(barrels08,cylinders,city08,highway08,fescore,fuelCost08,co2TailpipeGpm,youSaveSpend) %>%
  ggpairs()

我还想在相似的矩阵中可视化每个组合分布的隐喻。 我能够计算和可视化单个变量对的诊断,并且在计算和可视化所选变量的所有组合(桶08,汽缸,city08,Highway08,fescore,fuelCost08,co2TailpipeGpm,youSaveSpend)方面需要帮助。

以下是我如何在一对变量上做到这一点

library(binostics)

s <- binostics::scagnostics(big_epa_cars_2019$city08,big_epa_cars_2019$highway08)$s
df_s <- tibble(scag = names(s),value = s) %>%
  mutate(scag = fct_reorder(scag,value))

ggplot(df_s,aes(x=value,y=scag)) + 
  geom_point(size=3,colour="blue") +
  geom_segment(aes(x=value,xend=0,y=as.numeric(scag),yend=as.numeric(scag)),colour="blue") +
  ylab("") + xlab("scagnostic value")

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)