形状奇特的小提琴情节

问题描述

我想用小提琴图比较技术化的几个维度的分布(这些维度是通过1到5的指数来衡量的)。 6个小提琴图中有5个看起来像您期望的那样,但是其中一个的形状确实很奇怪,没有反映在数据中。所以我想知道是否对此有任何解释。我将向您显示变量表,用于创建绘图的代码以及绘图本身。如果您需要更多信息,请随时询问。

表格:

> table(dat$cps_an,useNA="ifany")   # cps-Anlagen

                0             0.625 0.833333333333333              1.25  1.66666666666667             1.875               2.5             3.125              3.75             4.375 
               22                21                 3                20                 4                18                19                15                 5                 1 
                5              <NA> 
                2                 5 
> table(dat$cps_prod,useNA="ifany")   # cps-Produkte

                0             0.625 0.833333333333333              1.25  1.66666666666667             1.875               2.5             3.125  3.33333333333333              3.75 
                3                 8                 1                28                 3                33                38                13                 3                 3 
            4.375 
                2 
> table(dat$cpps,useNA="ifany")   # Produktionssysteme

                0 0.333333333333333                 1  1.16666666666667               1.5              1.75                 2               2.5  2.66666666666667  2.83333333333333 
                2                 1                 2                 2                 1                 1                11                 3                 2                 9 
                3  3.16666666666667  3.33333333333333               3.5  3.66666666666667              3.75  3.83333333333333  4.16666666666667  4.33333333333333  4.66666666666667 
                9                 2                22                 1                 3                 2                 9                28                 1                 6 
                5              <NA> 
               13                 5 
> table(dat$mobile,useNA="ifany")   # Mobile Devices

               0 1.66666666666667              2.5 3.33333333333333             3.75 4.16666666666667                5 
               3               29                4                2                3               34               60 
> table(dat$strat,useNA="ifany")   # Strategie und Organisation

               0            0.625             1.25 1.66666666666667            1.875              2.5            3.125 3.33333333333333             3.75            4.375                5 
               1                3                3                2               11               34               38                3               11                8                5 
            <NA> 
              16 
> table(dat$index,useNA="ifany")   # Gesamt-Index

0.485416666666667             0.975  1.25104166666667           1.30625  1.31979166666667  1.33958333333333  1.82604166666667  1.86041666666667  1.93854166666667  2.00416666666667 
                1                 1                 1                 1                 1                 1                 1                 1                 1                 1 
 2.04791666666667  2.06354166666667  2.15104166666667  2.16666666666667            2.1875          2.203125  2.23541666666667  2.26041666666667  2.30104166666667          2.303125 
                1                 1                 1                 2                 1                 1                 1                 1                 1                 1 
 2.31666666666667  2.33854166666667          2.353125  2.36041666666667  2.38541666666667          2.390625  2.39479166666667          2.415625  2.43854166666667          2.453125 
                2                 1                 1                 1                 1                 1                 1                 1                 1                 1 
 2.47916666666667  2.54479166666667            2.5625           2.56875          2.584375  2.58854166666667  2.60416666666667  2.62604166666667           2.65625          2.671875 
                1                 1                 1                 1                 1                 1                 1                 1                 1                 2 
           2.6875  2.69166666666667  2.70416666666667          2.728125              2.75           2.75625  2.78541666666667  2.81354166666667          2.828125           2.84375 
                1                 1                 1                 1                 1                 1                 1                 1                 1                 1 
          2.86875  2.86979166666667             2.875  2.88541666666667            2.9125  2.91666666666667  2.94270833333333          2.953125  2.95833333333333          2.959375 
                1                 1                 1                 1                 1                 1                 1                 1                 1                 1 
 2.96354166666667           2.96875          2.984375  2.99791666666667          3.015625           3.03125  3.03541666666667          3.046875  3.05104166666667  3.05729166666667 
                1                 1                 1                 1                 1                 3                 1                 2                 1                 1 
         3.078125  3.07916666666667  3.08854166666667           3.09375  3.11666666666667             3.125          3.140625  3.16979166666667  3.17604166666667            3.1875 
                1                 1                 1                 1                 1                 2                 1                 1                 1                 1 
         3.209375            3.2125          3.228125              3.25  3.26041666666667          3.290625          3.296875           3.30625  3.32291666666667          3.328125 
                1                 1                 1                 1                 1                 1                 1                 1                 1                 1 
            3.375  3.43229166666667  3.44791666666667  3.47916666666667  3.58854166666667  3.64166666666667  3.72291666666667  3.80104166666667          3.859375  3.96354166666667 
                2                 2                 1                 1                 1                 1                 1                 1                 1                 1 
         3.984375  4.15833333333333            4.1875           4.30625              <NA> 
                1                 1                 1                 1                22 

小提琴图的代码

technologie_df <- data.frame(group=c(rep("cps: Anlagen",nrow(dat)),rep("cps: Produkte",rep("Produktionssysteme",rep("Mobile Devices",rep("Strategie und Organisation",rep("Gesamt-Index",nrow(dat))),value=c(dat$cps_an,dat$cps_prod,dat$cpps,dat$mobile,dat$strat,dat$index))
technologie_df <- na.omit(technologie_df)

technologie_plot <- ggplot(technologie_df,aes(x=group,y=value,fill=group)) +
  geom_violin() +
  labs(y="Index-Wert") +
  scale_x_discrete(limits=c("cps: Anlagen","cps: Produkte","Produktionssysteme","Mobile Devices","Strategie und Organisation","Gesamt-Index")) +
  scale_fill_manual(values=c("#003560","#8DAE10","#003560","#003560")) +
  theme(axis.title.x = element_blank(),panel.background = element_blank(),axis.line = element_line(colour="black"),legend.position = "none")
ggsave(file.path(path_out,"ViolinPlot_Technologie.png"),plot=technologie_plot,type="cairo-png")

情节本身:

Violin plots

使我烦恼的情节当然是“战略与组织”之一,因为其形状不适合数据。如果您查看表格,有34个人的评分为2.5,而38个人的评分为3.125。两者之间没有任何价值,因为只有很少的人可以解释情节中2.5和3.125之间的差距。其他大多数差距也是如此。其他地块没有这些差距。对此有解释吗?

解决方法

如果您希望小提琴图突出显示数据的离散性质,则可以将adjust中的geom_violin()设置为较小的值:

ggplot(dat) +
  geom_violin(aes(x = "Strategie und Organisation",y = strat),adjust = 0.1)

enter image description here

如果您希望绘图隐藏数据的离散特性,请将adjust设置为更大的值。

ggplot(dat) +
  geom_violin(aes(x = "Strategie und Organisation",adjust = 1.5)

enter image description here

以下是基于OP帖子的数据。

dat <- data.frame(strat = c(0,rep(0.625,3),rep(1.25,rep(5/3,2),rep(1.875,11),rep(2.5,34),rep(10/3,rep(3.75,rep(4.375,8),rep(5,5)))

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...