Tidyr:pivot_wider错误:无法将<double>转换为<list>

问题描述

我有一个数据框,其中列出了跨多个调查样地的物种观测结果(数据为here)。我正在尝试使用tidyr的pivot_wider将丰度数据分布在几列中,新列是每个观察到的物种。这是我要用来执行此操作的代码行:

>>> start = 50
>>> step = 75
>>> end = 550
>>> np.stack((np.arange(0,end - start,step),np.arange(start,end,step)),axis=1)
array([[  0,50],[ 75,125],[150,200],[225,275],[300,350],[375,425],[450,500]])

但是,这给了我两条错误消息:

data %>% pivot_wider(names_from = Species,values_from = Total.Abundance,values_fill = 0)

我不确定问题出在哪里,因为这对于其他(看起来)与此数据帧相同的其他数据帧来说效果很好。我尝试谷歌搜索第一条错误消息,但无法找到导致该错误的原因-我不知道double R试图将其转换为列表的原因,也不知道为什么它试图将其转换为列表。 Total.Abundance列应该是整数,但是我想知道它是否是双精度数据类型? 根据我的发现,当数据框中有相同的行时,会出现第二条错误消息。但是,当我将语句修改

时,错误仍然存​​在
Error: Can't convert <double> to <list>.
Values are not uniquely identified; output will contain list-cols.

我本以为会删除重复的行。 任何帮助将不胜感激!

解决方法

根据我的评论,您数据中的重复项无法被unique()dplyrdistinct()删除:

dat %>%
  distinct() %>%
  group_by(Plot.ID,Species) %>%
  count()
#   Plot.ID Species                  n
#     <dbl> <chr>                <int>
# 1       1 Calliopius               1
# 2       1 Idotea                   2
# 3       1 Lacuna vincta            2
# 4       1 Mitrella lunata          2
# 5       1 Podoceropsis nitida      1
# 6       1 Unk. Amphipod            1
# 7       1 Unk. Bivalve             1
# 8       2 Calliopius               1
# 9       2 Caprella penantis        1
#10       2 Corophium insidiosum     1

需要找出为什么会有这样的重复项并进行调和,例如将它们加起来。问题可能出在解决编码错误的数据上,在这种情况下,求和不一定适用。或者,也许说您对同一图样进行了两次采样,您想用均值而不是总和来归一化与采样工作量,或者可能需要额外的列来表示采样工作量。但是,这很完美:

dat %>%
  group_by(Plot.ID,Species) %>%
  summarise(abundance = sum(Total.Abundance)) %>%
  tidyr::pivot_wider(names_from = Species,values_from = abundance,values_fill = 0)