复制行以匹配新的数据框

问题描述

我正在使用R，但我有两个相关的小标记（数据帧），但现在它们是分开的。对于第一个小标题的每一行，它们是与该小标题相关的十（10）或更少的行。所以，我的第一个小表情是这样的...

A  0.1
B  0.2
C  0.3
D  0.4
E  0.5

第二个小标题看起来像这样...

A  1.5
A  1.6
A  1.7
A  1.8
A  1.9
B  2.5
B  2.6
B  2.7
B  2.8
B  2.9
C  3.1
C  3.3
D  4.4
D  4.6
E  6.6
E  6.7

因此，我需要复制第一个小节的值以匹配第二个小节。所以，我需要第一个小标题看起来像这样……

A  0.1
A  0.1
A  0.1
A  0.1
A  0.1
B  0.2
B  0.2
B  0.2
B  0.2
B  0.2
C  0.3
C  0.3
D  0.4
D  0.4
E  0.5
E  0.5

我遇到的问题是，第二个小标题上重复的值的次数不一致。因此，有时第一个小标题的值需要重复x5次，x2次等。

如果需要以不一致的方式复制第一个小标题的值，我该如何复制它们。一些5，一些2，一些3等，等等。

*第一个小标题有600个值。

解决方法

仅选择tibble2的第一列，然后与tibble1左连接。

library(tidyverse)

tibble2 %>%
    select(col1) %>%
    left_join(tibble1,by = 'col1')

您可以在count中使用df2个值，与df1联接并使用uncount来重复行。

library(dplyr)

df2 %>%
  count(V1) %>%
  left_join(df1,by = 'V1') %>%
  tidyr::uncount(n)

数据

df1 <- structure(list(V1 = c("A","B","C","D","E"),V2 = c(0.1,0.2,0.3,0.4,0.5)),class = "data.frame",row.names = c(NA,-5L))

df2 <- structure(list(V1 = c("A","A","E",V2 = c(1.5,1.6,1.7,1.8,1.9,2.5,2.6,2.7,2.8,2.9,3.1,3.3,4.4,4.6,6.6,6.7
)),-16L))

这里有一种dplyr和一种base的方式。不确定如何处理不匹配项。

library(dplyr)

df1 = tibble(ID = LETTERS[1:5],val = seq(0.1,0.5,by = 0.1))

s = sample(5)
df2 = tibble(ID = rep(LETTERS[1:5],s),val2 = rep(s,s) + 0.1 * sequence(s))

inner_join(df1,df2)%>%
  select(-val2)

## base
tbl = table(df2$ID)
df1[rep(match(df1$ID,names(tbl)),tbl),]

duplicates r r rep

复制行以匹配新的数据框

问题描述

解决方法

相关问答