复制行以匹配新的数据框

问题描述

我正在使用R,但我有两个相关的小标记(数据帧),但现在它们是分开的。对于第一个标题的每一行,它们是与该小标题相关的十(10)或更少的行。所以,我的第一个小表情是这样的...

A  0.1
B  0.2
C  0.3
D  0.4
E  0.5

第二个小标题看起来像这样...

A  1.5
A  1.6
A  1.7
A  1.8
A  1.9
B  2.5
B  2.6
B  2.7
B  2.8
B  2.9
C  3.1
C  3.3
D  4.4
D  4.6
E  6.6
E  6.7

因此,我需要复制第一个小节的值以匹配第二个小节。所以,我需要第一个标题看起来像这样……

A  0.1
A  0.1
A  0.1
A  0.1
A  0.1
B  0.2
B  0.2
B  0.2
B  0.2
B  0.2
C  0.3
C  0.3
D  0.4
D  0.4
E  0.5
E  0.5

我遇到的问题是,第二个小标题上重复的值的次数不一致。因此,有时第一个标题的值需要重复x5次,x2次等。

如果需要以不一致的方式复制第一个标题的值,我该如何复制它们。一些5,一些2,一些3等,等等。

*第一个标题有600个值。

解决方法

仅选择tibble2的第一列,然后与tibble1左连接。

library(tidyverse)

tibble2 %>%
    select(col1) %>%
    left_join(tibble1,by = 'col1')

,

您可以在count中使用df2个值,与df1联接并使用uncount来重复行。

library(dplyr)

df2 %>%
  count(V1) %>%
  left_join(df1,by = 'V1') %>%
  tidyr::uncount(n)

数据

df1 <- structure(list(V1 = c("A","B","C","D","E"),V2 = c(0.1,0.2,0.3,0.4,0.5)),class = "data.frame",row.names = c(NA,-5L))

df2 <- structure(list(V1 = c("A","A","E",V2 = c(1.5,1.6,1.7,1.8,1.9,2.5,2.6,2.7,2.8,2.9,3.1,3.3,4.4,4.6,6.6,6.7
)),-16L))
,

这里有一种dplyr和一种base的方式。不确定如何处理不匹配项。

library(dplyr)

df1 = tibble(ID = LETTERS[1:5],val = seq(0.1,0.5,by = 0.1))

s = sample(5)
df2 = tibble(ID = rep(LETTERS[1:5],s),val2 = rep(s,s) + 0.1 * sequence(s))

inner_join(df1,df2)%>%
  select(-val2)

## base
tbl = table(df2$ID)
df1[rep(match(df1$ID,names(tbl)),tbl),]

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...