如何使用count并获取布尔输出来查找样本中的重复项

问题描述

library(stringr)
library(dplyr)
library(broom)
# get all unique strings after underscores from your column names
suffix = str_extract(names(dfA),"_.*") %>% na.omit %>% unique
prefix = c("GT","N")
base_formula = "PV ~ SEX + GAN +"
full_formula = paste(base_formula,paste0(prefix[1],suffix),"+",paste0(prefix[2],suffix))

mods = list()
for(i in seq_along(full_formula)) {
  mods[[suffix[i]]] = lm(as.formula(full_formula[i]),data = dfA)
}

stats = lapply(mods,tidy)
stats = bind_rows(stats,.id = "suffix")

解决方法

一些想法:

  • random.choices()中指定int时,已经保证可以消除重复项。

  • 使用 return

    替换功能中的 print
  • collections.Counter()可用于有效计数所有元素,以便您知道每个元素发生了多少次。

  • 测试重复项是否存在的简单快捷方法是replace=False