如何使用count并获取布尔输出来查找样本中的重复项

问题描述

library(stringr)
library(dplyr)
library(broom)
# get all unique strings after underscores from your column names
suffix = str_extract(names(dfA),"_.*") %>% na.omit %>% unique
prefix = c("GT","N")
base_formula = "PV ~ SEX + GAN +"
full_formula = paste(base_formula,paste0(prefix[1],suffix),"+",paste0(prefix[2],suffix))

mods = list()
for(i in seq_along(full_formula)) {
  mods[[suffix[i]]] = lm(as.formula(full_formula[i]),data = dfA)
}

stats = lapply(mods,tidy)
stats = bind_rows(stats,.id = "suffix")

解决方法

一些想法：

在 random.choices（）中指定int时，已经保证可以消除重复项。
使用 return
替换功能中的 print
collections.Counter()可用于有效计数所有元素，以便您知道每个元素发生了多少次。
测试重复项是否存在的简单快捷方法是replace=False。

python