如何为dplyr sample_n函数分配随机种子?

问题描述

这是R中dplyr的“ sample_n”。
https://dplyr.tidyverse.org/reference/sample.html

为了可重复性,我应该放置一个种子,以便其他人可以获得我的准确结果。

是否有内置方法为“ sample_n”设置种子? 这是我在环境中执行的操作,并且“ sample_n”对此做出响应吗?

这些不是内置在“ sample_n”函数中。

  • 有环境“ set.seed”功能[1]
  • 有一个库'withr',它为代码[2]创建了一个包含种子的包装器

解决方法

dplyr::sample_n documentation告诉您:

这是sample.int()的包装,使从表中选择随机行变得容易。当前仅适用于本地tbl。

sample_n之后,调用sample.int,这意味着使用了标准的随机数生成器,并且可以使用set.seed来实现可重复性。

,

此示例有帮助吗?在其中,我使用的是set.seedmtcars数据集。

set.seed(1)
x <- mtcars
sample_n(x,10)

sample_n(x,10) #without set.seed()

set.seed(1)
x <- mtcars
sample_n(x,10)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...