如何为dplyr sample_n函数分配随机种子？

为了可重复性，我应该放置一个种子，以便其他人可以获得我的准确结果。

是否有内置方法为“ sample_n”设置种子？这是我在环境中执行的操作，并且“ sample_n”对此做出响应吗？

这些不是内置在“ sample_n”函数中。

。

dplyr::sample_n documentation告诉您：

这是sample.int（）的包装，使从表中选择随机行变得容易。当前仅适用于本地tbl。

在sample_n之后，调用sample.int，这意味着使用了标准的随机数生成器，并且可以使用set.seed来实现可重复性。

此示例有帮助吗？在其中，我使用的是set.seed和mtcars数据集。

set.seed(1)
x <- mtcars
sample_n(x,10)

sample_n(x,10) #without set.seed()

set.seed(1)
x <- mtcars
sample_n(x,10)