问题描述
这是R中dplyr的“ sample_n”。
https://dplyr.tidyverse.org/reference/sample.html
为了可重复性,我应该放置一个种子,以便其他人可以获得我的准确结果。
是否有内置方法为“ sample_n”设置种子? 这是我在环境中执行的操作,并且“ sample_n”对此做出响应吗?
这些不是内置在“ sample_n”函数中。
。
解决方法
dplyr::sample_n
documentation告诉您:
这是sample.int()的包装,使从表中选择随机行变得容易。当前仅适用于本地tbl。
在sample_n
之后,调用sample.int
,这意味着使用了标准的随机数生成器,并且可以使用set.seed
来实现可重复性。
此示例有帮助吗?在其中,我使用的是set.seed
和mtcars
数据集。
set.seed(1)
x <- mtcars
sample_n(x,10)
sample_n(x,10) #without set.seed()
set.seed(1)
x <- mtcars
sample_n(x,10)