将.RData文件序列化到数据库

我正在开展一个项目,我有很多分析师在R中创建统计模型.他们通常为我提供模型对象(.Rdata文件),并为各种数据集自动执行它们.

我的问题是:

>我可以使用数据库并将这些.RData文件保存在那里吗?这样做的任何提示? (我目前将.Rdata文件存储到磁盘并使用数据库存储位置信息)
>我从其他分析师那里获得了很多R脚本,他们在创建模型之前已经对数据进行了一些预处理.有没有人有使用PMML的经验,无需人工干预即可重复此过程? PMML存储预处理步骤,将建模步骤作为标记标记存储,并在新数据集上重复相同步骤.

感谢您的建议和反馈.

-苛刻

解决方法

是的,这可以使用例如链接到R的 MySQL与R MySQL和DBI包,或通过RODBC或RJDBC包.我不是100%确定它们是否都支持blob,但最糟糕的情况是你可以使用ascii表示并将它们放在文本字段中.

诀窍是使用函数serialize()

> x <- rnorm(100)
> y <- 5*x+4+rnorm(100,0.3)
> tt <- lm(y~x)
> obj <- serialize(tt,NULL,ascii=T)

现在,您可以在数据库中存储或检索obj.它实际上只不过是ascii(或二进制)代码的向量. ascii = F为您提供二进制表示.检索后,您使用:

> unserialize(obj)
Call:
lm(formula = y ~ x)

Coefficients:
(Intercept)            x  
      4.033        4.992

编辑:关于pmml,CRAN上有一个pmml包.也许那个人会把你送到某个地方?

相关文章

SELECT a.*,b.dp_name,c.pa_name,fm_name=(CASE WHEN a.fm_n...
if not exists(select name from syscolumns where name=&am...
select a.*,pano=a.pa_no,b.pa_name,f.dp_name,e.fw_state_n...
要在 SQL Server 2019 中设置定时自动重启,可以使用 Window...
您收到的错误消息表明数据库 &#39;EastRiver&#39; 的...
首先我需要查询出需要使用SQL Server Profiler跟踪的数据库标...