问题描述
对于包含单个静态数据文件的存储库中的闪亮应用程序,该平面文件的最佳格式(以及读取该文件的相应功能)的最佳格式是什么,它可以最大程度地减少该平面文件对data.frame的读取时间?
例如,假设一个闪亮的应用程序启动时会读取.RDS
,但是假设这需要30秒钟左右,我们希望减少它。有什么方法可以保存文件并使用可以节省时间的功能?
这是我已经知道的:
- 我一直在阅读一些速度比较文章,但是似乎没有一个文章能在闪亮的应用程序环境(以及可能的内核/线程含义)中对所有方法进行全面的基准测试。有些提供类似trying to load in less data 的声音建议
- 我注意到类似julia的语言有时会更快,但是我不确定使用其他语言读取文件是否会有所帮助,因为必须将其转换为R可以识别的对象,并且大概该过程将比简单地花费更长的时间。最初作为R对象阅读
- 我发现保存为
.RDS
的相同文件似乎比.csv
小,但是,我不确定文件大小是否一定会对读取时间产生影响。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)