如何在由 slurm 管理的自动缩放集群上设置 Rstudio、sparklyR?

问题描述

我有一个由 slurm 管理的 aws HPC 自动缩放集群,我可以使用 sbatch 提交作业,但是我想在这个集群上使用 spraklyr,以便 slurm 根据 R 脚本中 sparklyr 代码的工作负载增加集群大小.这可能吗?

解决方法

嗨,阿米尔,你在这里使用 slurm 有什么原因吗? Sparklyr 与 Apache Spark 有更好的集成,建议在 Spark 集群上运行它。您可以按照此博客了解使用 Amazon EMR 进行设置的步骤,Amazon EMR 是一种在 AWS 上运行 Spark 集群的服务 - https://aws.amazon.com/blogs/big-data/running-sparklyr-rstudios-r-interface-to-spark-on-amazon-emr/

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...