何时更新驱动程序资源

问题描述

全部,

由于驱动程序不持有任何数据或处理任何数据,在什么情况下会分配给spark.driver.memory的认资源spark.driver.cores 需要更新为更高的值。

有人可以通过一些我可以阅读的链接为我指出正确的方向吗?

谢谢,
格雷吉

解决方法

TLDR 答案

spark.driver.memory :当您将数据带给驱动程序时。更具体地说,例如收集广播操作

spark.driver.cores :毕竟 - 驱动程序进程是 Scala/Java/Python 进程。如果你想做一些多线程(比如后台进程),那么你可以为内核使用更高的值。