射线工人坠毁

问题描述

我是雷的新手。我在同一Linux机器上的6个辅助节点的小型头节点上。当我向它提交非常小的程序时,它就起作用了。但是,一旦我提交了一些大程序,所有的ray工作者就会崩溃。

我在https://docs.ray.io/en/ray-0.4.0/internals-overview.html上阅读了
“一旦将任务调度到本地调度程序(无论是通过自身调度程序还是通过全局调度程序调度),本地调度程序都会将任务排队等待执行。当有足够的资源可用并且对象依赖项在本地可用时,会将任务分配给工作程序,按照先进先出的顺序。 “

  1. 那我在哪里可以看到ray作业队列?
  2. 它的大小和内存是多少?
  3. 我怎么能看到它真正起作用?对我来说,似乎没有排队吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)