尝试在 Linux 集群中运行代码时未找到 Matplotlib

问题描述

我在通过 ssh 连接到 Linux 集群时正在运行 Julia 脚本。代码加载 matplotlib 如下:

import Distributed   
using Distributed  

@everywhere  pushfirst!(Base.DEPOT_PATH,"/tmp/test.cache")   
   
@everywhere import PyCall   
@everywhere import PyPlot   
@everywhere pyimport matplotlib.pyplot as mpl 

当我从终端运行时,我的代码运行良好。但是,当我通过 Torque 提交作业时,输出文件 can be found here,and appears to suggest that the code cannot find matplotlib.

我对上面的内容有点困惑。为什么我在终端运行代码可以正常运行,但是提交PBS文件就不行了?为什么找不到matplotlib?它使用在 usr/bin/ 中找到的 python,我相信这是我的默认 python。我试过运行 pip,但它说 matplotlib 已更新。在尝试导入 matplotlib 之前,我还导入了其他包(如 numpy 和 datetime),并且没有错误。当我在集群的终端中运行 Julia 并调用 PyCall,然后运行

julia> @pyimport matplotlib

加载完全正常。我做错了什么?

一个相关的问题(与我的 .pbs 文件)可以是 found here: Module FixedPointNumbers missing from the cache when running Julia on cluster

编辑:一件事是,当我在 ssh 进入集群时正常运行 Julia 时(即,仅在终端中,而不是通过提交 .pbs 文件),我收到错误

Warning: No working GUI backend found for matplotlib

这会导致我在提交作业时遇到问题吗?

解决方法

问题与我链接到 Julia 的 Python 包有关。这个版本的 Python 没有安装 matplotlib,在这个版本的 Python 上正确安装 matplotlib 的唯一方法是拥有管理员权限。我解决这个问题的方法是将 Julia 中的 Python 环境设置为 Julia 自己的 Conda 发行版:

julia> ENV["PYTHON"] = ""

然后我用 Conda 安装了 matplotlib。最后,我确保我总是在 .pbs 文件中使用相同版本的 Julia;即,

module load julia/my_version

有了这些更改,一切似乎都正常了。

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...