带有 MPMD多程序和多数据模拟的 Nsys Profile

问题描述

我正在尝试使用 nsys 分析 MPI+OPENACC 程序。 我正在使用来自 Nvidia HPC SDK(20.7) 的 OpenMPI(3.1.6),并启用了 UCX。 可执行文件共有三个,exec1、exec2、exec3。我想为 exec3 配置文件。但我失败了。 以下是运行脚本:-

#SBATCH --nodes=1
#SBATCH --ntasks=40
#SBATCH --ntasks-per-node=40
#SBATCH --output=app.out
#SBATCH --error=app.err
#SBATCH -p Intel_6248_2s_20c_2t_GPU_hdr100_192GB_2933
#SBATCH --exclusive
#SBATCH --gres=gpu:4

WRAPPER=/run/acc_round_robin.sh

exec1=$workdir/exec/prog1
exec2=$workdir/exec/prog2
exec3=$workdir/exec/prog3

echo "0 $WRAPPER $exec1> $workdir/file.conf
echo "2-9,11-19,21-29,32-39 $WRAPPER $exec2">> $workdir/file.conf
echo "nsys profile 1,10,20,30,31 $WRAPPER $exec3">> $workdir/file.conf

echo "#!/bin/bash" > $workdir/file1_cmd
echo "srun --multi-prog $workdir/file.conf" >> $workdir/file1_cmd

echo "exit 1" >> $workdir/file1_cmd
chmod +x $workdir/file1_cmd

/usr/bin/time ./CASTING cast ./configure
date
TEND=echo "print time();" | perl

echo "++++ Total elapsed time expr $TEND - $TBEGIN seconds"

运行:- sbatch run.sh

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)