cupy 中点积的意外结果

问题描述

以下代码产生了意外大的结果:

import cupy as cp,numpy as np

N=500
aa1=cp.random.randn(N,N)
aa2= cp.random.randn(N,N)
aa3=cp.random.randn(N,N)
cc=aa1.dot(aa2).dot(aa3)

cp.dot(aa1,aa2,out=aa2)
cp.dot(aa2,aa3,out=aa2)
print(cp.max(cp.abs(cc-aa2)))

%output: 40070455.39606033

此外,当我多次运行它时,它会打印出不同的(但总是很大的)数字。我想问题出在 cp.dot 部分,因此 aa2 矩阵不等于三个原始矩阵的乘积。

有趣的是,当我将问题大小从 N=500 减少到 N=100 时,它总是按照我的预期打印 0。据我了解,并发执行和竞争条件没有问题,因为每个操作都是由 NULL 流按顺序执行的(认流在开始下一个矩阵乘法之前等待所有指令完成)。

Ubuntu 18、GPU Titan RTX、cuda 工具包 11.0、cupy 9.2.0

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)