问题描述
我有一个旋转矩阵,我想将其应用于cuBLAS向量数组。 如何有效地迭代向量数组并运行cuBLAS矩阵-向量乘法功能?
从cuBLAS的示例和文档中,我了解在给定以指针形式创建的矩阵以及单个输入和输出向量的情况下如何进行矩阵向量乘法:
float* myMatrix;
cudamallocManaged(&myMatrix,N*N*sizeof(float));
float* inputVector;
float* outputVector;
cudamallocManaged(&inputVector,N*sizeof(float));
cudamallocManaged(&outputVector,N*sizeof(float));
但是在inputVector
是2D数组的情况下,它无处解释(特别是如何将结果写入2D outputVector
)。
如果有人可以展示我如何在内核中执行此操作,那也很好,因为该过程是可并行化的。我不太了解如何在内核中使用cuBLAS,并且一直在使用cpu for循环(inputVector
变大时,速度会很慢)。
请让我知道我该怎么做! 预先谢谢你!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)