Cuda 后端的 ArrayFire 卷积问题

问题描述

我在调用某个函数时遇到了问题

dphaseWeighted = af::convolve(dphaseWeighted,m_slowTimeFilter);

似乎只生产nan的。

背景是我们最近从使用 AF OpenCL 切换到 AF Cuda,我们看到的问题发生在函数中。

dphaseWeighted = af::convolve(dphaseWeighted,m_slowTimeFilter);

这在使用 OpenCL 时似乎运行良好。

不幸的是,由于 IP 问题,我无法为您提供全部功能。只有几个片段。

这个卷积深藏在一个阶段提取代码段中。并且实际上是使用 af::convolve 函数代码的第二部分。 第一个函数似乎按预期运行,输出了合理的浮点数据。 但是当涉及到第二个函数时,我看到的是 nan 出现了(我认为 af_print amd 将数据转储到文件中。

在我包含的 CMakeList 中

include_directories(${ArrayFire_INCLUDE_Dirs})

target_link_libraries(DASPhaseInternalLib ${ArrayFire_CUDA_LIBRARIES})

它按预期构建。

有没有人有过这样的想法?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)