PyOpenCL ReductionKernel仅适用于工作组

问题描述

请帮助我了解如何在PyOpenCL中正确处理ReductionKernel。我有一个二维数据数组。第一维是点数。第二维是与每个点关联的属性。 由于属性的数量很大,因此假定为128。我认为它是array [number_of_working_groups,local_size]。也就是说,我在一个单独的工作组中处理每个点。在操作结束时,我需要获取每个点的点积。.但是,我还没有找到为每个工作组分别使用ReductionKernel的方法。看起来它仅适用于在输入端接收到的整个数组。 循环调用每个点似乎是非常浪费的操作。有没有办法在数组的块上使用ReductionKernel?要计算N * X数组中每N个元素的点积?还是使其像指定了本地大小的标准enqueueNDRangeKernel一样工作?谢谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...