如何使用cuda推力沿一维对多维数组排序?

问题描述

我的阵列是gpu全局内存中的2D阵列。我需要沿一个维度对其进行排序。例如,数组是这样的:

A = [[ 3.4257,-1.2345,0.6232,-0.1354],[-1.6639,0.1557,-0.1763,1.0257],[0.6863,0.0992,1.4487,0.0157]].

我需要分别对每一行进行排序,并获取其索引,以便可以在以下步骤中恢复顺序。排序结果如下:

sorted_A = [[-1.2345,-0.1354,3.4257],[ 0.0157,0.6863,1.4487]]
index = [[1,3,2,0],[0,1,3],[3,2]]

我该如何实现呢?或者我如何才能在单个内核中以更高的效率来实现它,更好地在可能的情况下消除函数调用的开销?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...