@cupy.fuse 比未融合内核慢

问题描述

我读了装饰 @cupy.fuse 应该加快代码。没有太多的文档(Link1Link2),所以我可能会以不正确的方式使用它。

为什么@cupy.fuse 代码比相同的解包代码运行得慢?

@cupy.fuse(kernel_name='preprocess_cupy')
def operations(numpy_frame,scaling_factor,dtype):
    img = cp.array(numpy_frame,dtype=cupy.uint8)
    img = ndimage.zoom(img,scaling_factor)
    img = (cp.array(2,dtype=dtype) / cp.array(255,dtype=dtype)) * img - cp.array(1,dtype=dtype)
    img = img.transpose((2,1))
    img = img.ravel()
    return img

img = np.random.randint(0,255,(1280,800,3))
img = cp.array(img)
operations(img)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)