如何使用 ARM NEON 内在函数将 u8 掩码转换为 u32 掩码?

问题描述

有一个 uint8x8_t 掩码,从 vcgt_u8() 之类的内在函数获得,其值如下:

0,255,255 

我想将此掩码转换为两个 uint32x4_t 类型的掩码。 vmovl_u8()vmovl_u16() 似乎仍会保留 255 而不是 65535 和 4294967295。我该如何进行这种转换?

解决方法

vmovl_s 这样的有符号加宽操作会将像 255 这样的全 1 模式转换为 65535 等等,因此您需要 vreinterpret 将您的无符号向量转换为有符号,然后返回:

    uint8x8_t v = ...;
    int16x8_t i = vmovl_s8(vreinterpret_s8_u8(v));
    uint32x4_t low = vreinterpretq_u32_s32(vmovl_s16(vget_low_s16(i)));
    uint32x4_t high = vreinterpretq_u32_s32(vmovl_s16(vget_high_s16(i)));
,

添加几个 vmvnq_u32(vceqzq_u32(v)) 调用即可。

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...