是否有类似于 _mm256_mulhi_epu16 的 AVX、AVX2 或 AVX512 函数,但适用于 8 位?

问题描述

https://software.intel.com/sites/landingpage/IntrinsicsGuide/#expand=3967,3970&text=_mm256_mulhi_epu16

本质上,我需要的是“_mm256_mulhi_epu8”(看起来并不存在),这会

“将 a 和 b 中的压缩无符号 8 位整数相乘,产生中间 16 位整数,并将中间整数的高 8 位存储在 dst 中。”

有没有办法用 x86 上的任何 256 位或 512 位指令集做到这一点?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)