如何使用C中的SSE内在函数计算向量点积

我试图将两个向量相乘,一个向量的每个元素乘以另一个向量的同一索引中的元素.然后我想要求结果矢量的所有元素得到一个数字.例如,向量{1,2,3,4}和{5,6,7,8}的计算将如下所示:

1 * 5 2 * 6 3 * 7 4 * 8

本质上,我正在采取两个向量的点积.我知道有一个SSE命令来执行此操作,但该命令没有与之相关联的内在函数.在这一点上,我不想在我的C代码中编写内联汇编,所以我只想使用内在函数.这似乎是一个常见的计算方法,所以我对自己感到惊讶,我在Google上找不到答案.

注意:我正在针对支持SSE 4.2的特定微架构进行优化.

谢谢你的帮助.

解决方法

GCC(至少版本4.3)包括< smmintrin.h>具有SSE4.1级内在功能,包括单精度和双精度点产品:
_mm_dp_ps (__m128 __X,__m128 __Y,const int __M);
_mm_dp_pd (__m128d __X,__m128d __Y,const int __M);

作为旧处理器的回退,您可以使用此算法创建向量a和b的点积:

r1 = _mm_mul_ps(a,b);
r2 = _mm_hadd_ps(r1,r1);
r3 = _mm_hadd_ps(r2,r2);
_mm_store_ss(&result,r3);

相关文章

本程序的编译和运行环境如下(如果有运行方面的问题欢迎在评...
水了一学期的院选修,万万没想到期末考试还有比较硬核的编程...
补充一下,先前文章末尾给出的下载链接的完整代码含有部分C&...
思路如标题所说采用模N取余法,难点是这个除法过程如何实现。...
本篇博客有更新!!!更新后效果图如下: 文章末尾的完整代码...
刚开始学习模块化程序设计时,估计大家都被形参和实参搞迷糊...