ARM Neon - 将点积累积到输出索引

问题描述

我想用下面的代码片段实现向量点积,其中向量 ab 的点积可以添加到 c 的第一个位置,所以结果将[30,0]

#include <arm_neon.h>
#include "utils.h"

int main() {
    float a[4]{1,2,3,4};
    float b[4]{1,4};
    float c[4];

    float32x4_t A = vld1q_f32(a);
    float32x4_t B = vld1q_f32(b);
    float32x4_t C = vmovq_n_f32(0);

    // Computation

    vst1q_f32(c,C);
    print_vector(c,4);
}

有没有用 Neon 来做到这一点的惯用方法?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)