Neon 代码比普通 C 慢一点但是,我期望使用 neon 快 3 到 4 倍任何建议如何提高性能?

问题描述

C 代码:

a

霓虹灯代码:

for(unsigned int j=0; j<num_boxes; j++)
{
    loc_del[0] = prior_boxes[0] + loc_del[0]*variances[0] * prior_boxes[2];
    loc_del[1] = prior_boxes[1] + loc_del[1] * variances[0] * prior_boxes[3];
    loc_del[2] = prior_boxes[2] * std::exp(loc_del[2] * variances[1]);
    loc_del[3] = prior_boxes[3] * std::exp(loc_del[3] * variances[1]);

    loc_del[0] = (loc_del[0] - loc_del[2] * 0.5) * width;
    loc_del[1] = (loc_del[1] - loc_del[3] * 0.5) * height;
    loc_del[2] = (loc_del[2] * width )+ loc_del[0];
    loc_del[3] = (loc_del[3]  * height)+ loc_del[1];

    prior_boxes += 4;
    loc_del += 4;
}

我想使用 NEON 来并行化浮点乘法:同时进行四个浮点乘法而不是一个。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...