ipad2霓虹浮点数速度相对于ipad1

问题描述

| 在ipad1和ipad2上测试NEON指令时,我注意到ipad2上的代码几乎没有加快速度,因为ipad2上的大多数功能实际上比ipad1上运行得快得多。 这是针对诸如VMUL,VLD1,VADD和VSUB等指令的,使用诸如q0之类的四字寄存器进行FFT等操作。 此外,我注意到苹果自己的FFT函数vdsp_fft_zrip也无法为ipad2加速。 所以问题是,对于四字SIMD类型的指令,ipad2 NEON的执行速度是否比ipad1 NEON引擎快?     

解决方法

        与核心的其余部分相比,A4上的NEON单元异常强大。 A5的其余核心与A4相比有很大改进,但NEON单元的性能几乎没有变化。您正在观察的是预期的。 当然,现在有两个核心,因此,如果您可以同时使用这两个核心,则仍然可以看到明显的加速。而且,A5的双精度计算已从A4进行了很大改进,因为它已经完全流水线化。     ,        即使在最近推出的64位ARM上,NEON也会保持相当长的一段时间。 NEON不能从提高时钟速度中受益匪浅。 NEON已经非常快,以至于它花费大部分函数执行时间来等待内存中的数据。     

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...