比较运算符如何在编程中利用CPU周期

问题描述

如果我具有以下条件,那么哪个比较条件会快速执行(就CPU周期和时间而言):

if(1 < 2)

if(1 < 100)

解决方法

您的示例中没有动态值,只有常量,因此编译器(AOT或JIT one)可以同时优化两个条件,并且编译后的代码将不包含if。因此,这些条件之间没有区别。

即使存在动态值,两个条件也将具有相同的速度。因为与一个值进行比较是快速的操作,所以与2或1000进行比较将具有相同的时间。

例如适用于x86 64位。 if (value < 2)会翻译为:

cmp rax,2
jl condition_succeded_label

从TorbjörnGranlund的Instruction latencies and throughput for AMD and Intel x86 processors起,Intel / AMD CPU对CMP指令(以下L64)有1个周期的延迟,现代Intel / AMD CPU的每个内核最多可以完成4个{{1 }}并行执行指令(下面是T64,吞吐量)。不管常量操作数是2还是1000。 CMP thouthput

分支错误预测可能有所不同,当CPU预测错误分支时,它可能会花费10-20个周期(reference from Wikipedia)或更多的CPU(取决于CPU模型,高速缓存中的数据,内存速度)。比较本身需要0.25-1个周期,如上表所示。

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...