在 aarch64/arm64 上使用环绕将 float 转换为 int

问题描述

我试图在 x86_64 和 aarch64/arm64 上运行的应用程序之间完全匹配行为。但是,当浮点数超出可能的整数范围时,它们的不同之处在于它们如何将浮点数转换为整数。

考虑以下示例:

#include <stdio.h>
#include <cstdint>

void cast(float value) {
  printf("uint32_t(%.2f) = %u\n",value,uint32_t(value));
}

int main() {
  cast(4294967808.);
}

# output on x86_64:  uint32_t(4294967808.00) = 512
# output on aarch64: uint32_t(4294967808.00) = 4294967295

x86_64 版本使用 cvttss2si 进行转换,它概括了答案,尽管文档对此非常不清楚。 Aarch64 正在使用饱和的 fcvtzu

任何将两者对齐的解决方案都会很有趣,但理想情况下,我想在 clang 上设置一个编译器标志,以使 aarch64 版本的行为类似于 x86_64 版本(即使 aarch64“更好”)

解决方法

使用 CPU 指令 fjcvtzs(或内在的 __builtin_arm_jcvt)获取 x86 在 aarch64 上的行为。

(感谢@EOF 在评论中提供足够的信息让我找到答案)