在 aarch64/arm64 上使用环绕将 float 转换为 int

问题描述

我试图在 x86_64 和 aarch64/arm64 上运行的应用程序之间完全匹配行为。但是，当浮点数超出可能的整数范围时，它们的不同之处在于它们如何将浮点数转换为整数。

考虑以下示例：

#include <stdio.h>
#include <cstdint>

void cast(float value) {
  printf("uint32_t(%.2f) = %u\n",value,uint32_t(value));
}

int main() {
  cast(4294967808.);
}

# output on x86_64:  uint32_t(4294967808.00) = 512
# output on aarch64: uint32_t(4294967808.00) = 4294967295

x86_64 版本使用 cvttss2si 进行转换，它概括了答案，尽管文档对此非常不清楚。 Aarch64 正在使用饱和的 fcvtzu。

任何将两者对齐的解决方案都会很有趣，但理想情况下，我想在 clang 上设置一个编译器标志，以使 aarch64 版本的行为类似于 x86_64 版本（即使 aarch64“更好”）

解决方法

使用 CPU 指令 fjcvtzs（或内在的 __builtin_arm_jcvt）获取 x86 在 aarch64 上的行为。

（感谢@EOF 在评论中提供足够的信息让我找到答案）

arm64 arm64 c++clang clang