问题描述
出于某种原因,有时在我的程序中我看到
cmpeqpd xmm3,xmm0
哪里xmm0 == {0x2cd000000000,0x2cd000000000}
和xmm3 == {0x0,0x2011d0800000000}
碰巧在 xmm3 中返回 {0xffffffffffffffff,0x0}
,这是错误的,因为 (double)0x0
不等于 (double)0x2cd000000000
。
我注意到它只是偶尔发生。我已经用 rr 记录了程序的执行,以便一致地重现它。有趣的是,在一个超级简化的简单程序中,我无法再重现这个问题。我想知道,是否有任何隐藏的微架构状态可以改变 cmpeqpd (cmppd) 行为?
请注意,我检查了相应 ymm 寄存器中的高 128 位是否为零。
解决方法
0x2CD000000000(或 0x00002CD000000000 使指数在做什么更明显)是非正规的。确实有一个设置会使非正规比较等于零:DAZ flag
DAZ 标志可能已在某个时候设置,这将解释为什么简化的程序不再显示此行为。