是否由于cpu顺序执行失败或由于缓存一致性问题而需要内存屏障？

问题描述

我想知道为什么需要内存障碍，并且我已经阅读了有关该主题的一些文章。
有人说这是因为cpu乱序执行，而others说是因为缓存一致性问题存储了缓冲区并使队列无效。
那么，需要内存屏障的真正原因是什么？ cpu乱序执行或缓存一致性问题？或两者？ cpu乱序执行是否与缓存一致性有关？ x86和arm有什么区别？

解决方法

当ISA的内存排序规则比您的算法所需的语义弱时，您需要设置障碍来排序此核心/线程对全局可见的一致性缓存的访问。

缓存始终是一致的，但这与一致性（多个操作之间的顺序）不同。

您可以在有序CPU上对内存进行重新排序。更详细地讲，How is load->store reordering possible with in-order commit?显示了如何在以程序顺序开始执行指令的管道上获得内存重新排序，并具有允许未命中和/或存储的高速缓存允许OoO提交的缓冲区。