使用 memory_order_seq_cst 输出 10

问题描述

当我运行这个程序时,我得到的输出为 10,这对我来说似乎是不可能的。我在 x86_64 核心 i3 ubuntu 上运行它。

如果输出是 10,那么 1 一定来自 c 或 d。

同样在线程 t[0] 中,我们将 c 赋值为 1。现在 a 是 1,因为它发生在 c=1 之前。 c 等于被线程 1 设置为 1 的 b。所以当我们存储 d 时,它应该是 1,因为 a=1。


  • 可以使用 memory_order_seq_cst 输出 10 吗?我尝试在第一行(变量 =1 )和第二行(printf)之间的两个线程上插入 atomic_thread_fence(seq_cst) 但它仍然没有工作。

取消注释 围栏 不起作用。 尝试使用 g++clang++ 运行。两者都给出相同的结果。

#include<thread>
#include<unistd.h>
#include<cstdio>
#include<atomic>
using namespace std;

atomic<int> a,b,c,d;

void foo(){
        a.store(1,memory_order_seq_cst);
//        atomic_thread_fence(memory_order_seq_cst);
        c.store(b,memory_order_seq_cst);
}

void bar(){
        b.store(1,memory_order_seq_cst);
  //      atomic_thread_fence(memory_order_seq_cst);
        d.store(a,memory_order_seq_cst);
}

int main(){
        thread t[2];
        t[0]=thread(foo); t[1]=thread(bar);
        t[0].join();t[1].join();
        printf("%d%d\n",c.load(memory_order_seq_cst),d.load(memory_order_seq_cst));
}
bash$ while [ true ]; do ./a.out | grep "10" ; done 
10
10
10
10

解决方法

10 (c=1,d=0) 很容易解释:bar 恰好先运行,并在 foo 读取 b 之前完成。

在不同内核上启动线程的内核间通信的怪癖意味着即使 thread(foo) 首先在主线程中运行,也很容易发生这种情况。例如也许一个中断到达了操作系统为 foo 选择的核心,延迟了它实际进入该代码1

请记住,seq_cst 仅保证所有 seq_cst 操作存在某个总顺序,该顺序与每个线程内的先序顺序兼容。 (以及由其他因素建立的任何其他发生在之前的关系)。因此,以下原子操作顺序是可能的,甚至无需将 bar 中的 a.load2 与结果 int 临时的 d.store 分开。

        b.store(1,memory_order_seq_cst);   // bar1.  b=1
        d.store(a,memory_order_seq_cst);   // bar2.  a.load reads 0,d=0

        a.store(1,memory_order_seq_cst);   // foo1
        c.store(b,memory_order_seq_cst);   // foo2.  b.load reads 1,c=1
// final: c=1,d=0

atomic_thread_fence(seq_cst) 对任何地方都没有影响,因为您的所有操作都已经是 seq_cst 栅栏基本上只是停止对该线程操作的重新排序;它不会等待或与其他线程中的栅栏同步。

(只有看到另一个线程存储的值的加载才能创建同步。但是这样的加载不会等待另一个存储;它无法知道还有另一个存储。如果你想继续加载直到你看到你期望的值,你必须写一个自旋等待循环。)


脚注 1: 由于您所有的原子变量可能都在同一个缓存行中,即使执行确实在两个不同的内核上同时到达了 foobar 的顶部,错误共享也可能会让两者来自一个线程的操作发生,而另一个核心仍在等待获得独占所有权。尽管 seq_cst 存储足够慢(至少在 x86 上),硬件公平性的东西可能会在提交 1 的第一个存储后放弃独占所有权。无论如何,一个线程中的两个操作在另一个线程之前发生并获得 10 或 01 的很多方法。如果我们获得 11,甚至可能获得 b=1 则 {{ 1}} 在任一加载之前。使用 seq_cst 确实会阻止硬件提前加载(在 store 全局可见之前),因此很有可能。

脚注 2:裸 a=1 的左值到右值评估使用重载的 a 转换,它等效于 (int)。来自 a.load(seq_cst) 的操作可能发生在该加载和从中获取临时值的 foo 之间。 d.store 不是原子副本;它相当于 d.store(a) int tmp = a;。这不需要解释您的观察结果。

,

printf 语句是不同步的,所以 10 的输出可能只是一个重新排序的 01。
01 发生在 printf 之前的函数串行运行时。