将循环变量作为 goroutine 启动方法调用的意外行为附录

问题描述

我阅读了这篇 article 并决定自己重复这种行为并进行实验：

package main

import (
    "fmt"
    "time"
)

type User struct {
    i    int
    token string
}

func NewUser(i int,token string) User {
    user := User{token: fmt.Sprint(i),i: i}
    return user
}

func (u *User) PrintAddr() {
    fmt.Printf("%d (PrintAddr): %p\n",u.i,u)
}

func main() {
    users := make([]User,4)
    for i := 0; i < 4; i++ {
        user := NewUser(i,"")
        users[i] = user
    }
    
    for i,user := range users {
        go user.PrintAddr()
        go users[i].PrintAddr()
    }
    time.Sleep(time.Second)
}

(Playground)

代码输出如下：

1 (PrintAddr): 0xc000056198
2 (PrintAddr): 0xc0000561b0
0 (PrintAddr): 0xc000056180
3 (PrintAddr): 0xc00000c030
3 (PrintAddr): 0xc00000c030
3 (PrintAddr): 0xc00000c030
3 (PrintAddr): 0xc00000c030
3 (PrintAddr): 0xc0000561c8

我也不明白，为什么 5 个 3 (PrintAddr) 中有 4 个是 0xc00000c030，而最后一个不一样？

但是，如果我使用 pointer 数组而不是 value 数组，就像这样，

func NewUser(i int,token string) *User {
    user := &User{token: fmt.Sprint(i),i: i}
    return user
}
// -snip-
func main() {
    users := make([]*User,4)
    // -snip-

(Playground)

那么这里一切正常，每个条目都使用相同的地址精确打印 2 次：

1 (PrintAddr): 0xc0000ae030
3 (PrintAddr): 0xc0000ae060
2 (PrintAddr): 0xc0000ae048
2 (PrintAddr): 0xc0000ae048
3 (PrintAddr): 0xc0000ae060
1 (PrintAddr): 0xc0000ae030
0 (PrintAddr): 0xc0000ae018
0 (PrintAddr): 0xc0000ae018

但是为什么文章中的情况不适用于这里，而我却没有得到很多 3 (PrintAddr)？

解决方法

问题

您的第一个版本有一个同步错误，表现为数据竞争：

$ go run -race main.go
0 (PrintAddr): 0xc0000b4018
0 (PrintAddr): 0xc0000c2120
==================
WARNING: DATA RACE
Write at 0x00c0000b4018 by main goroutine:
  main.main()
      redacted/main.go:29 +0x1e5

Previous read at 0x00c0000b4018 by goroutine 7:
  main.(*User).PrintAddr()
      redacted/main.go:19 +0x44

Goroutine 7 (finished) created at:
  main.main()
      redacted/main.go:30 +0x244
==================
1 (PrintAddr): 0xc0000b4018
1 (PrintAddr): 0xc0000c2138
2 (PrintAddr): 0xc0000b4018
2 (PrintAddr): 0xc0000c2150
3 (PrintAddr): 0xc0000b4018
3 (PrintAddr): 0xc0000c2168
Found 1 data race(s)

for 循环（第 29 行）不断更新循环变量 user while（即以没有适当同步的并发方式）PrintAddr 方法访问它通过它的指针接收器（第 19 行）。请注意，如果您没有在第 30 行将 user.PrintAddr() 作为 goroutine 启动，问题就会消失。

问题及其解决方案实际上在the Wiki you link to的底部给出。

但是为什么文章中的情况不适用于这里，而我却没有得到很多 3 (PrintAddr)？

那个同步错误是不受欢迎的不确定性的来源。特别是，您无法预测将打印多少次（如果有）3 (PrintAddr)，并且该数字可能因一次执行而异。事实上，向上滚动并亲眼看看：在我打开竞争检测器的执行过程中，尽管存在错误，但输出恰好具有 0 到 3 之间的每个整数中的两个；但不能保证。

解决方案

只需在循环顶部添加阴影循环变量 user，问题就会消失：

for i,user := range users {
    user := user // <---
    go user.PrintAddr()
    go users[i].PrintAddr()
}

PrintAddr 现在将对最里面的 user 变量进行操作，该变量不会被第 29 行的 for 循环更新。

(Playground)

附录

您还应该使用等待组来等待所有 goroutine 完成。 time.Sleep 无法协调 goroutine。

覆盖值 slice 的第一个代码版本是 taking the address of the iterator variable.。为什么？

方法PrintAddr定义在指针接收器上：

func (u *User) PrintAddr() {
    fmt.Printf("%d (PrintAddr): %p\n",u.i,u)
}

在 for 循环中，user 迭代变量在每个循环中被重用，并分配给切片中的下一个值。因此它是相同的变量。但是你通过调用一个在指针接收器上定义的方法来获取它的地址：

    users := make([]User,4)
    // ...
    for i,user := range users {
        go user.PrintAddr()
        go users[i].PrintAddr()
    }

Calling 值的方法等于 (&user).PrintAddr()：

如果 x 是可寻址的并且 &x 的方法集包含 m，则 x.m() 是 (&x).m() 的简写

索引切片会按预期工作，因为您访问的是切片中实际的第 i 值，而不是使用迭代器变量。

更改切片以保存指针值也可以解决此问题，因为迭代器 var 现在是指向 User 值的指针的副本。

data-race go goroutine loops pointers

将循环变量作为 goroutine 启动方法调用的意外行为 附录

问题描述

解决方法

问题

解决方案

附录

将循环变量作为 goroutine 启动方法调用的意外行为附录