问题描述
我们一直在 k8s 运行 TiDB 集群。从那以后它的工作正常。但突然间,在扩展 tidb-tidb statsfulset 后,我仅在新的 statsfull pod tidb-tidb-1
中遇到以下问题。有趣的是 tidb-tidb-2 正在运行。所有其他 pd 和 tikv pod 也运行良好。我检查了 pd url,该 url 无法从有问题的 pod 访问,但对其他 pod 很好。请您帮我解决这个问题。
tidb-tidb-1 logs:
[2021/04/11 16:15:44.526 +00:00] [WARN] [base_client.go:180] ["[pd] Failed to get cluster id"]
[2021/04/11 16:15:48.527 +00:00] [WARN] [base_client.go:180] ["[pd] Failed to get cluster id"] [error="[PD:client:ErrClientGetMember]error:rpc error: code = DeadlineExceeded desc = latest connection error: connection error: desc = \"transport: Error while dialing dial tcp: I/O timeout\" target:test-tidb-pd:2379 status:CONNECTING
解决方法
- 能否请您显示命名空间信息? kubectl get all -n -o wide
- 请检查节点信息。 https://kubernetes.io/docs/concepts/scheduling-eviction/assign-pod-node/#node-isolation-restriction
- 请检查网络。如果两个节点能ping通吗? 传输:拨号时出错 TCP:I/O 超时