仅在 TiDB 集群中 TiDB Pods 中连接被拒绝,导致 Readiness 问题失败

问题描述

我们一直在 k8s 运行 TiDB 集群。从那以后它的工作正常。但突然间,在扩展 tidb-tidb statsfulset 后,我​​仅在新的 statsfull pod tidb-tidb-1 中遇到以下问题。有趣的是 tidb-tidb-2 正在运行。所有其他 pd 和 tikv pod 也运行良好。我检查了 pd url,该 url 无法从有问题的 pod 访问,但对其他 pod 很好。请您帮我解决这个问题。

tidb-tidb-1 logs:

[2021/04/11 16:15:44.526 +00:00] [WARN] [base_client.go:180] ["[pd] Failed to get cluster id"] 
[2021/04/11 16:15:48.527 +00:00] [WARN] [base_client.go:180] ["[pd] Failed to get cluster id"]  [error="[PD:client:ErrClientGetMember]error:rpc error: code = DeadlineExceeded desc = latest connection error: connection error: desc = \"transport: Error while dialing dial tcp: I/O timeout\" target:test-tidb-pd:2379 status:CONNECTING

解决方法

  1. 能否请您显示命名空间信息? kubectl get all -n -o wide
  2. 请检查节点信息。 https://kubernetes.io/docs/concepts/scheduling-eviction/assign-pod-node/#node-isolation-restriction
  3. 请检查网络。如果两个节点能ping通吗? 传输:拨号时出错 TCP:I/O 超时

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...