如何调试此 Kubernetes coreDNS 错误?

问题描述

我的 coredns pod 日志中的这个错误是什么意思,我该如何调试?

[ERROR] plugin/errors: 2 2858211404501823821.6843583298703021155. HINFO: read udp 192.168.27.16:47449->67.207.67.3:53: I/O timeout

行为很奇怪。

单个测试 pod 将正确执行 curl 命令,但网络不会。 此外,每个节点都可以与其他每个节点通话。

据我所知,自从网络上次“按预期”运行以来,我没有更改任何相关配置。

更新: 所以我不知道这是否算作一个解决方案,但我删除了所有 pod(包括 coredns)并允许它们重新启动。系统现在可以工作了。

我会保留这个问题并标记为已解决,以防万一有人不知道这个漂亮的命令(不要在生产集群上使用)

kubectl delete po -A --all

解决方法

我删除了所有 pod(包括 coreDNS)并允许它们重新启动。系统现在可以工作了。

我会保留这个问题并标记为已解决,以防万一有人不知道这个漂亮的命令(不要在生产集群上使用)

kubectl delete po -A --all

另一种方法(可能更安全)是:

kubectl -n kube-system rollout restart deployment coredns

感谢@Richard_Bateman