Kubernetes:节点未就绪

问题描述

我是这个论坛的新手,还是Kubernetes的新手。但是,我对GKE群集有问题-一个节点的状态经常切换到NotReady。在过去的两个星期中,每天至少可能发生一次。最大的问题是,在我真正需要它工作的白天,它会发生(我的网站出现故障)。重新启动后,一切都会恢复正常,但通常需要20分钟,而且我没有时间(或将要)每天这样做。

当查看节点的日志时,可以看到以下模式:当节点将其状态更改为NotReady时,这三个消息将始终出现:

2020-10-06T07:58:03.782923Z curl: (28) Operation timed out after 10001 milliseconds with 0 bytes received
2020-10-06T07:58:03.782923Z Kubelet is unhealthy!
2020-10-06T07:58:21Z Node gke-cluster-default-pool-d02df301-cyfr status is now: NodeNotReady

有人对我可以做什么进行修复或至少有问题解决的想法丝毫没有吗?

最诚挚的问候,埃里克

解决方法

节点NotReady可能由于多种原因而发生,例如:

  • 内存不足:可能已达到阈值或超出阈值
  • 磁盘压力:可能达到阈值或超过
  • 网络问题:这是由网络插件设置的

请参考this答案进行调试。 除上述内容外,还请检查kubectl get events --all-namespaces

在您提供ATM的日志很少的情况下,似乎正在执行kubelet尝试执行的某些操作,但因此无法设置NotReady状态。

请收集更多日志并将其发布到问题,这将有助于找出kubelet无法执行的操作。如果碰巧是wordpress应用程序(托管在kubernetes上)问题,那么此link可能会帮助

,

谢谢大家的建议。

我和一个朋友交流,他在Kubernetes领域有更多的知识。他建议我获得功能更强大的VM,因此我将内存从1.7 GB升级到3.5 GB。自升级以来,到目前为止,我还没有遇到感觉很好的Note NotReady 问题。

我认为,一种选择可能是限制群集服务的资源,以确保Kubelet始终拥有所需的资源。这样一来,便有可能回到价格便宜,功能不强的机器上。

/埃里克

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...