阻止连接到节点 DC/OS mesos dcos_l4lb_mgr:agents/3:505:L4LB 无法访问的代理节点,大小:1,[{XX,XX,XX,XXX}]

问题描述

我的 dcos Mesos 集群中不时出现奇怪的错误,日志中没有任何其他信息/错误/警告,我得到如下信息:

<0.1587.0>@dcos_l4lb_mgr:agents/3:505: L4LB unreachable agent nodes,size: 1,[{XX,XX,XX}]

网络正常,(10G 端口),cpu 和 RAM 正常,日志中只有类似以下内容

[warning] <0.12784.23>@lashup_kv_sync_rx_fsm:terminate/3:40: KV AAE RX FSM terminated (handle): normal
[warning] <0.17389.31>@lashup_kv_sync_tx_fsm:terminate/3:104: KV AAE TX FSMs terminated (idle): normal
[warning] <0.17497.31>@lashup_kv_sync_rx_fsm:terminate/3:40: KV AAE RX FSM terminated (handle): normal

在这个问题开始时,此节点上的应用程序的流量被阻止,直到我这样做

dcos-net restart

我也可以在 Grafana 图表上看到这一点。

在此节点正常工作一段时间后,此错误再次显示。 所以这对我来说是批判性的思考!!!

这是我在这里看到的是我设置了 sysctl 选项:

SOMAXCONN=10000

TCP_MAX_ORPHANS=60000

TCP_MAX_TW_BUCKETS=400000

我的 netstat 是:

LISTEN 134

CLOSE_WAIT 16

ESTABLISHED 13297

FIN_WAIT1 1

FIN_WAIT2 52

TIME_WAIT 16868

我该如何解决这个奇怪的警告?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)