问题描述
我的 dcos Mesos 集群中不时出现奇怪的错误,日志中没有任何其他信息/错误/警告,我得到如下信息:
<0.1587.0>@dcos_l4lb_mgr:agents/3:505: L4LB unreachable agent nodes,size: 1,[{XX,XX,XX}]
网络正常,(10G 端口),cpu 和 RAM 正常,日志中只有类似以下内容:
[warning] <0.12784.23>@lashup_kv_sync_rx_fsm:terminate/3:40: KV AAE RX FSM terminated (handle): normal
[warning] <0.17389.31>@lashup_kv_sync_tx_fsm:terminate/3:104: KV AAE TX FSMs terminated (idle): normal
[warning] <0.17497.31>@lashup_kv_sync_rx_fsm:terminate/3:40: KV AAE RX FSM terminated (handle): normal
在这个问题开始时,此节点上的应用程序的流量被阻止,直到我这样做
dcos-net restart
我也可以在 Grafana 图表上看到这一点。
在此节点正常工作一段时间后,此错误再次显示。 所以这对我来说是批判性的思考!!!
这是我在这里看到的是我设置了 sysctl
选项:
SOMAXCONN=10000
TCP_MAX_ORPHANS=60000
TCP_MAX_TW_BUCKETS=400000
我的 netstat 是:
LISTEN 134
CLOSE_WAIT 16
ESTABLISHED 13297
FIN_WAIT1 1
FIN_WAIT2 52
TIME_WAIT 16868
我该如何解决这个奇怪的警告?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)