【flink】flink作业超额启动多个taskManager k8s

在这里插入图片描述

1.概述

flink作业按照配置应该启动4个taskManager,但是现在发现一个作业启动了十几个taskManager,jobManager只监控到3个taskManager,导致集群资源耗尽,启动不了新的taskManager了。还在不断尝试启动一个新的taskManager,导致作业一直在创建状态

我怀疑作业运行一段时间,和某些taskManager失联了,然后疯狂启动tm,并伴随部分tm失联,失联的tm pod也没有被清理掉,直到资源被tm耗尽。

on K8s网络性能确实不太好,我们之前测试环境的小机器小带宽也是各种毛病

可以看看TM报的什么错,然后适当调调Akka超时或者心跳超时之类的

相关文章

Flink-core小总结1.实时计算和离线计算1.1离线计算离线计算的...
2022年7月26日,Taier1.2版本正式发布!本次版本发布更新功能...
关于Flink相关的概念性东西就不说了,网上都有,官网也很详尽...
最近准备用flink对之前项目进行重构,这是一个有挑战(但我很...
Thispostoriginallyappearedonthe ApacheFlinkblog.Itwasre...
Flink配置文件对于管理员来说,差不多经常调整的就只有conf下...