如何在Kubernetes中为集合重新索引索引期间发现SOLR“名称或服务未知”异常的根本原因?

问题描述

有两个节点的裸机Kubernetes集群,其中部署了80个Solr云节点。

我希望将现有的收藏夹移动大约。 20亿使用Solr Stream REINDEX收集命令将文档转移到另一个收集中。

大约成功重新索引后。 100万的文档不同Solr节点反复引发异常“ java.net.UnknownHostException:v1-solr-xx.v1-solr-headless.default:名称或服务未知”以及与IO通信相关的其他异常。

Kubernetes CoreDNS和Flannel Pod的调试输出不会显示任何可疑消息以开始发现根本原因。

我改变了各种Java设置和堆限制(包括将Solr Jetty和Solr套接字超时增加到300秒,将G1GC垃圾收集器更改为ZGC,将堆大小从2Gb更改为6Gb)。在这种情况下,唯一的结果是-与DNS连接期间发生超时有关的其他例外情况(无论超时值如何,固定持续时间均为15秒)。

所以,我想知道是否还有其他方法可以收集信息以发现Solr如此怪异行为的原因?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...