consul 重启后 id 重新生成,导致该consul不能接收服务注册问题解决

一、问题

最近测试环境的 consul 发生了重启

但是重启之后,发现服务注册不上去了,查看consul 的日志,发现了下面的信息。

2021/04/28 06:40:55 [WARN] agent: Syncing service "uat_10.60.6.30:davietest:8092" failed. rpc error making call: failed inserting node: Error while renaming Node ID: "c82f9d74-a4bc-c65e-a2fb-b9bfcec17ad3": Node name uat_37 is reserved by node 3ccb61e1-e0dd-9548-fc41-59de4b9f3991 with name uat_37
2021/04/28 06:40:55 [ERR] agent: failed to sync remote state: rpc error making call: failed inserting node: Error while renaming Node ID: "c82f9d74-a4bc-c65e-a2fb-b9bfcec17ad3": Node name uat_37 is reserved by node 3ccb61e1-e0dd-9548-fc41-59de4b9f3991 with name uat_37

第一眼我也没看出来什么异常, 认真一看,就是consul 的 node id 不一致导致的问题。 由于 consul server 异常重启后,导致 该节点的 node ID 重新生成了。,但是原来的 nodeid 已经在集群内其他节点未删除。

二、解决办法

修改当前异常 consul 的node id 为 之前的id。

我们看下我们consul 指定的 -data-dir= 路径是在哪,我们这边指定的是 /consul/data/ , 在该目录下可以找到为我们的文件 node-id

  1. 备份下 node-id 文件
  2. 3ccb61e1-e0dd-9548-fc41-59de4b9f3991 写入到 node-id 文件,替换老的内容。
  3. 重启 consul.

三、扩展

注册服务

接口 http://ip:8500/v1/agent/service/register

请求方式 PUT

请求参数

{
  "ID": "djx-test1-037","Name": "djx-test1","Tags": [],"Address": "10.60.7.8","Port": 8000,"Meta": {},"Weights": {
    "Passing": 10,"Warning": 1
  }
}

注销服务

  1. 去注册的节点 执行命令 consul services deregister -id djx-test1-037

  2. PUT 请求 http://ip:8500/v1/agent/service/deregister/{ID}

    ip 需要为注册的ip.

  3. PUT 请求 /v1/catalog/deregister

    https://www.consul.io/api-docs/catalog

    可以不用在注册的机器发起注销。

    {
      "Datacenter": "yx-sz","ServiceID": "djx-test1-037","Node": "uat_hq_37"
    }
    

相关文章

linux常用进程通信方式包括管道(pipe)、有名管道(FIFO)、...
Linux性能观测工具按类别可分为系统级别和进程级别,系统级别...
本文详细介绍了curl命令基础和高级用法,包括跳过https的证书...
本文包含作者工作中常用到的一些命令,用于诊断网络、磁盘占满...
linux的平均负载表示运行态和就绪态及不可中断状态(正在io)的...
CPU上下文频繁切换会导致系统性能下降,切换分为进程切换、线...