如何在 Kubernetes 集群中使用 grpc-java 使 GRPC 的 round_robin 负载平衡工作?

问题描述

我一直试图在部署到 Kubernetes 集群的 Java 应用程序中实现 GRPC 的负载平衡,但我并没有取得太大的成功。似乎没有太多关于此的文档,但是从在线示例中我可以看到我现在应该能够在设置 ManagedChannel 时使用 '.defaultLoadBalancingPolicy("round_robin")'(在 GRPC Java lib 的更高版本中) .

更具体地说,我使用的是 GRPC Java 库的 1.34.1 版。我创建了两个 Spring Boot (v2.3.4) 应用程序,一个叫做 grpc-sender,一个叫做 grpc-receiver。

grpc-sender 充当 GRPC 客户端并定义(Netty)ManagedChannel 为:

@Bean
public ManagedChannel greetingServiceManagedChannel() {
  String host = "grpc-receiver";
  int port = 6565;
  return NettyChannelBuilder.forAddress(host,port)
      .defaultLoadBalancingPolicy("round_robin")
      .usePlaintext().build();
}

然后 grpc-receiver 充当 GRPC 服务器:

Server server = ServerBuilder.forPort(6565)
        .addService(new GreetingServiceImpl()).build();

我正在将这些应用程序部署到 Kubernetes 集群(目前在 minikube 本地运行),并且我为 grpc-receiver 应用程序创建了一个作为无头服务的服务:

kind: Service
apiVersion: v1
Metadata:
  name: grpc-receiver
spec:
  clusterIP: None
  selector:
    app: grpc-receiver
  ports:
    - name: 'grpc'
      port: 6565
      protocol: 'TCP'
      targetPort: 6565

但是,当我尝试从 grpc-sender 向 grpc-receiver 发送消息时,我只在 grpc-sender 日志中看到此异常:

2021-01-08 17:46:24.494 ERROR 1 --- [ault-executor-0] io.grpc.internal.ManagedChannelImpl      : [Channel<1>: (grpc-receiver:6565)] Uncaught exception in the SynchronizationContext. Panic!
java.lang.NoSuchFieldError: NAME_RESOLVER_SERVICE_CONfig
    at io.grpc.services.HealthCheckingLoadBalancerFactory$HealthCheckingLoadBalancer.handleResolvedAddresses(HealthCheckingLoadBalancerFactory.java:186) ~[grpc-services-1.25.0.jar!/:1.25.0]
    at io.grpc.internal.AutoConfiguredLoadBalancerFactory$AutoConfiguredLoadBalancer.tryHandleResolvedAddresses(AutoConfiguredLoadBalancerFactory.java:154) ~[grpc-core-1.34.1.jar!/:1.34.1]
    at io.grpc.internal.ManagedChannelImpl$NameResolverListener$1NamesResolved.run(ManagedChannelImpl.java:1668) ~[grpc-core-1.34.1.jar!/:1.34.1]
    at io.grpc.SynchronizationContext.drain(SynchronizationContext.java:95) ~[grpc-api-1.34.1.jar!/:1.34.1]
    at io.grpc.SynchronizationContext.execute(SynchronizationContext.java:127) ~[grpc-api-1.34.1.jar!/:1.34.1]
    at io.grpc.internal.ManagedChannelImpl$NameResolverListener.onResult(ManagedChannelImpl.java:1682) ~[grpc-core-1.34.1.jar!/:1.34.1]
    at io.grpc.internal.DnsNameResolver$Resolve.run(DnsNameResolver.java:333) ~[grpc-core-1.34.1.jar!/:1.34.1]
    at java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128) ~[na:na]
    at java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628) ~[na:na]
    at java.base/java.lang.Thread.run(Thread.java:834) ~[na:na

谁能给我任何关于我做错了什么或我遗漏了什么的提示

顺便说一句 - 我知道使用 GRPC 进行负载平衡的替代方法,例如使用 Linkerd 或 Istio 等服务网格或仅使用 Envoy 代理,但我渴望使用 GRPC 的开箱即用负载来获得一些工作平衡特征作为不同方法间的比较点。

非常感谢!

解决方法

我发现您的代码存在一些问题:

  1. 在客户端,您应该使用 forTarget 而不是 forAddress 之类的 dns:///grpc-receiver:6565,因为 kubernetes 通过 dns 服务路由,尝试使用这个名称解析器,并确保您的服务器有多个实例。
  2. 异常NoSuchFieldError: NAME_RESOLVER_SERVICE_CONFIG是lib不匹配引起的,grpc-services的版本是1.25.0,而grpc-core的版本是1.34.1,所以把它们放在同一个版本,这样就可以了应该正确工作。