Kafka Streams:流线程无法锁定状态目录

问题描述

我正在尝试测试我的Kafka Streams应用程序。我建立了一个简单的拓扑,可以从输入主题中读取并将相同的数据存储在状态存储中。

我尝试使用TopologyTestDriver为此拓扑编写单元测试。运行测试时,遇到以下错误

org.apache.kafka.streams.errors.LockException: stream-thread [main] task [0_0] Failed to lock the state directory for task 0_0
    at org.apache.kafka.streams.processor.internals.AbstractTask.registerStateStores(AbstractTask.java:197)
    at org.apache.kafka.streams.processor.internals.StreamTask.initializeStateStores(StreamTask.java:275)
    at org.apache.kafka.streams.TopologyTestDriver.<init>(TopologyTestDriver.java:403)
    at org.apache.kafka.streams.TopologyTestDriver.<init>(TopologyTestDriver.java:257)
    at org.apache.kafka.streams.TopologyTestDriver.<init>(TopologyTestDriver.java:228)
    at streams.checkStreams.checkStreamsTest.setup(checkStreamsTest.java:99)
    at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at java.base/jdk.internal.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.base/java.lang.reflect.Method.invoke(Method.java:566)
    at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:50)
    at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:12)
    at org.junit.runners.model.FrameworkMethod.invokeExplosively(FrameworkMethod.java:47)
    at org.junit.internal.runners.statements.RunBefores.evaluate(RunBefores.java:24)
    at org.junit.runners.ParentRunner.runLeaf(ParentRunner.java:325)
    at org.junit.runners.BlockJUnit4ClassRunner.runchild(BlockJUnit4ClassRunner.java:78)
    at org.junit.runners.BlockJUnit4ClassRunner.runchild(BlockJUnit4ClassRunner.java:57)
    at org.junit.runners.ParentRunner$3.run(ParentRunner.java:290)
    at org.junit.runners.ParentRunner$1.schedule(ParentRunner.java:71)
    at org.junit.runners.ParentRunner.runchildren(ParentRunner.java:288)
    at org.junit.runners.ParentRunner.access$000(ParentRunner.java:58)
    at org.junit.runners.ParentRunner$2.evaluate(ParentRunner.java:268)
    at org.junit.runners.ParentRunner.run(ParentRunner.java:363)
    ....

我可以看到状态存储在/ tmp / kafka-streams中本地创建,但是流线程无法以某种方式对其进行锁定。我搜索后发现此错误可能是由于线程试图访问两个流,其中一个具有锁,所以另一个必须等​​待。但是我没有看到在我的代码中创建两个流线程。我是这个kafka流及其测试的新手,我在这里错过了什么吗?

解决方法

application.id 不会创建任何后台线程,因此多线程(来自 KafkaStreams 本身)应该不是问题——但是,正如@BartoszWardziński 指出的那样,如果您的测试框架并行执行测试,并且您在不同的测试中使用相同的 application.id,可能会导致锁定问题。

测试的建议是生成随机 let data = [ { id: "1",cars: 5 },{ id: "1",pasta: 2 },{ id: "2",cars: 0 },pasta: 0 },]; 以避免此问题。

,

如果您的测试不是并行运行,解决方案可能是调用 close() 上的 TopologyTestDriver 方法。这将清理资源并移除锁。无论如何,这可能是一次性物品的最佳做法。

如果并行运行测试,您可以设置随机 application.id。这样做的问题是,如果您使用模式注册表并连接到测试注册表,这可能会创建数千个方案(每个测试一个)。

这里有两个选项:

  • 每个测试有一个唯一的 application.id 但它是硬编码的(即名称 测试)而不是随机的。
  • 不要并行运行测试并调用 close() TopologyTestDriver