NodeJS TCP socket经常监听END事件

问题描述

我们有一个 Nodejs TCP 连接应用程序。它的作用是,它接受来自 IOT 设备的数据(通过 SIM 发送的数据)。该应用程序驻留在 Ubuntu 18 机器上。软件和物联网设备在同一个区域时可以完美运行。例如:

服务器在美国,IOT设备在美国

服务器在澳大利亚,IOT设备在澳大利亚

这个场景很完美。但是,如果服务器或 IOT 设备在不同的区域,应用程序通常会侦听 Socket 结束事件。例如:

服务器在美国 物联网设备在西班牙

服务器在美国 物联网设备在俄罗斯

在上面的例子中,应用程序经常侦听套接END事件,因此,设备总是以毫秒的差异重新连接。

然后我在 Google 上冲浪,许多人建议微调 Linux 认 TCP 值。 https://www.cspsprotocol.com/tcp-keep-alive/。然后我更改了认值,显然它仍然没有任何效果。当前值为

net.ipv4.tcp_keepalive_intvl = 10
net.ipv4.tcp_keepalive_probes = 50
net.ipv4.tcp_keepalive_time = 7200

作为第二步,我在我的 Nodejs 应用程序中添加了以下行,但仍然没有运气。

socket.setKeepAlive(true,300000); 

这是我的 TCP 连接代码

const Network = require("net");
const Events = require("events");
const { Signale } = require("signale");


const { PORT = 5252,HOST = "localhost" } = process.env;

const emitter = new Events.EventEmitter();

const logger = new Signale({
    scope: "server"
});

const server = Network.createServer(onClientConnected);

server.on("error",error => {
    if (error.code === "EADDRINUSE") {
        logger.warn(`Port is already in use,retrying ..`);
        setTimeout(() => {
            server.close();
            server.listen(PORT,() => {
                logger.success("retrying listening to port",PORT,"on host",HOST);
            });
        },1000);
    }
});

let deviceConnectTimes = {};

function onClientConnected(socket) {
    const clientName = `${socket.remoteAddress}`;
    const networkLogger = logger.scope(clientName);

    socket.deviceMetadata = null;

    const TIMEOUT_IN_SECONDS = 30;
    socket.setTimeout(TIMEOUT_IN_SECONDS * 1000);

    socket.on("timeout",() => {
        networkLogger.warn(`The socket for ${clientName} has timed out.`);
        socket.end();
    });

    socket.on("error",error => {
        networkLogger.error(error);
    });

    socket.on("end",() => {
        networkLogger.warn(`The socket for ${clientName} has closed or timed out.`);
        console.log("socket end",socket.deviceMetadata);
    });

    socket.on("data",async buffer => {
        networkLogger.debug(buffer.toString("hex"));

        **....More code here**

    });
    socket.setKeepAlive(true,300000); // New code added to solve the disconnetion issue
}

module.exports.events = emitter;

module.exports.listen = () => {
    server.listen(PORT,() => {
        logger.success("Listening on port",HOST);
    });
};

如果设备或服务器位于不同的国家/地区,请提供任何帮助,因为为什么它会覆盖延迟。

解决方法

简单来说,有两种可能性:1) 纯粹是由延迟引起的,或者 2) 不是。

所以我首先尝试模拟测试环境中延迟的增加(最好是本地主机或简单的 LAN - 我有一个古老的 10-base-T 集线器,非常适合这种事情)。从基本设置开始,然后使用 tc 之类的东西添加延迟

https://bencane.com/2012/07/16/tc-adding-simulated-network-latency-to-your-linux-server/

如果您可以在本地重复该问题,那么您应该能够看到问题或至少将 PCAP 放在一起 - 然后您可以将其张贴在这里,有人应该能够为您提供更好的答案。