如何在 Docker 中解决 Prometheus Node Exporter `node_filesystem_device_error` 并收集文件系统指标?

问题描述

我在 Docker 容器内运行 Prometheus Node Exporter,并希望它报告 Docker 容器主机上文件系统的文件系统空间使用信息。

对于我的大多数文件系统,除了表示指标收集失败的 node_filesystem_device_error 指标外,大多数文件系统指标都不存在。

这可以通过直接在主机上运行 node_exporter 二进制文件解决,但我想通过 Docker 运行我的整个可观察性基础设施。

解决方法

要从节点导出器 Docker 容器内发出主机文件系统指标,容器需要将主机的 / 路径绑定挂载到容器路径,如 /rootfs。然后,需要使用命令行参数 --path.rootfs=/rootfs 启动 node-exporter,以便它知道在哪里可以找到文件系统。

Prometheus 节点导出器的完整 Docker Compose / Docker Swarm 配置如下。它还被配置为报告有关主机网络配置的统计信息。

version: "3.9"

services:
  node_exporter:
    image: prom/node-exporter:v1.0.1
    ports:
      - target: 9100
        published: 9100
        protocol: tcp
        mode: host
    volumes:
      # Remember to use read-only bind mounts.
      - /proc:/host/proc:ro
      - /sys:/host/sys:ro
      - /:/rootfs:ro
    command:
      - "--web.listen-address=:9100"
      - "--path.procfs=/host/proc"
      - "--path.sysfs=/host/sys"
      - "--path.rootfs=/rootfs" # Necessary for collecting host filesystem metrics.
      - "--collector.filesystem.ignored-mount-points='^/(sys|proc|dev|host|etc|rootfs/var/lib/docker/containers|rootfs/var/lib/docker/overlay2|rootfs/run/docker/netns|rootfs/var/lib/docker/aufs)($$|/)'"
    deploy:
      mode: global

# This listens to port 9100 ON THE HOST.
# This container does not have its own IP address.
# Binding to the host is necessary for node-exporter to collect accurate
# networking statistics about the host.
networks:
  default:
    external: true
    name: host