通过 IP 前缀聚合 ElasticSearch 中的对象

问题描述

我有一个 ElasticSearch 索引，用于存储互联网流量对象，其中每个对象都包含一个 IP 地址。我想以将具有相同 IP 前缀的所有对象收集在同一个存储桶中的方式聚合数据（但不指定特定的前缀）。类似于直方图聚合的东西。这可能吗？

我已经试过了：

function buildEmail() {
  window.initial = document.getElementById("initial").value;
  window.surname = document.getElementById("surname").value;
  window.email = initial + surname + "@[emaildomain.com]"
}

但这不起作用，可能是因为 ip 类型字段不支持直方图聚合。你会怎么做？

解决方法

首先，按照here的建议，最好的方法是：

在索引时对IP地址进行分类，然后使用一个简单的关键字字段来存储c类信息，然后在该字段上使用术语聚合进行计数。

或者，您可以简单地添加一个 multi-field keyword mapping：

PUT myindex
{
  "mappings": {
    "properties": {
      "ipAddress": {
        "type": "ip","fields": {
          "keyword": {         <---
            "type": "keyword"
          }
        }
      }
    }
  }
}

然后在查询时提取前缀（⚠️效率极低！）：

GET myindex/_search
{
  "size": 0,"aggs": {
    "my_prefixes": {
      "terms": {
        "script": "/\\./.split(doc['ipAddress.keyword'].value)[0]","size": 10
      }
    }
  }
}

作为最后一个选项，您可以提前定义感兴趣的区间并使用 ip_range aggregation：

{
  "size": 0,"aggs": {
    "my_ip_ranges": {
      "ip_range": {
        "field": "ipAddress","ranges": [
          { "to": "192.168.1.1" },{ "from": "192.168.1.1" }
        ]
      }
    }
  }
}

elasticsearch elasticsearch elasticsearch-aggregation ip-address kibana