问题描述
我有一个 ElasticSearch 索引,用于存储互联网流量对象,其中每个对象都包含一个 IP 地址。我想以将具有相同 IP 前缀的所有对象收集在同一个存储桶中的方式聚合数据(但不指定特定的前缀)。类似于直方图聚合的东西。这可能吗?
我已经试过了:
function buildEmail() {
window.initial = document.getElementById("initial").value;
window.surname = document.getElementById("surname").value;
window.email = initial + surname + "@[emaildomain.com]"
}
但这不起作用,可能是因为 ip 类型字段不支持直方图聚合。你会怎么做?
解决方法
首先,按照here的建议,最好的方法是:
在索引时对IP地址进行分类,然后使用一个简单的关键字字段来存储c类信息,然后在该字段上使用术语聚合进行计数。
或者,您可以简单地添加一个 multi-field keyword mapping:
PUT myindex
{
"mappings": {
"properties": {
"ipAddress": {
"type": "ip","fields": {
"keyword": { <---
"type": "keyword"
}
}
}
}
}
}
然后在查询时提取前缀(⚠️效率极低!):
GET myindex/_search
{
"size": 0,"aggs": {
"my_prefixes": {
"terms": {
"script": "/\\./.split(doc['ipAddress.keyword'].value)[0]","size": 10
}
}
}
}
作为最后一个选项,您可以提前定义感兴趣的区间并使用 ip_range
aggregation:
{
"size": 0,"aggs": {
"my_ip_ranges": {
"ip_range": {
"field": "ipAddress","ranges": [
{ "to": "192.168.1.1" },{ "from": "192.168.1.1" }
]
}
}
}
}