最小值分组聚合 #
min_bucket
最小值分组聚合是一个同级聚合,用于计算先前聚合中每个分组中某个指标的最小值。
指定的指标必须是数值型,并且同级聚合必须是多分组聚合。
参数说明 #
min_bucket
聚合采用以下参数。
参数 | 必需/可选 | 数据类型 | 描述 |
---|---|---|---|
buckets_path | 必需 | String | 要聚合的聚合分组的路径。参见分组路径。 |
gap_policy | 可选 | String | 应用于缺失数据的策略。有效值为 skip 和 insert_zeros 。默认为 skip 。参见数据间隙。 |
format | 可选 | String | DecimalFormat 格式字符串。返回聚合的 value_as _string 属性中的格式化输出。 |
参考样例 #
以下示例创建一个日期直方图,间隔为一个月。 sum
子聚合计算每个月的字节总和。最后, min_bucket
聚合找到最小值——这些分组中最小的一个:
POST sample_data_logs/_search
{
"size": 0,
"aggs": {
"visits_per_month": {
"date_histogram": {
"field": "@timestamp",
"interval": "month"
},
"aggs": {
"sum_of_bytes": {
"sum": {
"field": "bytes"
}
}
}
},
"min_monthly_bytes": {
"min_bucket": {
"buckets_path": "visits_per_month>sum_of_bytes"
}
}
}
}
返回内容 #
min_bucket
聚合返回跨多个分组的指定指标的最小值。在这个示例中,它计算了 sum_of_bytes
指标在 visits_per_month
中的每月最小字节数。 value
字段显示了在所有分组中找到的最小值。 keys
数组包含观察到该最小值的分组的键。它是一个数组,因为多个分组可以具有相同的最小值。在这种情况下,所有匹配的分组键都会被包含。这确保了即使多个时间段(或分组项)具有相同的最小值,结果也是准确的:
{
"took": 7,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": {
"value": 10000,
"relation": "gte"
},
"max_score": null,
"hits": []
},
"aggregations": {
"visits_per_month": {
"buckets": [
{
"key_as_string": "2025-03-01T00:00:00.000Z",
"key": 1740787200000,
"doc_count": 480,
"sum_of_bytes": {
"value": 2804103
}
},
{
"key_as_string": "2025-04-01T00:00:00.000Z",
"key": 1743465600000,
"doc_count": 6849,
"sum_of_bytes": {
"value": 39103067
}
},
{
"key_as_string": "2025-05-01T00:00:00.000Z",
"key": 1746057600000,
"doc_count": 6745,
"sum_of_bytes": {
"value": 37818519
}
}
]
},
"min_monthly_bytes": {
"value": 2804103,
"keys": [
"2025-03-01T00:00:00.000Z"
]
}
}
}