桶聚合

📖 概念与教程请阅读 桶聚合教程

桶聚合 - API 参考 #

本节详细列出所有桶聚合的参数与用法。

相关资源 #


桶聚合类型 #

词项聚合 (4 种) #

按字段值分组,适合离散维度:

聚合说明常见用途
terms按字段值分桶,返回 Top N 词项按状态、地区、应用分组;热词统计
rare_terms找出低频长尾词项异常值检测;稀有事件分析
significant_terms统计显著性词项(相对背景集)重点词项提取;对比分析
significant_text统计显著性文本(支持 text 字段)text 字段的显著词分析

数值分桶 (3 种) #

按数值范围分组:

聚合说明常见用途
histogram数值等距分桶价格分布、评分分布、年龄分布
variable_width_histogram自适应宽度分桶数据分布不均匀时的自动分桶
range自定义数值区间分桶自定义价格段、年龄段、等级划分

时间分桶 (3 种) #

按时间单位分组,用于时间序列分析:

聚合说明常见用途
date_histogram按日期/时间粒度分桶趋势分析;时间序列数据
date_range自定义日期区间分桶自定义时间段分析;历史对比
auto_date_histogram自动选择最佳时间粒度自适应时间聚合

地理位置分桶 (3 种) #

按地理位置分组:

聚合说明常见用途
geo_distance按距离某点的距离分桶附近搜索;距离分析
geohash_grid按 Geohash 网格分桶地图热力图;空间聚类
geotile_grid按 Web 地图瓦片分桶地图应用;Web 地图可视化

IP 地址分桶 (1 种) #

聚合说明常见用途
ip_range按 IP 地址区间分桶IP 地址段分析;网络统计

嵌套与关联 (4 种) #

用于复杂数据结构:

聚合说明常见用途
nested对 nested 对象做聚合评论聚合、订单项聚合、嵌套数据分析
reverse_nested从 nested 回到 root 文档嵌套数据上的父级聚合
children按父子关系向下聚合父子关系数据的子集分析
parent按父子关系向上聚合子文档的父级信息聚合

过滤与采样 (4 种) #

聚合说明常见用途
filter单条件过滤桶条件分组;子集统计
filters多条件过滤桶多维条件分组;多方案对比
sampler采样聚合,减少数据量大数据集采样分析;性能优化
diversified_sampler多样化采样多样本采样;均衡采样

特殊桶聚合 (4 种) #

聚合说明常见用途
composite组合分桶,支持分页遍历所有桶大量桶的分页遍历;结果流式处理
adjacency_matrix多过滤条件交集矩阵条件组合分析;热力矩阵
missing字段缺失值桶数据质量分析;缺失值统计
global跳过 query 约束的全局桶全局统计;对比过滤结果