Parent-Child 建模 #

Parent-Child 用来表达"两个文档属于不同类型/生命周期，但又需要建立关联"的场景。相比 nested，它更适合父文档频繁变化 / 子文档数量较多 / 生命周期不同步的情况。

什么时候考虑 Parent-Child？ #

典型场景：

这类关系有几个共同特点：

可以用下面的方式做一个快速选择：

更适合 Nested 的情况：
- 子元素数量有限，整体更新成本可接受
- 查询几乎总是"连带父文档一起看"
- 不需要单独对"子"做大规模搜索或独立生命周期管理
更适合 Parent-Child 的情况：
- 子元素数量较多，且经常新增/删除
- 子文档需要独立参与搜索与统计
- 父/子有不同的更新/存储策略

Nested 更像"文档内部的结构"， Parent-Child 更像"两个文档集合之间的引用关系"。

底层上，父文档与子文档都存储在同一个索引中，通过一个"连接字段"来描述父/子的关系：

实务上需要注意：

具体的 mapping 与连接字段配置、查询语法，请以参考手册中的"关联查询"与字段类型文档为准，这里聚焦建模思路与取舍。

有了父子关系之后，你可以表达例如：

在查询层面，通常会用到几类"关联查询"：

配合聚合，可以：

这些需求如果用纯扁平索引或 nested 来表达，要么需要在应用层做二次 join，要么需要索引大量冗余数据。

优势：

成本与限制：

建模和查询语义更复杂，开发/调试成本更高
需要更谨慎地规划索引与路由策略，否则可能出现父/子落在不同分片的问题
某些查询与聚合在父/子混合场景下会显著更重，属于"昂贵查询"范畴
- 在部分配置下，如果禁止昂贵查询，对应的关联查询（如 has_child/has_parent）会被直接拒绝

经验建议：

如果 nested 能满足需求，优先尝试 nested（语义简单、查询更直观）
只有在 nested 明显不适合（子文档太多 / 生命周期差异很大）时，才考虑 Parent-Child
对使用了父子关系的索引：
- 控制索引规模与分片数，避免在"超大索引上跑海量父子关联查询"
- 为关键父子查询单独设计 API 与限流、超时策略，而不是开放为任意 DSL

下一步可以继续阅读：