Glossary

术语表

术语, Glossary

术语表 # 本页汇总文档中常用的中英文术语对照,方便写作时统一用词,也方便读者建立清晰的心智模型。 一、数据结构与存储 # 英文术语 中文叫法 说明 Index 索引 逻辑上的数据集合,通常一类业务一组索引,可按时间/租户再拆前缀。 Document 文档 索引中的基本数据单元,以 JSON 形式表示。 Shard 分片 水平切分单位,number_of_shards 只在建索引时生效。 Primary Shard 主分片 负责接受写入并复制到副本。 Replica Shard 副本分片 / 副本 提供高可用与读扩展,副本数可在线调整。 Segment 段 Lucene 的不可变索引文件块,刷新/合并都围绕它展开。 Inverted Index 倒排索引 从词项到文档的映射结构,全文搜索的核心数据结构。 _source _source 文档原文 建议默认保留,是检索展示与重建索引的"真相来源"。 Stored Fields 存储字段 只在少数场景单独使用,更多依赖 _source + doc_values。 doc_values doc_values 列式存储 聚合与排序的核心支撑,应在大多数可聚合/排序字段上启用。 Fielddata fielddata 仅在 text 字段聚合/排序时使用,能不用尽量不用。 Translog 事务日志 写入操作的预写日志(WAL),保证 flush 前的数据不丢失。 Routing 路由 控制文档写入和查询时定向到特定分片的机制,默认按 _id 哈希。 二、Mapping 与文本分析 # 英文术语 中文叫法 说明 Mapping 映射 / Mapping 描述字段类型与索引规则,是一切查询/聚合行为的基础。 text Field 文本字段(text) 做全文检索,用分析器拆分为词项,不适合精确过滤/聚合。 keyword Field 关键字字段(keyword) 精确匹配、过滤、聚合、排序使用,不做分词。 integer / long / float / double 数值字段 数值类型字段,支持范围查询和聚合运算。 date Field 日期字段 支持多种日期格式,底层以毫秒时间戳存储。 boolean Field 布尔字段 仅存储 true/false 值。 geo_point 地理点 存储经纬度坐标,支持地理距离和区域查询。 geo_shape 地理形状 存储多边形、线段等复杂地理形状,支持空间关系查询。 nested 嵌套类型 保持对象数组中字段关联关系的特殊映射类型。 join (Parent/Child) 父子关系 同一索引内建立文档间的层级关系。 object 对象类型 JSON 对象映射为扁平化的点分字段名,不保持数组内对象边界。 knn_dense_float_vector 向量字段类型 用于存储 dense 浮点向量,支持近似最近邻搜索。 Multi-fields 多字段 / multi-fields 一份源数据多个视图,如 title + title. ...