分布式基础 #

Easysearch 的主旨是随时可用和按需扩容。真正的扩容能力来自于水平扩容——为集群添加更多的节点，并且将负载压力和稳定性分散到这些节点中。Easysearch 天生就是分布式的，它知道如何通过管理多节点来提高扩容性和可用性。

本页通过从 1 节点到 3 节点的演进，直观展示分片分配、故障转移和水平扩容的过程。

空集群 #

启动一个单独的节点，里面不包含任何数据和索引——这就是一个空集群。

此时这个节点既是唯一的数据节点，也是主节点。作为用户，我们可以将请求发送到集群中的任何节点（包括主节点），每个节点都知道任意文档所处的位置，并能将请求直接转发到正确的节点。

Easysearch 的集群监控信息中最重要的一项是集群健康，status 字段展示为 green、yellow 或 red：

GET /_cluster/health

颜色	含义
`green`	所有的主分片和副本分片都正常运行
`yellow`	所有的主分片都正常运行，但不是所有的副本分片都正常运行
`red`	有主分片没能正常运行

索引是指向一个或者多个物理分片的逻辑命名空间。一个分片是一个底层的工作单元，它本身就是一个完整的搜索引擎（一个 Lucene 实例）。

Easysearch 利用分片将数据分发到集群内各处。当集群规模扩大或缩小时，Easysearch 会自动在各节点间迁移分片，使数据均匀分布。

让我们创建一个名为 blogs 的索引，分配 3 个主分片和 1 份副本：

PUT /blogs
{
   "settings" : {
      "number_of_shards" : 3,
      "number_of_replicas" : 1
   }
}

此时只有一个节点，3 个主分片都分配在该节点上。集群健康状态为 yellow——主分片正常，但 3 个副本分片无处分配（在同一节点上保存原始数据和副本没有意义）。

启动第二个节点后，3 个副本分片将被分配到新节点上——每个主分片对应一个副本分片。这意味着任何一个节点出现问题时数据都完好无损。

集群健康变为 green：所有 6 个分片都正常运行。

所有新索引的文档都会先保存在主分片上，然后被并行复制到对应的副本分片。

启动第三个节点后，分片会被重新分配。Node 1 和 Node 2 上各有一个分片被迁移到 Node 3，现在每个节点上只有 2 个分片（而不是之前的 3 个），每个分片能获得更多的硬件资源，性能得到提升。

拥有 6 个分片（3 个主 + 3 个副本）的索引可以最大扩容到 6 个节点，每个节点只承载一个分片。

当某个节点出现故障时：

如果只剩一个节点且有主分片丢失，集群状态变为 red。

Easysearch 在分布式方面几乎是透明的。以下操作都在后台自动完成：

下一步可以继续阅读：