动态再平衡策略

为什么不用取模？⌗

节点数发生变化时，会导致很多关键字需要做节点数据迁移，会大大增加再平衡的成本。

创建远超实际节点数的分区数量，然后再为每个节点分配多个分区。

从现有的节点上匀走几个分区，直到分区再次达到平衡。

采取和上面相反的过程。

分区数据增长超过一个可配参数的阈值（HBase 10GB），它就拆分为两个分区，相反则合并相邻的分区。过程类似B-trees 的分裂操作。

每个分区总是分配一个节点，一个节点可以承载多个分区。

将其中的一半转移到其他节点以平衡负载。

使分区数与集群节点数成正比关系（Cassandra 和 Ketama），就是每个节点具有固定数量的分区。当节点数不变时，每个分区的大小与数据集大小保持正比增长关系。

随机选择固定数量的现有分区进行分裂，然后拿走这些分区的一半数据量。