数据分区 :: Taking Smart Notes With Org-mode

每一条数据都属于特定的分区，每个分区都是一个小型数据库。

目的⌗

提高扩展性，分散大的数据集和查询负载。

将数据和查询负载均匀的分步在所有节点上。如果分布不均匀会出现负载倾斜和系统热点。

结合数据复制每个分区在多个节点都有副本，进行冗余提高可用性。

避免系统热点最简单的方法是将记录随机分配给所有节点上，缺点是：没办法知道数据保存在哪个节点上，所以读取时需要查询所有节点。

二级索引不能唯一标识一条记录，比如查询颜色为红色的汽车。二级索引带来的主要挑战是它们不能规整的映射到分区中。

有两种方法来支持对二级索引进行分区：