SequoiaDB巨杉数据库分区键选择

最新推荐文章于 2025-05-15 11:47:22 发布

转载最新推荐文章于 2025-05-15 11:47:22 发布 · 194 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://doc.sequoiadb.com/cn/sequoiadb-cat_id-1561381745-edition_id-500

文章标签：

#数据库

SequoiaDB 巨杉数据库专栏收录该内容

74 篇文章

订阅专栏

本文详细介绍了数据库中两种主要的分区策略——范围分区和散列分区。范围分区根据字段值的范围进行数据组织，常用于时间序列数据；散列分区则通过字段的hash值进行数据分布，适用于关键字段如用户ID。创建集合时需指定分区键和类型，并可设置分区数量。查看已创建的集合分区键信息，有助于理解数据分布和管理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在集合中，作为数据分区划分依据的字段称为分区键。在范围分区方式中，分区键是用于划分数据范围的字段；在散列分区中，分区键是用于计算 hash 值的字段。每个分区键可以包含一个或多个字段。

在创建集合时，可以指定分区类型和分区键，具体命令可参考创建集合。

范围分区键

格式说明

使用范围分区方式做数据分区时，分区键格式如下：

{
  ShardingKey: { <字段1>: <1|-1>, [<字段2>: <1|-1>, ...] },
  ShardingType: "range"
}

可以指定多个字段做为分区键
对于每个字段可以指定其值为 1 或者 -1 ，表示正向或是逆向排序

举例说明

范围分区方式的分区键一般选择具有序列性的字段，比如时间字段。

> db.business.createCL( "orders", { ShardingKey: { create_date: 1 }, ShardingType: "range", Group: "group1" } )

散列分区键

格式说明

使用散列分区方式做数据分区时，分区键格式如下：

{
  ShardingKey: { <字段1>: <1>, [<字段2>: <1>, ...] },
  ShardingType: "hash",
  Partition: <分区数>
}

可以指定多个字段做为分区键。
散列分区方式中字段没有正向或是逆向的属性
Partition 必须是 2 的幂，范围在[ 23 , 220 ]，默认为 4096

示例

散列分区方式的分区键一般选择具有关键属性的字段，比如用户 id 字段。

> db.business.createCL( "orders2", { ShardingKey: { id: 1 }, ShardingType: "hash", Partition: 4096, Group: "group1" } )

查看分区键

对于已经建好分区键的集合，可以通过快照命令查看分区键的定义及分区键划分情况：

> db.snapshot( SDB_SNAP_CATALOG, { Name: "business.orders" } )
{
  ...
  "Name": "business.orders",
  "ShardingKey": {
    "create_date": 1
  },
  "ShardingType": "range",
  "CataInfo": [
    {
      "GroupID": 1000,
      "GroupName": "group1",
      "LowBound": {
        "create_date": {
          "$minKey": 1
        }
      },
      "UpBound": {
        "create_date": {
          "$maxKey": 1
        }
      }
    }
  ]
}