Store Limit

Store Limit 是 PD 在 3.0 版本引入的特性，旨在能够更加细粒度地控制调度的速度，针对不同调度场景进行调优。

实现原理

PD 的调度是以 operator 为单位执行的。一个 operator 可能包含多个调度操作。示例如下；

"replace-down-replica {mv peer: store [2] to [3]} (kind:region,replica, region:10(4,5), createAt:2020-05-18 06:40:25.775636418 +0000 UTC m=+2168762.679540369, startAt:2020-05-18 06:40:25.775684648 +0000 UTC m=+2168762.679588599, currentStep:0, steps:[add learner peer 20 on store 3, promote learner peer 20 on store 3 to voter, remove peer on store 2])"

以上示例中，replace-down-replica 这个 operator 具体包含以下操作：

在 store 3 上添加一个 learner peer，ID 为 20。
将 store 3 上 ID 为 20 的 learner peer 提升为 voter。
删除 store 2 上的 peer。

Store Limit 是通过在内存中维护了一个 store ID 到令牌桶的映射，来实现 store 级别的限速。这里不同的操作对应不同的令牌桶，目前仅支持限制添加 learner/peer 和删除 peer 两种操作的速度，即对应于每个 store 存在两种类型的令牌桶。

每次 operator 产生后会检查所包含的操作对应的令牌桶中是否有足够的 token。如果 token 充足才会将该 operator 加入到调度的队列中，同时从令牌桶中拿走对应的 token，否则该 operator 被丢弃。令牌桶会按照固定的速率补充 token，从而实现限速的目的。

Store Limit 与 PD 其他 limit 相关的参数（如 region-schedule-limit，leader-schedule-limit 等）不同的是，Store Limit 限制的主要是 operator 的消费速度，而其他的 limit 主要是限制 operator 的产生速度。引入 Store Limit 特性之前，调度的限速主要是全局的，所以即使限制了全局的速度，但还是有可能存在调度都集中在部分 store 上面，因而影响集群的性能。而 Store Limit 通过将限速的粒度进一步细化，可以更好的控制调度的行为。

使用方法

Store Limit 相关的参数可以通过 pd-ctl 进行设置。

查看当前 store 的 limit 设置

查看当前 store 的 limit 示例如下：

store limit                         // 显示所有 store 添加和删除 peer 的速度上限。
store limit add-peer                // 显示所有 store 添加 peer 的速度上限。
store limit remove-peer             // 显示所有 store 删除 peer 的速度上限。

设置全部 store 的 limit

设置全部 store 的 limit 示例如下：

store limit all 5                   // 设置所有 store 添加和删除 peer 的速度上限为每分钟 5 个。
store limit all 5 add-peer          // 设置所有 store 添加 peer 的速度上限为每分钟 5 个。
store limit all 5 remove-peer       // 设置所有 store 删除 peer 的速度上限为每分钟 5 个。

设置单个 store 的 limit

设置单个 store 的 limit 示例如下：

store limit 1 5                     // 设置 store 1 添加和删除 peer 的速度上限为每分钟 5 个。
store limit 1 5 add-peer            // 设置 store 1 添加 peer 的速度上限为每分钟 5 个。
store limit 1 5 remove-peer         // 设置 store 1 删除 peer 的速度上限为每分钟 5 个。

Store Limit v2 原理

当 store-limit-version 设置为 v2 时，Store Limit v2 生效。在此模式下，Operator 调度限制将根据 TiKV Snapshot 执行情况进行动态调整。当 TiKV 积压的任务较少时，PD 会增加其调度任务。相反，PD 会减少对该节点的调度任务。此时，你无需关注如何设置 store limit 以加快调度进度。

在该模式下，TiKV 执行速度成为迁移进度的主要瓶颈。你可以通过 TiKV Details > Snapshot > Snapshot Speed 面板判断当前调度速度是否达到 TiKV 限流设置。通过调整 TiKV Snapshot Limit (snap-io-max-bytes-per-sec) 来增加或减少该节点的调度速度。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

configure-store-limit.md

configure-store-limit.md

Store Limit

实现原理

使用方法

查看当前 store 的 limit 设置

设置全部 store 的 limit

设置单个 store 的 limit

Store Limit v2 原理

Files

configure-store-limit.md

Latest commit

History

configure-store-limit.md

File metadata and controls

Store Limit

实现原理

使用方法

查看当前 store 的 limit 设置

设置全部 store 的 limit

设置单个 store 的 limit

Store Limit v2 原理