LoopJump's Blog

PolarDB-SCC - RO节点强一致性读优化

2024-02-01

《PolarDB-SCC: A Cloud-Native Database Ensuring Low Latency for Strongly Consistent Reads》

很多数据库系统通过类似于binlog复制或者redo复制的方式提供RO节点来提升整个系统的读吞吐,RW节点上产生更新,同步到RO节点apply变更。但只读请求发到RO节点上可能会读到陈旧的数据。如果想读到最新的数据(例如read-after-write一致性)呢?

首先读到最新数据或者强一致性读,指的是RO上启动的只读请求,应该能看到所有在它启动前已经commit的写事务的变更。

常见的解决方法是commit-wait和read-wait两类:

  • commit-wait: RW节点等待RO节点apply完之后再返回客户端事务提交成功
  • read-wait: 只读请求在RO上执行时,先获取RW上的时间戳并等待RO上变更apply到至少这个时间戳为止

commit-wait会引入提交延迟,read-wait会引入RO上的只读查询的延迟。

PolarDB-SCC大幅优化了RO节点的一致性读性能。

第一个优化是时间戳获取优化。

强一致性读问题的关键是在RO上当前读事务开启时,需要知晓此刻RW节点上最新的提交时间戳(可以偏大,不能偏小)。因此概念上RO上每个读请求都要从RW上fetch一次,但是如图的场景,实际上可以在满足条件的情况下,让一个读请求直接使用另一个读请求fetch的结果。图中r1就可以直接使用r2 fetch的结果。

第二个优化是避免不必要的等待。

!http://loopjump.com/wp-content/uploads/2024/02/screenshot-20240213-111758-300x162.png

如果RO上的一个事务要读取的页面或者表在最近一段时间内未被更新,则显然这个事务并不需要等待所有的redo变更apply到最新。但要得知这个事实就要维护每个页面的最新变更LSN。因为PolarDB自身已经使用了CTS提交序事务系统,因此LSN跟commit-timestamp是等价的。文中使用了称之为modification tracking table(MTT)的数据结构维护了三层timestamp值:

  • Global Level: 整个db最新的提交时间戳
  • Table Level: 表级别的最新提交时间戳,每个表维护一个
  • Page Level: 页面级别的最新提交时间戳,每个页面维护一个

!http://loopjump.com/wp-content/uploads/2024/02/screenshot-20240213-111836-300x98.png

第三个方法是使用RMDA优化RW到RO的log shipment。

略。

扫描二维码,分享此文章