写缓冲(change buffer),这次彻底懂了!!!
上篇《缓冲池(buffer pool),彻底懂了!》介绍了InnoDB缓冲池的工作原理。 简单回顾一下:
画外音:细节详见《缓冲池(buffer pool),彻底懂了!》。 毫无疑问,对于读请求,缓冲池能够减少磁盘IO,提升性能。问题来了,那写请求呢? 情况一 假如要修改页号为4的索引页,而这个页正好在缓冲池内。 如上图序号1-2:
这样的效率是最高的。 画外音:像写日志这种顺序写,每秒几万次没问题。 是否会出现一致性问题呢? 并不会。
什么时候缓冲池中的页,会刷到磁盘上呢? 定期刷磁盘,而不是每次刷磁盘,能够降低磁盘IO,提升MySQL的性能。 画外音:批量写,是常见的优化手段。 情况二 假如要修改页号为40的索引页,而这个页正好不在缓冲池内。 此时麻烦一点,如上图需要1-3:
没有命中缓冲池的时候,至少产生一次磁盘IO,对于写多读少的业务场景,是否还有优化的空间呢? 这即是InnoDB考虑的问题,又是本文将要讨论的写缓冲(change buffer)。 画外音:从名字容易看出,写缓冲是降低磁盘IO,提升数据库写性能的一种机制。 什么是InnoDB的写缓冲? 在MySQL5.5之前,叫插入缓冲(insert buffer),只针对insert做了优化;现在对delete和update也有效,叫做写缓冲(change buffer)。 它是一种应用在非唯一普通索引页(non-unique secondary index page)不在缓冲池中,对页进行了写操作,并不会立刻将磁盘页加载到缓冲池,而仅仅记录缓冲变更(buffer changes),等未来数据被读取时,再将数据合并(merge)恢复到缓冲池中的技术。写缓冲的目的是降低写操作的磁盘IO,提升数据库性能。 画外音:R了狗了,这个句子,好长。 InnoDB加入写缓冲优化,上文“情况二”流程会有什么变化? 假如要修改页号为40的索引页,而这个页正好不在缓冲池内。 加入写缓冲优化后,流程优化为:
其性能与,这个索引页在缓冲池中,相近。 画外音:可以看到,40这一页,并没有加载到缓冲池中。 是否会出现一致性问题呢? 也不会。
不妨设,稍后的一个时间,有请求查询索引页40的数据。 此时的流程如序号1-3:
画外音:可以看到,40这一页,在真正被读取时,才会被加载到缓冲池中。 还有一个遗漏问题,为什么写缓冲优化,仅适用于非唯一普通索引页呢? InnoDB里,聚集索引(clustered index)和普通索引(secondary index)的异同,《1分钟了解MyISAM与InnoDB的索引差异》有详尽的叙述,不再展开。 如果索引设置了唯一(unique)属性,在进行修改操作时,InnoDB必须进行唯一性检查。也就是说,索引页即使不在缓冲池,磁盘上的页读取无法避免(否则怎么校验是否唯一?),此时就应该直接把相应的页放入缓冲池再进行修改,而不应该再整写缓冲这个幺蛾子。 除了数据页被访问,还有哪些场景会触发刷写缓冲中的数据呢? 还有这么几种情况,会刷写缓冲中的数据:
画外音:几乎不会出现redo log写满,此时整个数据库处于无法写入的不可用状态。 什么业务场景,适合开启InnoDB的写缓冲机制? 先说什么时候不适合,如上文分析,当:
这两类场景,在写操作进行时(进行后),本来就要进行进行页读取,本来相应页面就要入缓冲池,此时写缓存反倒成了负担,增加了复杂度。 什么时候适合使用写缓冲,如果:
可以使用写缓冲,将原本每次写入都需要进行磁盘IO的SQL,优化定期批量写磁盘。 画外音:例如,账单流水业务。 上述原理,对应InnoDB里哪些参数? (编辑:ASP站长网) |