我们一起聊聊 Oracle 的Lgwr Worker

这些年Oracle发展的太快,我从12C之后就比较少参与运维工作,顶多帮着客户看看AWR报告,所以多Oracle 12C以后的很多细节实际上了解不多。搞了二十多年Oracle,从5.1用到11.2,Oracle 10G出来的时候,我就说这应该是我学习的最后一个版本的Oracle了。没想到没搂住,11G又搞了10年。12C后因为不怎么做一线运维了,所以就没怎么关注了。

前几天群里朋友在讨论PG WAL写入存在性能问题的时候。群里有个朋友就问,难道PG这么土,不支持多个WALWRITER并发写吗?我当时想都没想就说,Oracle也不支持啊,早期Oracle支持过LGWR SLAVER,不过因为BUG太多,没什么人用,到12C以后,好像就没有SLAVER这码子事儿了。当时那个朋友就蒙圈了,Oracle咋能不支持多个LGWR并发写呢?事后我问了问同事,他们说好像你记错了,12C之后Oracle所有的SLAVER都被统一改成WORKER了。在12C里LGWR worker是自动开启的。

昨天正好有点空,我找了一些关于12C LGWR worker的资料看了看。在公司的测试环境上也找了一套19.15的环境检查了一下。发现还真如同事所说,12C开始,Oracle已经自动开启LGWR并发写了。在12C里增加了LGnn进程,用于实际写入REDO数据,LGWR完全不管写Redo Log文件的事情,只负责发布一些和REDO落盘的消息了。

目前我看的关于LGWR worker的资料不多,从一些资料和我对LGWR的理解,LGWR worker应该是和Oracle Redo Strand有关的。Oracle的LGWR worker都是分配到GROUP的,GROUP的数量如果是和Redo public Strand相关,那么每个group就之间就不需要通过锁机制来同步写入工作。LGWR 也不需要在多个worker之间做协同,而仅仅需要做和消息公告相关的共组了,这种机制应该是最为高效的。如果多个worker之间写REDO文件还需要闩锁来做串行化,那么效率肯定是不会好的。

Redo Strand从Oracle 11开始就已经被用来加速REDO性能了,Strand的目的是为了提高并发写入Redo Log buffer和Redo Log文件时候的性能,减少因为串行化闩锁等待导致的REDO性能问题。Oracle会根据CPU_COUNT的值,自动的调整Redo srand的数量。

Oracle会根据CPU_COUNT/16来设定Strand的数量,在LOG BUFFER中会按照Strand数量划分为N个子池,写入REDO数据的时候,可以并发的写入不同的STRAND,这样可以减少高并发LOG BUFFER写入的性能。为了确保这一机制起作用,在Redo Log文件中,也是按照Strand的方式分配Redo Log文件,这种模式可以让Redo Log文件的写入也可以高速并发。Redo Strand为12C的LGWR worker称为默认开启的功能打下了一个良好的基础。

我这个环境的CPU_COUNT是16,而每个实例的Redo Strand最小值是2,因此启动实例的时候也启动了2个LGWR worker,这说明数据库实例有两个LGWR worker group,当系统空闲,没有什么需要写入的REDO数据的时候,LGnn都在等待空闲等待事件LGWR worker group idle,而lgwr进程在等待rdbms ipc message。

通过strace看lgwr,也只是在做一些信号量方面的操作。我们再来看看空闲时的LGnn。

也是在相同的信号量上休眠。

可以看出LGWR的等待事件发生了变化,而LGnn的等待事件也和以前的LGWR十分类似。从等待事件上看,当一个worker完成工作后,会处于Ordering等待,等待获取另外的写任务。在具体实现算法上,还并没有和我想象的一样不需要调度。我们再来TRACE一下LGWR。

可以看出LGWR还是十分频繁的在操作那个信号量,这很可能是LGWR在积极参与日志写的调度协调。

从worker的行为上也看到了和LGWR之间的互动。这说明Oracle并发日志写还是需要多进程之间的同步行为,不是完全自主的无阻塞的。因此在某些场景下,可能会导致当WORKER数量过多时,引发Log file parallel write的等待时间过长,从而引起LOG FILE SYNC的增加,影响数据库的性能。

当年Oracle的REDO STRAND成为默认开启的时候,也出现过类似的问题,因为STRANDS数量时和CPU_COUNT相关的。十多年前在Oracle 11g上就有人发现了当CPU数量很多的时候,log file sync会莫名其妙的变坏。

当时的建议时通过_log_parallelism_max参数来减少Strand的数量,解决过多的Strand带来的性能问题。对于LGWR worker机制,Oracle也提供了一个类似的参数来进行控制,这个参数就是“_max_log_write_parallelism”。

在Oracle 12C或者以后版本中,也经常会出现因为LGWR worker导致的性能问题。Oracle可以通过“_use_single_log_writer”参数来进行调整。默认情况下这个参数的值时ADAPTIVE,这意味着Oracle会自己根据工作负载来选择工作模式。如果遇到这方面的性能问题的时候,可以将这个参数设置为TRUE,强制使用单个LGWR,也就是恢复以前的工作模式。如果你发现你的数据库从11G升级到12C之后,log file sync变坏了,从而导致了一些性能问题,你可以考虑调整这个参数。

数据库的应用场景十分复杂,我们享受某些应用场景受益于一个新技术的时候,难免会引发一些新的问题,某些场景可能和新技术的适应性不够好。另外加上一些新技术刚刚开始使用时,对某些特殊场景的算法不够优化,也会引发一些问题。我想,随着今后Oracle数据库版本的迭代,LGWR worker的机制也会越来越成熟。

实际上我看到一些国产数据库现在也在考虑使用多个WAL WRITER提升高并发WAL写入的性能,从而更为充分的利用SSD等现代硬件。不过WAL写入对于延时十分敏感,算法写不好,就容易引发更为严重的闩锁串行问题。Oracle的Redo Strand与LGWR worker相结合的机制应该是目前最值得借鉴的方法了。如果不针对WAL BUFFER做Strand分区,那么多个WAL WRITER的并发控制的成本会更高。

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/253032.html<

(0)
运维的头像运维
上一篇2025-04-29 17:24
下一篇 2025-04-29 17:26

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注