聊聊人大金仓KES数据库的可观测性能力

​和人大金仓数据库的第一次接触是2014年某省的省调要把Oracle数据库去掉,换成人大金仓数据库。当时省调自动化处的处长十分忧虑,认为调度这么复杂并且关键的系统,用Oracle还算比较省心,换了国产数据库,会不会今后都没有好日子过了。2016年,全国产方案的调控云在他那儿成功上线,这也确实让我这个Oracle DBA感到有些意外。在此期间,我们的优化团队也参与了一些基于金仓数据库的优化工作,第一次接触了这个国产数据库。说实在的,这次优化虽然按用户的需求完成了任务,不过也让我们感到了国产数据库与Oracle的技术差距。因为我们团队缺乏对金仓数据库的了解,并且当时能够获得的文档也十分有限,而人大金仓数据库能够对外提供的可观测性接口也十分有限,也没有我们在Oracle数据库上习惯使用的AWR报告,ASH报告,等待事件分析等功能。因此我们不知道如何去更好的调优金仓数据库,使之与用户的应用更为融合,优化主要主要集中在和开发商一起对慢SQL的优化上,对于其他的问题,我们是无能为力的。

转眼六、七年过去了,在此期间也或多或少的和金仓数据库打交道,不过并不深入,干的主要的活还是和开发商一起优化SQL。随着信创工作的开展,有不少客户都选择了金仓数据库替代Oracle,于是针对金仓的运维与运维工具的需求多了起来,因此我们的数据库运维工具D-SMART与金仓KES的对接也日益急迫。

作为一款深度运维工具,D-SMART要覆盖健康监控、故障预警、问题诊断、定期巡检、专项审计等诸多自动化运维功能,想要在KES完成这些自动化工具,KES本身能够提供的可观测性接口就十分关键。有些国产、开源数据库因为可观测性接口过于简单,导致D-SMART对其的支持能力很难提升。

再次和人大金仓结缘,KES的版本已经是V8了,令人高兴的是,KES的官方文档比起六、七年前有了较大的提升。丰富的文档为我们梳理KES的运维知识提供了很大的便利,我和几个KES的老用户交流的时候,他们也觉得V8版本在文档上的提高还是挺大的,这些文档对他们日常运维也很有帮助。

在可观测性方面,KES V8也有了很大的提升。这一点我们可以从KWR报告的内容上看得出来。KWR是模仿Oracle AWR的一个性能分析报告。AWR是DBA运维Oracle数据库不可或缺的工具,因此很多国产数据库也都提供类似AWR的功能,也有一些朋友为MYSQL/PG等开源数据库也提供了类似的报告。只不过这些报告大多数是照猫画虎,只学了Oracle AWR的形,而没有得到AWR的神。数据不够丰富与有效导致了这些类AWR报告实际上对运维的作用有限。

KWR报告的基本内容还是全面致敬Oracle AWR报告的,负载文件、重要百分比、操作系统、IO,时间模型、TOP SQL、数据库状态统计等一应俱全。不过大多数国产数据库的类AWR报告也包含这些内容。我们还需要进一步观察其实际内容。

从TOP WAIT EVENTS上我们看到了最想看到的AVG Times指标,在很多国产数据库上我们也能看到等待事件,但是我们仅能看到等待事件的次数统计,无法了解到等待事件的等待时长信息。等待次数只能让我们感受到数据库的并发方面的等待,并不能告诉我们哪些等待事件存在问题。比如说WALWriteLock等待,我们知道在报告期间一共产生了98103次,但是如果仅仅知道等待次数,我们是无法确定WAL写入是否存在性能问题的。但是如果我们看到了平均等待时间是20.94毫秒,那么我们基本上可以确定当前系统肯定是存在问题了。

发现了日志写存在问题,那么我们就可以从Host IO这一章节去做进一步分析了,在这里我们明显看出了写IO延时存在问题,要远远高于读IO的延时。在数据库的可观测性接口上能够提供等待时长,是DBA最希望的。除此之外,KES V8还提供了一个类似于Oracle ASH的KSH,将sys_stat_activity中的采样定期刷新到数据表中。这对于DBA分析故障,定位性能问题提供了很有效的能力。

KES V8的等待事件等待时长是采集到sys_stat_sqlwait系统视图中的。其采集粒度细化到queryid,我们可以根据userid,datid,queryid,wait_event等粒度来进行汇总分析。同时可以通过bgwait标识位来排除后台进程产生的等待。通过统计数据CALLS/TIMES这对组合可以计算平均等待时间。这种设计虽然在采集与存储这些数据上会消耗一些性能,但是对于大多数应用场景来说,影响并不大,与这些数据带来的运维方面的能力提升相比,这点性能损耗完全能够接受。当然在一些高并发,低延时SQL为主,对响应时间有严格要求的场景,这方面的性能损失可能无法接受,可以通过参数关闭这方面的数据采集。

我们可以通过汇总这张表的数据获得等待事件的平均等待时间,也可以按照QUERYID来统计该数据,从而发现不同SQL语句的buffer_content方面的差异。

这些SQL产生的热块冲突明显是比较严重的,我们可以加以关注。

这几个数据库的数据文件读的平均等待时间明显存在差异,这也是我们今后可以深入分析的数据。如果我们定期采样这个视图,并在监控系统中保存起来,今后我们就可以通过两个采样点之间的DELTA值计算某个时间段内的等待事件的平均等待时间。在KWR的采样数据中,就已经保存了这些数据。如果我们设置了定期采样KWR,就可以通过这些数据来做较为粗略的分析。如果你开启了KWR功能,并且做了定期采样,那么数据将会被保存在perf.kwr_snap_sql_wait 表中。

KES V8提供的SYS_STAT_SQLWAIT给运维人员提供了十分有价值的数据,可以用于对数据库、SQL以及整体性能提供强大的分析能力。利用KES V8提供的可观测性接口,D-SMART构建了数据库运行质量监控方面的基础能力。

在健康模型中,我们能够针对KES 数据库构建类似Oracle数据库一样的数据库IO相关的指标模型。

我们不仅能够了解数据库的IO负载情况,也能了解数据库的IO质量,从而更为准确的掌握数据库的状态,找到数据库运行中的短板。

数据库等待事件分析工具也因为有了平均等待时间而可以更为准确的定位数据库中等待事件存在的问题,从而为DBA支持问题定位的方向。

利用专门为KES等待事件构建的运维知识图谱,智能分析算法可以很准确的定位到,当前数据库存在的主要问题集中在并发上,次要问题集中在IO性能上。

在构建KES运维知识图谱的时候,我们除了利用了以往运维与优化KES的知识积累外,最重要的依据就是人大金仓官方提供的各种手册。只有少数几个可观测性接口是通过咨询金仓的售后服务人员后才搞明白的。从一点上可以看出目前金仓KES的文档资料还是相对丰富的。在文档方面,金仓数据库虽然与Oracle数据库还有一定的差距,不过在国产数据库中已经处于中上水平。

对比这些年与金仓KES的两次深度接触,也感受到了国产数据库在不断的进步。国产数据库虽然想要赶超Oracle还比较困难,但是我们的国产数据库的不断成长,对于企业的大部分应用场景的支持与覆盖已经不成问题。我们必须给国产数据库足够的理解与支持,他们才能够在我们的应用需求的推动下,慢慢的从不好用变得能用,再变得好用,国产数据库的成长离不开广大用户的理解与支持。​

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/286145.html<

(0)
运维的头像运维
上一篇2025-05-15 05:27
下一篇 2025-05-15 05:28

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注